从技术上讲,代表性样本只需要任何百分比统计人口必须尽可能近距离复制所研究或分析的质量或特征。例如,在1,000人的人口中,由600名男性和400名女性组成,用于分析性别的购买趋势,代表样本只有5名成员,三名男性和2名女性,占人口的0.5%。但是,尽管该样本名义上代表了较大的人群,但可能会导致高度采样错误当推断较大的人口时,因为它很小。
采样误差是使用样品分析较大组的不可避免的结果。从中获取数据是一个过程,其本质是有限和不完整的。但是,由于资源的可用性有限,因此通常有必要使用,因此经济分析师采用可以将采样错误减少到统计上可忽略不计的方法。虽然代表性抽样是用于减少错误的最有效方法之一,但通常不足以自行进行足够的操作。
一种与代表性抽样结合使用的策略是确保样品足够大以最佳减少误差。尽管总体而言,子组越大,但在某个点,误差的可能性就越大,降低的可能性就越大,但降低变得如此最小,以至于它不能证明使样本更大所需的额外费用是合理的。
正如使用技术代表性但微小样本不足以自行减少采样错误一样,仅选择大组而不考虑代表性的情况可能会导致比使用小型代表性样本更具缺陷的结果。返回上面的示例,在分析购买趋势的性别差异时,一组600名男性在统计上是毫无用处的。
令人惊讶的是,当使用随机采样时,采样分数与结果的误差无关。误差的主要决定因素是绝对样本量,而不是相对于种群大小的样本量。