什么是抽样分布?
抽样分布是统计中使用的概念。是一个概率分布从从特定人群中得出的大量样本获得的统计量。给定种群的抽样分布是一系列不同结果的频率分布人口。这使政府和企业这样的实体可以根据收集的信息做出更明智的决策。研究人员使用的采样分布有几种方法,包括平均值的采样分布。
关键要点
- 抽样分布是通过重复对特定人群的重复采样获得的统计量的概率分布。
- 它描述了统计量的一系列可能结果,例如人口的某些变量的均值或模式。
- 研究人员分析的大多数数据实际上是样本,而不是人群。
采样分布如何工作
数据允许统计学家,研究人员,营销人员,分析师和学者就特定主题和信息得出重要的结论。它可以帮助企业对自己的未来做出决定并提高其绩效,或者可以帮助政府计划一群人需要的服务。
大量绘制和使用的数据实际上是样本而不是人群。样本是人口的子集。简而言之,样本是较大组的较小部分。因此,这一较小的部分旨在代表整个人口。
抽样分布(或数据分布)是确定事件或某些结果是否会发生的统计指标。该分布取决于一些不同的因素,包括样本量,涉及的抽样过程以及人口整体。采样分布涉及几个步骤。其中包括:
- 从总体中选择一个随机样本
- 确定该组的某个统计数据,这可能是标准偏差,中间或卑鄙
- 建立每个样品的频率分布
- 绘制图表上的分布
收集,绘制和分析的信息后,研究人员可以做出推断和结论。这可以帮助他们决定将来的期望。例如,政府可能能够投资基础设施根据某个社区或公司的需求,如果采样分销表明有积极的结果,则可以决定从事新的商业企业。
重要的
每个样品都有自己的样本平均值,样品平均值的分布称为样本分布。
特殊考虑
人群中的观察数,样本中的观察数以及用于绘制样品集的过程确定了采样分布的可变性。抽样分布的标准偏差称为标准错误。
虽然抽样分布的平均值等于人口的平均值,但标准误差取决于人口的标准偏差,人口的大小和样本的大小。
知道每个样本集的平均值如何分开,彼此之间的平均值以及人口平均值将表明样本平均值与人口平均值有多近。随着样本量的增加,采样分布的标准误差会减小。
确定采样分布
假设医学研究人员希望将1995年至2005年在北美出生的所有婴儿的平均体重与在同一时期内从南美的平均体重进行比较。由于他们无法在合理的时间内为整个人群绘制数据,因此他们只会在每个大陆上使用100个婴儿来得出结论。所使用的数据是样本,平均重量是样本意思是。
现在假设他们从一般人群中重复进行随机样本,并计算每个样本组的样本均值。因此,对于北美,他们将在美国,加拿大和墨西哥记录的100个新生重量的数据提取如下:
- 来自美国精选医院的4个100个样本
- 来自加拿大的五个70个样本
- 来自墨西哥的三个150张唱片
研究人员最终以12套组合的1200个新生婴儿重量。他们还从南美12个国家 /地区收集了100个出生权重的样本数据。
每个样品集计算的平均权重是平均值的采样分布。不仅可以从样本中计算平均值。其他统计数据,例如标准偏差,方差,比例和范围可以是从样本数据计算。标准偏差和方差测量采样分布的变异性。
采样分布的类型
这是对采样分布类型的简要说明:
- 平均抽样分布:该方法显示了一个正态分布,其中中间是采样分布的平均值。因此,它代表了整体人口的平均值。为了达到这一点,研究人员必须找出每个样本组的平均值并绘制单个数据。
- 比例的采样分布:该方法涉及从总体中选择样本集以获取样本的比例。比例的平均值最终成为较大群体的比例。
- T分布:在样本量较小的情况下,这种采样分布很常见。当有关整个人群的信息很少时,也可以使用它。 T分布用于对平均值和其他统计点进行估算。
绘制采样分布
人口或一组数字集将具有正态分布。但是,由于抽样分布包括多组观测值,因此不一定会有钟形形状。
按照我们的示例,北美和南美婴儿的人口平均体重是正常的,因为有些婴儿会体重不足(平均值低于平均值)或超重(高于平均值),大多数婴儿介于两者之间(平均值)。如果北美新生儿的平均体重为7磅,那么记录的北美12个样本观测值中每一套的样本平均体重也将接近7磅。
但是,如果在1,200个样本组中的每个样本组中的每个平均值中绘制了每个平均值,则结果形状可能会导致均匀分布,但是很难确定地预测实际形状的结果是什么。研究人员从一百万个重量数字中使用的样本越多,图形就越会开始形成正态分布。
为什么采样用于收集人口数据?
抽样是收集和分析有关大组信息的一种方式。之所以这样做,是因为研究人员由于所涉及的受试者数量而无法研究整个人群。因此,并非较大组中的每个人都可以包括在研究和分析数据可能需要的时间太长。它允许政府和企业等实体就未来做出重要决定,无论这意味着要投资基础设施项目,社会服务计划还是新产品。
为什么使用采样分布?
抽样分布用于统计和研究。他们强调了可能发生的事件的机会或概率。这是基于一组数据,这些数据是从较大人群中的一小组中收集的。
是什么意思?
平均值是统计和研究中使用的度量。这是至少两个数字的平均值。平均值可以通过添加所有数字并将结果除以该集合中的数字数来确定。这被称为算术平均值。您可以通过乘以数据集的值并将总和等于该数据集中的值数量的根来确定几何平均值。
底线
由于涉及的受试者的数量,研究人员无法就非常大的群体得出结论。这就是为什么他们使用采样。抽样使他们可以从大量人群中夺取一小组并分析数据。一旦收集了数据,研究人员就可以绘制抽样分布,这使他们能够确定事件是否可以在某个人群中发生。这可能包括业务增长或人口趋势,这些趋势可以帮助企业,政府和其他实体为未来做出更好的决定。