什麼是抽樣分佈?
抽樣分佈是統計中使用的概念。是一個概率分佈從從特定人群中得出的大量樣本獲得的統計量。給定種群的抽樣分佈是一系列不同結果的頻率分佈人口。這使政府和企業這樣的實體可以根據收集的信息做出更明智的決策。研究人員使用的採樣分佈有幾種方法,包括平均值的採樣分佈。
關鍵要點
- 抽樣分佈是通過重複對特定人群的重複採樣獲得的統計量的概率分佈。
- 它描述了統計量的一系列可能結果,例如人口的某些變量的均值或模式。
- 研究人員分析的大多數數據實際上是樣本,而不是人群。
採樣分佈如何工作
數據允許統計學家,研究人員,營銷人員,分析師和學者就特定主題和信息得出重要的結論。它可以幫助企業對自己的未來做出決定並提高其績效,或者可以幫助政府計劃一群人需要的服務。
大量繪製和使用的數據實際上是樣本而不是人群。樣本是人口的子集。簡而言之,樣本是較大組的較小部分。因此,這一較小的部分旨在代表整個人口。
抽樣分佈(或數據分佈)是確定事件或某些結果是否會發生的統計指標。該分佈取決於一些不同的因素,包括樣本量,涉及的抽樣過程以及人口整體。採樣分佈涉及幾個步驟。其中包括:
- 從總體中選擇一個隨機樣本
- 確定該組的某個統計數據,這可能是標準偏差,中間或卑鄙
- 建立每個樣品的頻率分佈
- 繪製圖表上的分佈
收集,繪製和分析的信息後,研究人員可以做出推斷和結論。這可以幫助他們決定將來的期望。例如,政府可能能夠投資基礎設施根據某個社區或公司的需求,如果採樣分銷表明有積極的結果,則可以決定從事新的商業企業。
重要的
每個樣品都有自己的樣本平均值,樣品平均值的分佈稱為樣本分佈。
特殊考慮
人群中的觀察數,樣本中的觀察數以及用於繪製樣品集的過程確定了採樣分佈的可變性。抽樣分佈的標準偏差稱為標準錯誤。
雖然抽樣分佈的平均值等於人口的平均值,但標準誤差取決於人口的標準偏差,人口的大小和样本的大小。
知道每個樣本集的平均值如何分開,彼此之間的平均值以及人口平均值將表明樣本平均值與人口平均值有多近。隨著樣本量的增加,採樣分佈的標準誤差會減小。
確定採樣分佈
假設醫學研究人員希望將1995年至2005年在北美出生的所有嬰兒的平均體重與在同一時期內從南美的平均體重進行比較。由於他們無法在合理的時間內為整個人群繪製數據,因此他們只會在每個大陸上使用100個嬰兒來得出結論。所使用的數據是樣本,平均重量是樣本意思是。
現在假設他們從一般人群中重複進行隨機樣本,併計算每個樣本組的樣本均值。因此,對於北美,他們將在美國,加拿大和墨西哥記錄的100個新生重量的數據提取如下:
- 來自美國精選醫院的4個100個樣本
- 來自加拿大的五個70個樣本
- 來自墨西哥的三個150張唱片
研究人員最終以12套組合的1200個新生嬰兒重量。他們還從南美12個國家 /地區收集了100個出生權重的樣本數據。
每個樣品集計算的平均權重是平均值的採樣分佈。不僅可以從樣本中計算平均值。其他統計數據,例如標準偏差,方差,比例和範圍可以是從樣本數據計算。標準偏差和方差測量採樣分佈的變異性。
採樣分佈的類型
這是對採樣分佈類型的簡要說明:
- 平均抽樣分佈:該方法顯示了一個正態分佈,其中中間是採樣分佈的平均值。因此,它代表了整體人口的平均值。為了達到這一點,研究人員必須找出每個樣本組的平均值並繪製單個數據。
- 比例的採樣分佈:該方法涉及從總體中選擇樣本集以獲取樣本的比例。比例的平均值最終成為較大群體的比例。
- T分佈:在樣本量較小的情況下,這種採樣分佈很常見。當有關整個人群的信息很少時,也可以使用它。 T分佈用於對平均值和其他統計點進行估算。
繪製採樣分佈
人口或一組數字集將具有正態分佈。但是,由於抽樣分佈包括多組觀測值,因此不一定會有鐘形形狀。
按照我們的示例,北美和南美嬰兒的人口平均體重是正常的,因為有些嬰兒會體重不足(平均值低於平均值)或超重(高於平均值),大多數嬰兒介於兩者之間(平均值)。如果北美新生兒的平均體重為7磅,那麼記錄的北美12個樣本觀測值中每一套的樣本平均體重也將接近7磅。
但是,如果在1,200個樣本組中的每個樣本組中的每個平均值中繪製了每個平均值,則結果形狀可能會導致均勻分佈,但是很難確定地預測實際形狀的結果是什麼。研究人員從一百萬個重量數字中使用的樣本越多,圖形就越會開始形成正態分佈。
為什麼採樣用於收集人口數據?
抽樣是收集和分析有關大組信息的一種方式。之所以這樣做,是因為研究人員由於所涉及的受試者數量而無法研究整個人群。因此,並非較大組中的每個人都可以包括在研究和分析數據可能需要的時間太長。它允許政府和企業等實體就未來做出重要決定,無論這意味著要投資基礎設施項目,社會服務計劃還是新產品。
為什麼使用採樣分佈?
抽樣分佈用於統計和研究。他們強調了可能發生的事件的機會或概率。這是基於一組數據,這些數據是從較大人群中的一小組中收集的。
是什麼意思?
平均值是統計和研究中使用的度量。這是至少兩個數字的平均值。平均值可以通過添加所有數字並將結果除以該集合中的數字數來確定。這被稱為算術平均值。您可以通過乘以數據集的值並將總和等於該數據集中的值數量的根來確定幾何平均值。
底線
由於涉及的受試者的數量,研究人員無法就非常大的群體得出結論。這就是為什麼他們使用採樣。抽樣使他們可以從大量人群中奪取一小組並分析數據。一旦收集了數據,研究人員就可以繪製抽樣分佈,這使他們能夠確定事件是否可以在某個人群中發生。這可能包括業務增長或人口趨勢,這些趨勢可以幫助企業,政府和其他實體為未來做出更好的決定。