什麼是分層隨機抽樣?
分層的隨機抽樣涉及將人口分為較小的亞組,稱為地層。基於成員在分層隨機抽樣或分層(例如收入或教育程度)中的共同屬性或特徵形成地層。
分層的隨機抽樣具有許多應用和好處,包括研究人群人群和預期壽命。它也稱為比例隨機抽樣或配額隨機抽樣。
關鍵要點
- 抽樣涉及使用人口子集進行的統計推斷。
- 人口分為組,共享稱為地層的特徵,用於分層隨機抽樣。
- 比例分層的隨機抽樣涉及從分層組中以與人群成比例的方式獲取隨機樣品。
- 這些地層與他們在人群中的發生不成比例的採樣不成比例。
- 分層隨機抽樣不同於簡單的隨機抽樣,涉及從整個人群中隨機選擇數據。
Investopedia / Xiaojie Liu
分層隨機抽樣的工作方式
研究人員可能會發現,在開始對具有相似特徵的實體進行分析時,人口規模太大而無法完成研究。他們可能會從總體人口中選擇一小組,以節省時間和金錢,並使研究更加可行。這被稱為抽樣。
小組被稱為樣本量這是用於代表整個人群的人口的一個子集。可以從許多方面從人群中選擇樣本。一種是分層的隨機抽樣方法。
分層的隨機抽樣涉及將整個人口分為稱為層的層,層的層。然後從每個層中選擇隨機樣本,以分析與每個人口組相關的不同經驗或結果。
重要的
分層抽樣用於突出人群中的群體之間的差異。這與簡單的隨機抽樣不同,後者將人口的所有成員視為相等的,並具有同等的抽樣可能性。
考慮一個學術研究員,他想知道在畢業後三個月內獲得特定畢業年度的MBA學生人數。研究人員會發現,當年有近200,000 MBA畢業生。他們可以對50,000名畢業生進行簡單的隨機樣本並進行調查。他們可以將人口分為階層,並從階層進行隨機樣本,以了解更多信息。
他們將根據性別,年齡範圍,種族,國籍國家和職業背景創建人口群體。與種群相比,每個層中的隨機樣本與層的大小成正比進行。然後,將匯總這些地層的這些子集,以形成一個隨機樣本,研究人員將分析畢業後接受工作報價的組的差異。
簡單與分層隨機樣品
簡單的隨機樣品分層的隨機樣品都是統計測量工具。一個簡單的隨機樣本用於表示整個數據總體。根據共享特徵,分層的隨機樣本將種群分為較小的群體或地層。分層抽樣比簡化的隨機抽樣更為複雜,耗時,並且可能更昂貴。
通常使用簡單的隨機樣品:
- 關於數據人群的信息很少。
- 數據人群的差異太多,無法分為乾淨的子集。
- 數據人群中只有一個獨特的特徵。
糖果公司可能想研究其客戶的購買習慣,以確定其產品線的未來。如果有10,000個客戶,該公司可能會選擇100個客戶作為隨機樣本。然後,它可以將從這100個客戶發現的東西應用於其餘的基礎。
這100個客戶將根據年齡,收入或其他分層隨機抽樣的特徵將其分為階層。但是,每個階層中都不會有很多人只有100人,否則地層之間可能沒有太多差異。在這種情況下,使用簡單的隨機抽樣將更有意義,而在不定義其個體特徵的情況下純粹是隨機的100個成員。
按比例與不成比例的分層
分層的隨機抽樣可確保在研究研究的整個樣本人群中充分錶示給定種群的每個亞組。分層可能是比例的或不成比例的。
每個層的樣本大小與層的種群大小成比例,分層成比例。這種類型的分層隨機抽樣通常更精確公制因為這是對整體人口的更好代表。
假設研究人員正在研究180,000人的人口,並希望使用使用年齡範圍分層的50,000個樣本。研究人員將使用該公式:
比例分層隨機樣品=(樣本量 /人口大小)×層尺寸
年齡段 | 24–28 | 29–33 | 34–37 | 全部的 |
---|---|---|---|---|
階層中的人數 | 90,000 | 60,000 | 30,000 | 180,000 |
地層樣本量 | 25,000 | 16,667 | 8,333 | 50,000 |
24至28歲的年齡範圍內的地層樣本量計算為:
(50,000/180,000)×90,000 = 25,000
其他年齡段組也使用了相同的方法。現在,研究人員可以在每個階層進行簡單的隨機抽樣,以選擇他們的調查參與者,因為階層樣本量已知:25,000名24至28歲的人將從整個人群中隨機選擇,16,667名29至33歲的人群和8,333名34歲至37歲的人。
每個層的大小與不相同的分層樣本中的種群中的大小成正比。研究人員可能會決定在34至37歲年齡段的畢業生和29至33歲年齡段的畢業生中進行樣本。
一個人不能融入多個階層。每個實體只能包含在一個層中。重疊的亞組意味著有些人將有更高的選擇進行調查,這將否定了分層抽樣作為一種概率採樣的概念。
快速事實
投資組合經理可以使用分層隨機採樣來通過複製索引(例如債券索引)來創建投資組合。
分層隨機抽樣的優點
分層隨機抽樣的主要優點是它捕獲了關鍵的人口特徵。這種採樣方法在樣本中產生特徵,與類似於A的總體成正比加權平均值。分層的隨機抽樣適用於具有多種屬性的種群,可以形成子組。
分層給出較小的估計錯誤比簡單的隨機抽樣方法更高。地層之間的差異越大,精度的增益就越大。
分層隨機抽樣的缺點
不幸的是,這種研究方法不能在每項研究中使用。研究人員必須能夠確定正在研究的人群中的每個成員。他們必須將它們分為一個且僅一個亞群。如果研究人員無法將每個人群的每個成員分類為子組,則無法使用分層的隨機抽樣。如果整個列表的確定列表,這可能特別困難人口不可用。
如果有一些受試者屬於多個子組,那麼重疊可能是一個問題。當執行簡單的隨機抽樣時,更有可能選擇在多個子組中的人。結果可能是對人口的陳述錯誤或不准確的反映。如果排序過程太難,則分層的隨機抽樣將無效。
分層隨機抽樣的示例
假設研究小組希望確定美國大學生的平均成績(GPA)。團隊很難從所有2100萬大學生那裡收集數據,並決定使用4,000名學生進行隨機樣本。
該團隊著眼於樣本參與者的不同屬性,並想知道GPA相對於學生專業的GPA是否有任何差異。假設它發現560名學生是英語專業,有1,135名是科學專業,800名是計算機科學專業,1,090名是工程專業的專業,而415名是數學專業。該團隊希望使用比例分層的隨機樣本,其中樣本的層與人群中的隨機樣本成正比。
現在假設團隊研究人口統計在美國的大學生中,有12%的英語專業,28%的科學專業,24%的計算機科學專業,21%的工程專業和數學專業的專業。通過分層隨機抽樣過程創建五個層。
然後,團隊必須確認人口層與樣本中的層成正比。他們發現比例並不相等。該團隊將不得不從人口中重新樣本4,000名學生,並隨機選擇480英語,1,120個科學,960個計算機科學,840個工程學和600名數學學生。
研究小組與這些小組的大學生進行了比例分層的隨機樣本。它提供了更好地表示美國學生學院專業的研究人員,然後研究人員可以強調特定的階層,並使用有關學生專業的添加信息調查GPA。
我什麼時候使用分層的隨機抽樣?
當研究人員想根據所研究的整個人群了解不同的亞組或階層時,經常使用分層的隨機抽樣。研究人員可能希望根據種族,性別或教育的差異來探索群體的成果。
哪種抽樣方法最好?
最佳抽樣方法將取決於分析的性質和所使用的數據。簡單的隨機抽樣通常是最簡單,最便宜的,但是分層抽樣可以與正在研究的人群相比產生更準確的樣本。
兩種類型的分層隨機抽樣是什麼?
分層隨機抽樣的主要類型:比例和不成比例。比例的採樣將每個層與層的種群大小成比例。分析人員將根據研究問題或研究設計的樣本過度或以下某些層次進行過度樣本。
如何選擇地層進行分層隨機抽樣?
地層將取決於您感興趣的子組出現在您的人群中。這些亞組基於性別,種族,教育程度,地理位置或年齡段等參與者之間的共同特徵。
底線
分層隨機抽樣是根據年齡,性別,收入水平或教育等各種因素在數據集中創建子組的過程。然後從每個地層中取出一個隨機樣本,使研究人員可以從各個亞組中獲取樣品,包括可能不足的子組。
分層的隨機樣本可以以這種方式提供更全面的數據集的圖片。但是,在所有研究中都無法使用這種方法,但是,根據人口或樣本量,有關人群的可用信息水平以及可用的時間和資源。分層隨機抽樣的好處是,與簡單的抽樣方法相比,它允許總體對總體的更精確和細微的表示。