什麼是系統抽樣?
系統抽樣是一種概率採樣根據隨機起點但具有固定的周期性間隔選擇來自較大人群的樣本的方法。通過將種群大小除以所需的樣本量來計算此抽樣間隔。
關鍵要點
- 系統抽樣是從較大的人群中選擇具有固定週期間隔的較大人群的隨機樣本時。
- 固定的周期間隔(稱為採樣間隔)是通過將種群大小除以所需的樣本量來計算的。
- 這種方法的優點包括消除聚類選擇的現象和污染數據的概率低。
- 缺點包括特定模式的代表性過多或代表性不足以及更大的數據操縱風險。
- 系統樣本的主要類型有三種:隨機系統樣本,線性系統樣本和循環系統樣品。
Investopedia / Like Riaz
了解系統的抽樣
當正確地對大量大小的人口正確執行時,系統的採樣可以幫助研究人員,包括行銷和銷售專業人員,在一大批人中獲得代表性發現,而無需與每個人接觸。
自從簡單的隨機抽樣人口的效率可能降低且耗時,統計學家轉到其他方法,例如係統採樣。可以通過系統方法選擇樣本量可以快速完成。一旦確定了固定的起點,就會選擇恆定間隔以促進參與者的選擇。
當數據操縱風險較低時,系統採樣比簡單的隨機抽樣更可取。如果當研究人員可以操縱間隔長度以獲得所需結果時,這種風險很高,那麼簡單的隨機抽樣技術將更合適。
由於其簡單性,系統的抽樣對研究人員和分析師很受歡迎。研究人員通常認為結果代表了最正常的人群除非隨機特徵不成比例地存在於每個n個數據樣本(不太可能)。換句話說,人群需要與所選的指標一起表現出自然的隨機性。如果人口具有標準化模式,那麼意外選擇非常常見案例的風險將更加明顯。
在系統抽樣中,與其他抽樣方法一樣,必須在選擇參與者之前選擇目標群體。可以根據適合進行研究目的的任何數量的所需特徵來識別人群。一些選擇標準可能包括年齡,性別,種族,位置,教育水平或職業。
重要的
有幾種方法可以對人群進行統計推斷。系統抽樣是隨機抽樣的一種形式。
何時使用系統抽樣
最適合系統的採樣的情況是,當研究人群表現出一定程度的秩序或規律性時。例如,如果您要調查進入商店的客戶,系統的採樣使您可以系統地選擇每個n客戶,從而確保在一天中或一周的不同時間內表示。這種方法有助於避免僅選擇在特定時期內到達的客戶而產生的偏見。
系統抽樣可以很好地工作的另一種情況是,當人口大小是已知且相對較大的情況下。系統的抽樣無需列出和隨機從整個人群中選擇個體,而是通過在設定的節奏下選擇樣本來簡化過程。這在時間和資源有限的大規模研究中特別有用,這意味著您無需花費大量的能源計劃。
當研究人員想要確保樣本均勻分佈在整個人群中時,可以使用系統的抽樣。例如,公司可以從姓氏過濾的公司目錄中選擇每個n人。其他形式的抽樣可能會意外聚類相似的人群(即,根據樣本的匯總方式選擇了來自財務的人太多)。
此外,與其他採樣方法相比,系統抽樣提供了簡單性和易於實現的優勢。它需要最小的計算,並且可以輕鬆地使用簡單算法,尤其是在已知目標樣本量和總人口規模的情況下。
創建系統樣本的步驟
您可以使用以下步驟創建系統示例:
- 定義您的人口: 這是您採樣的組。
- 定居: 您想要/需要多少受試者從人群中採樣?
- 分配每個人口成員一個數字:如果您要看的小組包括10,000人,請開始排隊並給他們數字。
- 確定抽樣間隔: 這可以通過將人口規模除以所需的樣本量來實現。
- 選擇一個起點: 這可以通過選擇一個隨機數來完成。
- 確定樣本的成員: 如果您的起點為15,樣本間隔為100,則樣品的第一個成員為115,依此類推。
系統抽樣的示例
作為系統抽樣的假設例子,假設在10,000人的人群中,統計學家選擇每100人進行抽樣。抽樣間隔也可能是系統的,例如選擇一個新樣本每12小時繪製。
作為另一個例子,如果您想使用系統抽樣從50,000人口中選擇一組1,000人,則所有潛在的參與者都必須放在列表中,並且將選擇一個起點。一旦形成列表,列表中的每50人(從選定的起點開始計數)將被選為參與者,因為50,000÷1,000 = 50。
例如,如果選定的起點為20,則將選擇列表中的第60人,然後選擇120人,依此類推。一旦達到列表的結束,如果需要其他參與者,則計數循環到列表的開頭完成計數。
快速事實
要進行系統的抽樣,您必須首先知道目標人群的大小。
系統抽樣的類型
通常,有三種方法可以生成系統樣本:系統的隨機採樣,線性系統採樣和循環系統採樣。
系統的隨機抽樣
這是系統抽樣的經典形式,其中以預定的間隔選擇對象。例如,如果研究人員想從1000人口中選擇100名學生的樣本,則可以通過從隨機順序排序的列表中選擇每10名學生來使用系統的隨機抽樣。這種方法可確保每個人口的每個成員都有相等的機會被選中,同時仍保持系統的抽樣模式。
線性系統採樣
這不是按照線性路徑創建跳過模式的,而不是隨機選擇抽樣間隔。這意味著,選擇過程並沒有從人口中選擇每個n個成員,而是遵循一個預定的序列,例如選擇每個第五成員,然後選擇每個第7個成員,然後是每個9成員,等等。線性系統抽樣在有特定的階順序或序列的情況下,例如沿線性路徑的地理位置。
圓形系統採樣
這是一個樣本在結束後再次在同一點開始的時候。這意味著,一旦抽樣間隔到達了人口的最後一個成員,它就會繞開並繼續選擇過程。循環系統採樣通常用於人口表現出週期性模式或沒有明確起點或終點的情況。例如,如果研究人員正在研究森林中的樹木生長,則可以通過沿圓形路徑定期選擇樹木來使用圓形系統採樣,從而確保對森林區域的全面覆蓋。
系統抽樣與群集採樣
系統的採樣和群集抽樣在樣本中包括的種群中取樣點的方式有所不同。群集抽樣將人口分解為集群,而係統的採樣使用較大人群的固定間隔來創建樣本。
系統抽樣從人群中選擇一個隨機的起點,然後根據人口的常規固定間隔取樣,具體取決於其大小。群集採樣將種群分為簇,然後從每個群集中獲取一個簡單的隨機樣品。
群集採樣被認為不如其他抽樣方法精確。但是,它可以節省獲得樣本的成本。群集採樣是兩步採樣過程。完成整個人口列表時,可以使用它。例如,很難構建雜貨店的客戶的全部人口進行面試。
但是,一個人可以創建一個隨機的商店子集,這是該過程的第一步。第二步是採訪這些商店客戶的隨機樣本。這是一個簡單的手動過程,可以節省時間和金錢。
系統採樣時要避免的錯誤
使用系統採樣時要注意的一個常見陷阱是選擇不合適的採樣間隔。選擇太小的採樣間隔可能會導致過採樣並增加採樣誤差,同時選擇太大的間隔可能會導致樣本的不足並降低代表性。在開始抽樣之前,可以充分了解人口的全部範圍來避免此錯誤。
要避免的另一個錯誤是未解決採樣框架引入的潛在偏差。如果採樣框架不代表感興趣的人群,則係統的抽樣可能會導致偏見。例如,如果採樣框架僅包括來自某些人口組或地理位置的個人,則樣本不會反映多樣性在整個人群中。這種類型的誤差以所有形式的採樣形式存在。
要注意的另一個提示是說明人口中系統的模式或週期的存在。如果人口與抽樣間隔保持一致的周期性模式或趨勢,則某些人口的某些段可能會系統地過度或代表性不足。例如,想像一下從棒球名冊中選擇隨機球員。如果這些名單按順序排列列出,則可能最終會從團隊中選擇相同位置的球員,因為人口具有周期性的模式。
系統抽樣的局限性
進行系統抽樣時必須考慮的一個風險涉及如何組織抽樣間隔的列表。如果列表上的種群以與採樣間隔相匹配的周期性模式組織,則可能會偏向選定的樣本。
例如,說公司的人力資源部門希望挑選員工樣本,並詢問他們對公司政策的看法。員工分為20人,每個團隊都由經理領導。如果用來選擇樣本量的列表是與聚集在一起的團隊一起組織的,則統計學家風險僅根據採樣間隔選擇管理人員(或根本沒有經理)。
我如何執行系統抽樣?
要進行系統的採樣,請首先確定要從中採樣的人群的總規模。然後,選擇一個隨機起點,然後根據預定的採樣間隔從總體中選擇每個n構件。
我什麼時候應該使用系統的抽樣?
當您需要一種簡單有效的方法來從具有已知且分佈均勻的結構均勻的大量人群中選擇代表性樣本時,應使用系統的抽樣,並且對於您的研究目標不可行或不需要隨機化時。
系統採樣的優勢是什麼?
系統的採樣易於進行,易於理解,這就是為什麼研究人員通常會喜歡它的原因。中心假設是結果代表大多數正常人群,保證了整個人群均勻地採樣。
同樣,與其他採樣方法相比,由於其過程,系統採樣提供了更高的控製程度。系統抽樣也具有低風險因素,因為數據可能污染的可能性很小。
系統採樣的缺點是什麼?
系統抽樣的主要缺點是需要人口的大小。在不了解人群中的特定參與者的情況下,系統的抽樣效果不佳。例如,如果統計學家想檢查特定地區的無家可歸者的年齡,但無法準確地獲得有多少無家可歸者,那麼他們就不會有人口規模或起點。另一個缺點是,人口需要表現出自然的隨機性,否則選擇類似實例的風險是增加了樣本的目的。
群集採樣和系統抽樣有何不同?
群集抽樣和系統抽樣在樣本中包括的種群中獲取樣品點的方式有所不同。群集採樣將種群分為簇,然後從每個群集中獲取一個簡單的隨機樣品。系統抽樣從人口中選擇一個隨機起點,然後根據人口的常規固定間隔取一個樣本,具體取決於其大小。群集採樣易受比系統抽樣更大的採樣誤差的影響,儘管這可能是一個較便宜的過程。
底線
抽樣可以是得出關於一群人,物品或其他感興趣的東西的有效方法。系統採樣是最受歡迎的方法之一,因為它比其他選項便宜且耗時。是的,這並不完美。但是,如果您有一個大數據集,沒有間隔之間的模式,則係統性採樣能夠以相對較低的成本提供可靠的樣品。