什麼是樣本量忽略?
樣本量忽略是認知偏見由Amos Tversky和丹尼爾·卡尼曼(Daniel Kahneman)。當統計信息的用戶未能考慮到樣本量所討論的數據。樣本量忽略的根本原因是人們常常無法理解高水平方差在小樣本中更有可能發生。因此,確定用於產生給定統計量的樣本量是否足夠大以允許得出有意義的結論是至關重要的。對於那些對統計方法沒有良好了解的人來說,知道樣本量何時足夠大可能具有挑戰性。
關鍵要點
- 樣本量忽視是Amos Tversky和Daniel Kahneman研究的認知偏見。
- 它包括從統計信息中得出錯誤的結論,因為沒有考慮樣本量的影響。
- 那些希望降低樣本量忽視風險的人應該記住,較小的樣本量與揮發性更大的統計結果相關,反之亦然。
了解樣本量忽略
大多數統計推斷取決於large。這說明,有了足夠大的樣本,可以從樣本的特徵中推斷出抽取樣本的人群的特徵。當樣本量太小時,無法得出準確和值得信賴的結論。樣本量忽略忽略了小樣本對我們得出此類結論的能力的影響。在金融背景下,這可能會以各種方式誤導投資者。
例如,投資者可能會看到新的投資基金的廣告,吹噓已經產生了15%年度回報自成立以來。投資者可能會很快得出結論,該基金是快速財富產生的門票。但是,如果該基金的時間沒有很長時間,那麼這個結論可能會誤導潛在的投資者。結果可能是由於短期異常引起的,並且與基金的實際投資方法無關。
樣本量通常與基本費率忽略,這是相關的認知偏見。雖然忽略樣本量是指未能考慮樣本量在確定統計要求的可信度中的作用,但基本利率忽略與人們在評估新信息時忽略有關現象的現有知識的趨勢有關。
樣本量忽略的現實世界示例
為了更好地理解樣本量忽略,請考慮以下示例,這是由Tversky和Kahneman的研究得出的:
要求一個人從五個球的樣本中抽出,發現四個是紅色的,一個是綠色的。
一個人從20個球的樣本中抽出,發現12個是紅色的,八個是綠色的。
哪個樣本提供了更好的證據表明球主要是紅色的?
大多數人說,第一個,較小的樣本提供了更強的證據,因為紅色與綠色的比率遠高於較大的樣本。但是,實際上,較小的樣本量超過了較高的比率。 20個樣本實際上提供了更強的證據。
Tversky和Kahneman的另一個例子如下:
兩個醫院為一個城鎮提供服務。在較大的醫院,每天平均有45個嬰兒出生,在較小的醫院,每天約有15個嬰兒出生。儘管所有嬰兒中有50%是男孩,但確切的百分比每天都在波動。
在一年中,每個醫院記錄了超過60%的嬰兒恰好是男孩的日子。哪個醫院記錄了更多這樣的日子?
當被問及這個問題時,有22%的受訪者表示,較大的醫院會報告更多這樣的日子,而56%的受訪者表示,兩家醫院的結果都是相同的。實際上,正確的答案是,較小的醫院會記錄更多這樣的日子,因為它的尺寸較小會產生更大的可變性。
正如我們之前指出的那樣,忽略樣本量的基礎是,人們常常無法理解,小樣本中更可能發生較高的差異。在投資中,這確實可能是非常昂貴的。