你的投資顧問建議您每月收入投資計劃,該計劃承諾每月有可變收益。僅當您保證平均每月收入180美元的情況下,您才會投資。您的顧問還告訴您,在過去的300個月中,該計劃的平均價值為190美元,A標準偏差75美元。您應該投資這個計劃嗎?假設檢驗為這種決策提供了幫助。
關鍵要點
- 假設檢驗是確認財務或商業索賠或想法的數學工具。
- 假設測試對於試圖決定投資於什麼以及該工具是否可能提供令人滿意的回報的投資者很有用。
- 儘管存在假設檢驗的不同方法論,但仍使用相同的四個步驟:定義假設,設置標準,計算統計量並得出結論。
- 與大多數統計工具和模型一樣,這種數學模型具有局限性,並且容易遇到某些錯誤,因此投資者還必須考慮其他模型與此模型
什麼是假設檢驗?
假設或顯著性檢驗是使用樣本集中測得的數據,用於測試給定種群中感興趣參數的主張,想法或假設。對選定樣本進行計算,以收集有關整個人群特徵的更多決定性信息,這使得可以系統地測試有關整個數據集的索賠或想法。
這是一個簡單的例子:一名學校校長報告說,他們學校的學生在考試中平均得分10分。為了檢驗這個“假設”,我們記錄了學校整個學生群體(例如300)的30名學生(樣本)的標記,併計算該樣本的平均值。然後,我們可以將(計算的)樣本均值與(報告的)種群平均值進行比較,並試圖確認假設。
舉一個例子,特定的年度返回共同基金是8%。假設共同基金已經存在了20年。我們將共同基金年收益的隨機樣本換成五年(樣本),併計算其平均值。然後,我們將(計算出的)樣本均值與(聲稱的)種群均值進行比較,以驗證假設。
重要的
本文假設讀者熟悉正態分佈表,公式,p值和相關統計基礎知識的概念。
假設檢驗存在不同的方法,但是涉及相同的四個基本步驟:
步驟1:定義假設
通常,報告的價值(或索賠統計)被稱為假設,並被認為是正確的。對於上述示例,該假設將是:
- 示例答:學校的學生在考試中平均得分10分。
- 示例B:共同基金的年收益率為每年8%。
此說明的描述構成了“零假設(h0)”是假定為此,假定在法庭上提出的證據被證明有罪的陪審團審判中的被告是無辜的。相似地,假設檢驗首先說明並假設零假設,”然後該過程確定假設是否可能是正確的還是錯誤的。
要注意的重要點是,我們正在檢驗無效假設,因為對其有效性存在疑問。捕獲了任何針對陳述的零假設的信息替代假設(h1)。對於上述示例,替代假設將是:
- 學生的平均得分是不是等於7。
- 共同基金的年度回報是不是每年等於8%。
換句話說,替代假設是無效假設的直接矛盾。
就像在審判中一樣,陪審團假定被告的純真(零假設)。檢察官必須證明其他情況(替代假設)。同樣,研究人員必須證明零假設是正確或錯誤的。如果檢察官未能證明替代假設,陪審團就必須放任被告(以零假設為基礎)。同樣,如果研究人員未能證明替代假設(或簡直什麼都不做),則假設零假設是正確的。
步驟2:設置標準
決策標準必須基於數據集的某些參數,這是與正態分佈的連接到圖片中的地方。
根據標準統計數據採樣分佈,對於任何樣本量n,如果繪製樣品的X呈正態分佈,則X的採樣分佈是正常的。因此,所有其他可能的樣本平均值一個人可以選擇是正態分佈的。
例如,確定XYZ上列出的任何股票的平均每日收益是否股市,元旦大約大於2%。
h0:零假設:平均值= 2%
h1:替代假設:平均值> 2%(這是我們要證明的)
取樣(例如,總計500個股票),併計算樣本的平均值。
對於正態分佈,95%的值躺在裡面人口平均值的兩個標準偏差。因此,樣本數據集的這種正態分佈和中心限制假設使我們能夠將5%確定為顯著性水平。這是有道理的,因為在這個假設下,獲得離群值的概率不到5%(100-95),而異常值超出了兩個標準偏差與人口平均值的偏差。根據數據集的性質,可以將其他顯著性水平以1%,5%或10%的速度佔據。對於財務計算(包括行為財務),有5%是公認的限制。如果我們發現任何計算超出了通常的兩個標準偏差,那麼我們就有一個有力的異常值拒絕零假設。
從圖形上講,它表示如下:
在上面的示例中,如果樣本的平均值大於2%(例如3.5%),則我們拒絕原假設。接受替代假設(平均> 2%),這證實股票的平均每日回報確實超過2%。
但是,如果樣本的平均值不太可能顯著大於2%(並且仍處於約2.2%的左右),那麼我們不能拒絕原假設。挑戰是如何決定此類近距離情況。為了從選定的樣本和結果得出結論,要確定一個顯著性水平,這可以得出關於零假設的結論。替代假設可以確定在此類近距離案例上確定意義水平或“關鍵價值”概念。
根據教科書的標准定義,“臨界值是一個截止值,它定義了邊界,如果零假設為真,則不到5%的樣本平均值。獲得的樣本均值超出臨界值將導致決定拒絕原假設的決定。”在上面的示例中,如果我們將臨界值定義為2.1%,並且計算出的平均值為2.2%,則拒絕原假設。臨界價值建立了關於接受或拒絕的明確界定。
步驟3:計算統計數據
此步驟涉及計算所需的數字,稱為測試統計(如均值,,Z得分,,,,p值等),對於所選樣品。(我們將在以後的部分中獲取這些內容。)
步驟4:得出結論
使用計算值,請決定零假設。如果獲得樣本平均值的概率小於5%,那麼結論是拒絕零假設。否則,接受並保留零假設。
錯誤類型
關於對整個人群的正確適用性,基於樣本的決策可能會產生四個可能的結果:
決定保留 |
決定拒絕 |
|
適用於整個人口 |
正確的 |
不正確 (類型1錯誤 - A) |
不適用於整個人口 |
不正確 (類型2錯誤-b) |
正確的 |
“正確的”案件是對樣本做出的決定確實適用於整個人群的案例。當一個人決定基於樣本計算保留(或拒絕)零假設時,出現錯誤的情況,但是該決定並不真正適用於整個人群。這些情況構成1型(阿爾法)和類型2(beta)錯誤,如上表所示。
選擇正確的臨界值允許消除1型α錯誤或將其限制為可接受的範圍。
alpha表示意義水平上的誤差,並由研究人員確定。為了維持概率計算的標準5%顯著性或置信度水平,將其保留為5%。
根據適用的決策基準和定義:
- “此(alpha)標准通常設置為0.05(a = 0.05),我們將alpha水平與p值進行比較。類型I錯誤小於5%(p <0.05),我們決定拒絕原假設。否則,我們保留了零假設。 ”
- 此概率使用的技術術語是p值。它被定義為“獲得樣品結果的概率,鑑於零假設中所述的值是正確的。獲得樣品結果的p值與顯著性水平進行了比較。”
- II型誤差或β誤差定義為錯誤地保留零假設的概率,而實際上它不適用於整個總體。
還有一些示例將證明此和其他計算。
示例1
存在一個每月收入投資計劃,承諾每月的收益可變。只有在確保平均每月收入180美元的情況下,投資者才會投資。投資者有300個月的收益樣本,平均為190美元,標準偏差為75美元。他們應該投資這個計劃嗎?
讓我們設置問題。如果投資者確保投資者的平均收益率為180美元,則將投資該計劃。
h0:null假設:平均值= 180
h1:替代假設:平均值> 180
方法1:臨界價值方法
確定臨界值xl對於樣本平均值,足夠大以拒絕零假設 - IE拒絕零假設,如果樣本平均值> =臨界值xl
P(識別I型Alpha錯誤)= P(拒絕H0鑑於那h0是真的),
當樣本平均值超過臨界限制時,這將實現。
= P(鑑於H0是真的)= alpha
從圖形上看,如下:
服用alpha = 0.05(即5%的顯著性水平),z0.05= 1.645(來自Z-table或正態分佈表)
=> xl= 180 +1.645*(75/sqrt(300))= 187.12
由於樣本平均值(190)大於臨界價值(187.12),因此拒絕了零假設,得出的結論是,平均每月收益確實大於180美元,因此投資者可以考慮投資於該計劃。
方法2:使用標準化的測試統計
也可以使用標準化值z。
測試統計量,z =(樣本平均值 - 人口平均值) /(STD-DEV / SQRT(樣品編號)。
然後,拒絕區域將成為以下內容:
z =(190 - 180) /(75 / sqrt(300))= 2.309
我們的拒絕區域在5%的顯著性水平為z> z0.05= 1.645。
由於z = 2.309大於1.645,因此可以通過上述類似的結論來拒絕原假設。
方法3:P值計算
我們旨在識別p(均值= 190,當平均值= 180時)。
= p(z> =(190-180) /(75 / sqrt(300))
= p(z> = 2.309)= 0.0084 = 0.84%
下表推斷P值計算得出的結論是,有證據表明平均每月收益高於180:
p值 |
推理 |
小於1% |
確認的證據支持替代假設 |
1%至5% |
有力的證據支持替代假設 |
在5%至10%之間 |
證據薄弱支持替代假設 |
大於10% |
沒有證據支持替代假設 |
示例2
新的股票經紀人(XYZ)聲稱其經紀費低於您當前的股票經紀人(ABC)的費用。一家獨立研究公司可用的數據表明,所有ABC經紀客戶的平均值和STD-DEV分別為18美元和6美元。
採集100個ABC客戶的樣本,並使用XYZ經紀人的新價格計算經紀費用。如果樣本的平均值為$ 18.75,而STD-DEV相同(6美元),可以對ABC和XYZ經紀人之間平均經紀賬單的差異做出任何推論?
h0:null假設:平均值= 18
h1:替代假設:平均值<> 18(這是我們要證明的。)
拒絕區域:z <= -z2.5和z> = z2.5(假設顯著性水平為5%,兩側分別分別為2.5)。
z =(樣本平均值 - 平均值) /(std-dev / sqrt(samples no。))
=(18.75 - 18) /(6 /(SQRT(100))= 1.25
該計算的z值屬於以下定義的兩個限制之間
-Z2.5= -1.96和Z2.5= 1.96。
這得出的結論是,沒有足夠的證據可以推斷出您現有經紀人和新經紀人的利率之間存在任何差異。
另外,p值= p(z <-1.25)+p(z> 1.25)
= 2 * 0.1056 = 0.2112 = 21.12%,大於0.05或5%,得出相同的結論。
從圖形上講,它由以下內容表示:
假設測試方法的批評點:
- 基於假設的統計方法
- 易用錯誤的alpha和beta錯誤詳細介紹
- p值的解釋可能是模棱兩可的,導致了令人困惑的結果
底線
假設測試允許數學模型以一定的置信度驗證索賠或想法。但是,像大多數統計工具和模型一樣,它受到一些限制。應批判地考慮該模型做出財務決策,並牢記所有依賴性。替代方法類似貝葉斯推斷也值得探索類似的分析。