什麼是假設檢驗?
假設檢驗有時稱為顯著性測試,是統計中的一種行為測試關於人口參數的假設。分析師採用的方法取決於所使用的數據的性質和分析的原因。
假設檢驗用於通過使用樣本數據來評估假設的合理性。此類數據可能來自較大的人群或數據生成過程。在以下描述中,這兩種情況都將使用“人口”一詞。
關鍵要點
- 假設檢驗用於通過使用樣本數據來評估假設的合理性。
- 鑑於數據,該測試提供了有關假設的合理性的證據。
- 統計分析師通過測量和檢查正在分析的人群的隨機樣本來檢驗假設。
- 假設檢驗的四個步驟包括說明假設,制定分析計劃,分析樣本數據並分析結果。
假設檢驗如何工作
在假設檢驗中分析師測試一個統計樣本,旨在提供有關零假設的合理性的證據。統計分析師測量並檢查正在分析的人群的隨機樣本。所有分析師都使用隨機人群樣本來檢驗兩個不同的假設:零假設和替代假設。
零假設通常是人口參數之間平等的假設。例如,零假設可能指出人口平均收益等於零。替代假設實際上與無效假設相反。因此,它們是相互排斥,只有一個可以是真實的。但是,兩個假設之一將永遠是正確的。
重要的
零假設是關於人口參數(例如人口平均值)的陳述,被認為是正確的。
- 陳述假設。
- 制定一個分析計劃,概述瞭如何評估數據。
- 執行計劃並分析樣本數據。
- 分析結果並拒絕零假設,或者指出無效假設是合理的。
假設檢驗的示例
如果一個人想測試一分錢恰好有50%的機會降落在頭上,則零假設是50%是正確的,而另一種假設是50%是不正確的。從數學上講,零假設表示為HO:p = 0.5。替代假設顯示為“ HA”,與零假設相同,除了相等的符號觸及,這意味著它不等於50%。
隨機採用100個硬幣翻轉的樣品,並測試了零假設。如果發現將100個硬幣翻轉分佈成40個頭和60個尾巴,則分析師會認為一分錢沒有50%的機會降落在頭上,並且會拒絕原假設並接受替代假設。
如果有48個頭和52個尾巴,那麼硬幣可能是公平的並且仍然產生這樣的結果是合理的。在此類情況下,在“接受”零假設“接受”的情況下,分析師指出,預期結果(50頭和50個尾巴)和觀察到的結果(48個頭和52個尾巴)之間的差異是“單獨偶然地解釋的”。
假設檢驗何時開始?
一些統計學家將第一個假設檢驗歸因於諷刺作家約翰·阿布斯諾(John Arbuthnot)在1710年,他們在觀察到英格蘭的男性和女性出生後觀察到,幾乎每年,男性的出生都略有比例。 Arbuthnot計算出,這種情況發生的可能性很小,因此是由於“神聖的天意”。
假設檢驗的好處是什麼?
假設測試通過對數據進行測試來幫助評估新思想或理論的準確性。這使研究人員能夠確定證據是否支持其假設,有助於避免錯誤的主張和結論。假設測試還為基於數據而不是個人意見或偏見的決策提供了一個框架。通過依靠統計分析,假設檢驗有助於減少機會和混淆變量的影響,從而為得出明智的結論提供了強大的框架。
假設檢驗的局限性是什麼?
假設檢驗僅依賴於數據,並且對所研究的主題沒有全面的理解。此外,結果的準確性取決於可用數據的質量和所使用的統計方法。數據不正確或不當假設的表述可能會導致結論不正確或測試失敗。假設檢驗也可能導致錯誤,例如分析師在不應該接受或拒絕無效假設的情況下。這些錯誤可能會導致錯誤的結論或錯過的機會,以識別數據中的重要模式或關係。
底線
假設檢驗是指一個統計過程,該過程有助於研究人員確定研究的可靠性。通過使用良好的假設和一組統計檢驗,個人或企業可以推斷他們正在研究的人群,並根據所提供的數據得出結論。所有假設測試方法都具有相同的四步過程,其中包括說明假設,制定分析計劃,分析樣本數據並分析結果。