什麼是統計意義?
統計顯著性是一個結論,一組數據不是機會的結果,而可以歸因於特定原因。統計意義對於任何依賴於數據分析(包括經濟學,金融,投資,醫學,物理學和生物學)的專業人員至關重要。
統計顯著性可以被認為是強的或弱的。強大的統計意義支持了這樣的結論,即結果是真實的,不是運氣或機會引起的。
關鍵要點
- 統計顯著性衡量通過測試或實驗產生的數據結果可以歸因於特定原因的可能性。
- 統計顯著性可能很高或低。
- 高度的統計意義表明,觀察到的關係不太可能是由於機會。
了解統計意義
研究人員通常與樣品較大的人口,而不是整個人口。樣本必須代表人口,以避免結果偏見。
在包括經濟學在內的大多數科學中,如果它具有信心水平95%(有時99%)。
統計顯著性的計算(稱為顯著性測試)會遇到一定程度的錯誤。即使數據似乎有牢固的關係,研究人員也必須考慮到由於隨機機會或採樣錯誤。
樣本量是具有統計顯著性的重要組成部分。較大的樣品不太容易發生漏斗。只有隨機選擇,代表樣品應用於顯著性測試。
一個人可以接受事件的水平具有統計學意義被稱為顯著水平。
測量p值
研究人員使用稱為p值或概率值,以確定統計顯著性。
如果p值低於顯著性水平,則結果在統計上是顯著的。
p值是數據樣本的均值和標準偏差的函數。它表明給定統計結果的概率是假設單獨的機會是結果的原因。如果這種概率很小,研究人員可以得出結論,可能是對觀察到的數據負責的。
顯著性水平的相反,計算為1減去顯著性水平,是置信度。它表明統計結果沒有偶然或通過採樣誤差發生的信心程度。
習慣信心許多統計測試中的水平為95%,導致習慣顯著性水平或P值為5%。
快速事實
“ P黑客”是詳盡比較許多不同數據集以尋找具有統計學意義的結果的做法。這種做法之所以皺眉,是因為P-Hackers正在尋求支持他們偏愛結果的研究。
特殊考慮
統計意義並不總是表示實際意義,這意味著結果不一定應用於現實世界。
而且,結果在統計上具有重要意義的事實並不意味著它是不是機會的結果是,情況不太可能。
僅僅因為兩個數據系列彼此之間存在很強的相關性並不意味著因果關係。例如,演員尼古拉斯·凱奇(Nicolas Cage)明星在給定年中的電影數量可能與游泳池中意外溺水的數量非常相關。相關性是虛假由於沒有理論因果主張。
依靠過去
過去的數據(無論是否具有統計意義),是否無法可靠地預測未來的狀況。
投資分析中的問題很明顯。基於股票過去性能的定價模型可用於預測選定時間範圍內的運動。面對以後的事件時,它可能會崩潰。
作為標準,統計意義可以幫助投資者選擇一種資產定價模型,而不是其他資產定價模型。
統計顯著性測試的類型
根據正在進行的研究,使用了幾種顯著性測試。例如,可以針對一個,兩個或更多的數據示例用於平均,差異,比例,配對或未配對的數據或不同的數據分佈的測試。
根據可用數據的類型,還有不同的方法進行顯著測試。羅納德·費舍爾(Ronald Fisher)以製定最靈活的方法之一而被認為是p<0.05。
由於大多數工作都可以在收集數據後完成,因此該方法在短期或臨時研究項目中仍然很受歡迎。
為了以費舍爾的方式為基礎,傑里·尼曼(Jerzy Neyman)和埃貢·皮爾森(Egon Pearson)最終開發了另一種方法。該方法需要在收集數據之前進行更多的工作,但是它允許研究人員以控制得出錯誤結論的可能性的方式設計其研究。
零假設檢驗
統計顯著性用於零假設測試,研究人員試圖通過拒絕其他解釋來支持其理論。儘管該方法有時被誤解,但它仍然是醫學,心理學和其他領域中最流行的數據測試方法。
最常見的零假設是所討論的參數等於零(通常表明變量對感興趣的結果的影響為零)。
如果研究人員以95%或更高的信心拒絕零假設,他們可以聲稱觀察到的關係具有統計學意義。零假設也可以測試兩種或多個替代治療的效果相等。
重要的
高水平的統計意義並不能證明假設是對還是錯。統計顯著性衡量觀察到的結果可能發生的可能性,假設無效假設是正確的。
拒絕零假設,即使很高的統計顯著性永遠不會證明某些東西只能為現有假設增加支持。另一方面,未能拒絕零假設通常是駁斥假設的理由。
此外,效果在統計上可能很重要,但影響很小。例如,在浴室中使用兩層廁紙的公司具有更高的生產力,但是每個工人的絕對生產力的提高可能是微不足道的。
您如何計算統計意義?
統計顯著性是使用累積分佈函數,這可以告訴您某些結果的概率,假設零假設是正確的。如果研究人員確定這種概率非常低,則可以消除零假設。
您如何在Excel中表現出統計學意義?
Microsoft Excel具有內置功能,可以執行統計顯著性測試所需的一些計算。要執行卡方檢驗,請type = chisq.test(cuthrange,teedual range),其中參數為單元格。要測量p值,請使用函數= t.test。
統計意義如何衡量?
統計顯著性用於評估基於觀察數據之間兩個變量之間存在關係的可能性。
與普遍的誤解相反,這並不能衡量兩個變量因因果關係相關的概率。相反,它衡量觀察到的數據可能發生的概率不兩個變量之間的關係。
儘管這還不足以建立因果關係,但具有高度統計意義的重複測試可以幫助研究人員消除其結果被隨機蒙上的可能性。
底線
統計顯著性用於評估觀察到的關係可能是隨機機會的結果的可能性。當一個觀察結果顯示兩個變量之間存在弱關係或具有少數數據點時,據說它在統計上是微不足道的。但是,當有更多數據點顯示出更一致的關係時,相關性被認為具有統計學意義。
研究人員使用統計意義來評估兩個變量可能具有因果關係的可能性。