標準誤差(SE)是一個統計量,揭示瞭如何準確樣本數據代表整個人群的準確性。它衡量了一個準確性樣本分佈代表人口。在統計中,樣本平均偏離了人口的實際平均值;此偏差是平均值的標準誤差。
標準誤差被認為是推論統計的一部分,或者是從研究得出的結論。它與樣本量成反比。樣本量越大,標準誤差越小,因為統計數據將接近實際值。
關鍵要點
- 標準誤差是統計樣本人群的近似標準偏差。
- 標準誤差描述了人口的計算平均值與被認為已知或被認為是準確的一個差異。
- 均值計算中涉及的數據點越多,標準誤差往往越小。
Investopedia / Joules Garcia
了解標準錯誤
術語“標準錯誤”或簡稱SE用於參考標準偏差各種樣本統計數據,例如意思是或中位數。
當種群採樣時,通常計算平均值或平均值。標準誤差描述了人口的計算平均值與被認為已知或被認為是準確的一個差異。這有助於彌補與樣本收集有關的任何偶然不准確性。
“平均值的標準誤差”是指從人群中獲取的樣本平均值的標準偏差。標準誤差與標準偏差之間的關係是,對於給定的樣本量,標準誤差等於標準偏差除以樣本大小的平方根。
標準誤差的偏差表示為數字。有時,偏差是必要的或希望以百分比顯示的。當顯示為百分比時相對標準誤差。
重要的
標準誤差和標準偏差是可變性的度量,而中心趨勢度量包括平均值,中位數等。
標準誤差越小,樣本的代表性就越大。均值計算中涉及的數據點越多,標準誤差往往越小。如果標準誤差很大,則數據可能具有一些顯著的違規性。
在收集多個樣本的情況下,每個樣品的平均值可能與其他樣本略有不同,從而在變量之間產生擴散。該點差通常以標準誤差來衡量,這考慮了整個數據集的均值之間的差異。
標準誤差的公式和計算
用於算法交易中,估計值的標準誤差可以計算為標準偏差除以樣本量的平方根:
和=√n一個在哪裡:一個=人口標準偏差√n=樣本量的平方根
如果尚不清楚人口標準偏差,則可以替代樣本標準偏差,s,在分子中近似標準誤差。
標準誤差與標準偏差
標準偏差是每個數據點的傳播的表示。它用於根據每個標準偏差級別顯示的數據點的數量來幫助確定數據的有效性。
標準誤差的功能更多地是通過分析均值中的偏差來確定樣品準確性或多個樣品準確性的方法。
標準誤差相對於分析中使用的樣本量標準差標準化。標準偏差衡量數據圍繞平均值擴散的數據的差異或分散量。標準誤差可以被認為是對真實總體平均值的樣本平均值的分散。
標準誤差和置信區間
當統計學家或研究人員估計人口參數時,他們很少知道確切的價值。相反,他們使用示例數據進行有根據的猜測。如上所述,這是置信區間。這個範圍使估計值圍繞著多少不確定性。
了解標準誤差在置信區間中的作用可以幫助解釋研究結果。例如,如果兩項研究估計相同的人口平均值,但具有截然不同的置信區間,則通常是由於標準誤差的差異。狹窄的間隔意味著對估計的精度的信心更大,而更廣泛的間隔則表明需要更多的數據或更好的採樣方法。實際上,置信區間(由標準錯誤的能力)主持了研究人員和決策者,衡量了他們所依賴數字的可靠性。
標準錯誤和假設檢驗
標準錯誤也會影響假設檢驗,尤其是將樣本統計數據與人口參數進行比較時。在Z檢驗或t檢驗,您使用標準誤差來衡量樣本結果距離零假設為真的程度。它有助於確定觀察到的效果是否可能是由於機會引起的,還是它具有統計學意義。沒有標準錯誤,我們將無法判斷樣品估計的可靠性。
在z檢驗和t檢驗中,通過比較樣本統計量,假設值和標準誤差來計算測試統計量。該比率告訴我們,樣本統計量遠離了零假設下假設的值多少標準誤差。大型測試統計數據表明,樣本結果遠非預期值,這可能表明應拒絕原假設。如果結果接近(例如,大約兩個標準錯誤)可能並不重要。
然後,該測試統計量用於找到一個P值,該統計數據告訴我們,假設零假設是正確的。標準誤差越小,測試統計量的越大。這就是為什麼標準誤差直接影響結果是否具有統計學意義的原因。
您還可以通過思考中心代表零假設的鐘形曲線來概念化這一點。如果標準誤差較大,則曲線更寬且更平坦,則意味著觀察到的結果必須與中心更遠,以免被認為是不尋常的。如果標準誤差很小,則曲線更緊,甚至與中心的微小差異顯得極端。
使用標準錯誤的缺點
使用標準誤差的最大缺點之一是標準誤差假定一個隨機和代表性的樣本。如果樣本有偏見或收集不良,則計算出的標準誤差可能會低估或虛假陳述真正的不確定性。這可能導致誤導性置信區間或不正確的假設檢驗。
另一個限制是,對於小樣本量,標準誤差變得不那麼可靠。在小樣本中,可變性的估計可能不能反映出真正的人口差異,這會影響標準誤差的準確性。這就是為什麼在處理有限的數據時,使用t分佈調整小樣本量的t檢驗通常比z檢驗更受歡迎。
標準誤差還假設被分析的數據遵循一定的分佈,通常是正態分佈。如果基礎數據高度偏見,包含異常值,或不符合中央限制定理的假設,那麼標準誤差可能無法準確顯示估計值的真實變異性。
標準錯誤的示例
假設一位分析師研究了標準普爾500指數中50家公司的隨機樣本,以了解股票的市盈率與隨後在市場上的12個月績效之間的關聯。
假設由此產生的估計值為-0.20,表明每1.0點P/E比,股票返回0.2%的相對性能差0.2%。在50的樣本中,標準偏差為1.0。
因此,標準錯誤是:
和=√501.0=7.071=0.141
因此,我們將估計值報告為-0.20%±0.14,使我們的置信區間為(-0.34 -0.06)。因此,p/e在標準普爾500指數回報率上的真正平均值將以高度的概率落在該範圍內。
現在說,我們將股票的樣本增加到100,發現估計值從-0.20略有變化到-0.25,標準偏差降至0.90。因此,新的標準錯誤將為:
和=√1000.90=100.90=0.09。
所得的置信區間變為-0.25±0.09 =(-0.34 -0.16),這是一個更緊密的值。
標準錯誤是什麼意思?
標準誤差是直觀的採樣分佈的標準偏差。換句話說,它描述了從樣本相對於真實人口平均值獲得的點估計中可能存在多少差異。
什麼是好的標準錯誤?
標準誤差衡量樣本估計中可以預期的差異與人口的真實值相比。因此,標準誤差越小越好。實際上,零(或接近它)的標準誤差將表明估計值正是真實值。
您如何找到標準錯誤?
標準誤差將標準偏差除以樣本大小的平方根。許多統計軟件包會自動計算標準錯誤。
底線
標準誤差(SE)測量了從樣本中獲得的估計值的分散,周圍是在人群中發現的真實值。
統計分析和推理通常涉及繪製樣本和運行統計測試以確定變量之間的關聯和相關性。因此,標準誤差告訴我們,我們可以期望估計值近似人口價值的估計值。