什麼是擬合優度?
擬合優度一詞是指統計檢驗,該測試確定樣本數據如何適合來自人群的分佈常態分佈。簡而言之,它假設樣本是偏斜還是代表您期望在實際人群中找到的數據。
擬合優度確定了觀察到的值與在正態分佈情況下模型的期望之間的差異。有多種方法可以確定擬合優度,包括卡方。
關鍵要點
- 擬合優度是一項統計測試,該測試試圖確定一組觀察到的值是否匹配適用模型下的預期值。
- 他們可以向您展示您的樣本數據是否適合來自正態分佈的人群的一組預期數據。
- 有多種類型的合適性測試,但最常見的是卡方檢驗。
- 卡方檢驗確定分類數據之間是否存在關係。
- Kolmogorov-Smirnov測試確定樣本是否來自人口的特定分佈。
了解擬合優度
擬合優點測試是對觀察值進行推斷的統計方法。例如,您可以確定樣本組是否真正代表了整個人口。因此,他們確定實際值與模型中預測值的關係。當在決策中使用時,合適的測試使得更容易預測趨勢和未來的模式。
如上所述,有幾種類型的合適性測試。它們包括最常見的卡方檢驗以及Kolmogorov-Smirnov測試和Shapiro-Wilk測試。測試通常使用計算機軟件進行。但是統計學家可以使用針對特定類型的測試的公式進行這些測試。
要進行測試,您需要一個特定變量,並假設其分佈方式。您還需要一個具有清晰和明確值的數據集,例如:
- 觀察到的值,這些值是從實際數據集得出的
- 預期值,這些值是從提出的假設中獲取的
- 集合中的類別總數
重要的
擬合優點測試通常用於測試殘差的正態性或確定是否從相同的分佈中收集了兩個樣本。
建立alpha水平
為了解釋合適的測試,統計學家建立一個alpha級別很重要,例如p值對於卡方檢驗。 p值是指使結果接近觀察到的結果的極端的概率。這是假設零假設是正確的。零假設斷言,變量之間沒有關係,而替代假設假設存在關係。
相反,測量觀測值的頻率並隨後與期望值和自由度計算卡方。如果結果低於α,則無效假設無效,表明變量之間存在關係。
合適的測試類型
卡方測試
x2=我=1∑k((o我- e我)2/e我
這卡方測試這也稱為獨立性的卡方檢驗,是一種推論統計方法,該方法測試了基於隨機樣本對人群提出的索賠的有效性。
僅用於分為類(bin)的數據,它需要足夠的樣本量來產生準確的結果。但這並不表示關係的類型或強度。例如,它無法得出結論,這種關係是正面還是負面。
要計算卡方擬合優度,請設置所需的α顯著性水平。因此,如果您的置信度為95%(或0.95),則Alpha為0.05。接下來,確定要測試的分類變量,然後定義有關它們之間關係的假設陳述。
快速事實
為了獲得獨立性的卡方檢驗,變量必須相互排斥。 CHI擬合測試不應用於連續的數據。
Kolmogorov-Smirnov(KS)測試
d=1≤我≤n最大限度((f((y我)- n我- 1,,,,n我- f((y我))
Kolmogorov-Smirnov(KS)測試以俄羅斯數學家Andrey Kolmogorov和Nikolai Smirnov的名字命名,是一種統計方法,它確定樣本是否來自人群中的特定分佈。
該測試,建議大型樣品(例如,2000年以上)是非參數。這意味著它不依賴任何分佈有效。目的是證明零假設,即正態分佈的樣本。
像卡方一樣,它使用了無效的替代假設和α顯著性水平。無效表示數據遵循人群中的特定分佈,替代表明數據未遵循人群中的特定分佈。 α用於確定測試中使用的臨界值。但是與卡方檢驗不同,Kolmogorov-Smirnov測試適用於連續分佈。
計算出的測試統計量通常表示為D。它確定了零假設是接受還是拒絕。如果d大於臨界值阿爾法,零假設被拒絕。如果d小於臨界值,則接受零假設。
安德森 - 達林(AD)測試
s=∑我=1nn((2我- 1)[Lnf((y我)+Ln((1- f((yn+1- 我)]]
Anderson-Darling(AD)測試是KS測試的一種變化,但對分佈的尾巴有更大的重量。 KS測試對可能發生的差異更敏感,而差異可能更接近分佈的中心,而AD測試對在尾巴中觀察到的變化更為敏感。由於尾巴風險和“脂肪尾巴”的想法在金融市場中很普遍,因此廣告測試可以在財務分析中提供更多的權力。
與KS測試一樣,廣告測試產生統計量,表示為2,可以將其與零假設進行比較。
Shapiro-Wilk(SW)測試
w=∑我=1n((x我- xˉ)2((∑我=1n一個我((x((我))2,,,,
Shapiro-Wilk(SW)測試確定樣品是否遵循正態分佈。該測試僅在使用一個帶有一個連續數據變量的樣品時檢查正態性,建議用於2000年的小樣本量。
Shapiro-Wilk測試使用了一個稱為QQ圖的概率圖,該圖在Y軸上顯示了從最小到最大的Y軸上顯示兩組分位數。如果每個分位數都來自相同的分佈,則一系列圖是線性的。
QQ圖用於估計方差。使用QQ圖方差以及人群的估計方差,可以確定樣本是否屬於正態分佈。如果兩個方差的商平等或接近1,則可以接受零假設。如果大大低於1,則可以拒絕。
就像上面提到的測試一樣,該測試使用alpha並形成兩個假設:無效和替代方案。零假設指出樣本來自正態分佈,而替代假設指出樣品不是來自正態分佈。
其他合適的測試
除了上面提到的更常見的測試類型外,分析師可以使用的其他許多擬合優點:
- 這貝葉斯信息標準(BIC)是用於在有限模型中選擇模型選擇的統計度量。 BIC是一個合適的測試,可以平衡模型的複雜性與數據符合數據的優點。
- 這Cramer-von Mises標準(CVM)是一種擬合優點測試,用於評估一組觀察到的數據符合假設的概率分佈的程度。它通常用於經濟學,工程或金融,它基於觀察到的數據的累積分佈函數和假設的分佈。
- 這Akaike信息標準(AIC)是衡量給定數據集統計模型的相對質量的衡量標準,它在模型的優點及其複雜性之間提供了權衡。它基於信息理論,並衡量模型用於近似數據的真實基礎分佈時丟失的信息量。
- 這Hosmer-Lemeshow測試將二元結果的預期頻率與觀察到的結果的頻率在不同的組或間隔中進行了比較。這些組通常是通過將結果的預測概率分為十組或垃圾箱來形成的。
- Kuiper的測試類似於Kolmogorov-Smirnov檢驗,但對分佈尾巴的差異更為敏感。
- 莫蘭的我測試或者莫蘭的索引是用於評估數據中空間自相關的統計測試。空間自相關是對變量相似或在空間上相似或不同的程度的度量。
提示
一個非常一般的經驗法則是要求擬合優度測試中的每個組至少具有五個數據點。這樣可以確保將足夠的信息饋入測試以確定分佈。
擬合優點測試的重要性
出於多種原因,擬合優點測試在統計學中很重要。首先,它們提供了一種評估的方法統計模型的合適程度一組觀察到的數據。運行合適性測試的主要重要性是確定觀察到的數據是否與假定的統計模型一致。通過擴展,擬合優點測試可能在不同模型之間選擇可能更適合數據的不同模型可能很有用。
合適的測試還可以幫助識別異常值或市場異常這可能會影響模型的擬合度。離群值可能會對模型擬合產生很大的影響,並且可能需要單獨刪除或分別處理。有時,在將它們集成到分析模型中之前,離群值不容易識別。
合適的測試還可以提供有關數據的可變性和模型的估計參數的信息。該信息對於做出預測和理解所建模的系統的行為可能很有用。基於被饋入模型的數據,可能有必要完善針對正在測試的數據集,計算殘差以及潛在極端數據的p值的模型。
合適的測試與獨立測試
合適的測試和獨立性測試都是用於評估變量之間關係的統計測試。因此,很容易混淆兩者。但是,每個都旨在回答不同的問題。
擬合優點測試用於評估一組觀察到的數據適合特定概率分佈的程度。另一方面,使用獨立測試來評估兩個變量之間的關係。它用於測試兩個變量之間是否存在任何關聯。獨立測試的主要目的是查看一個變量的變化是否與另一個變量的變化有關。
當研究問題集中在理解兩個變量之間以及它們是相關還是獨立的情況下,通常會使用獨立測試。在許多情況下,獨立測試指向兩個特定變量(即吸煙會導致肺癌嗎?)。另一方面,在整個觀察到的數據集中使用擬合優度測試,以評估特定模型的適當性。
擬合的習慣
這是一個假設的例子,以說明擬合優度測試如何有效。
假設一個小型社區體育館在假設出席人數最高的假設是星期一,星期二和星期六,週三和周四的平均出勤率以及星期五和周日的最低出勤率。根據這些假設,該健身房每天僱用一定數量的工作人員來檢查會員,清潔設施,提供培訓服務和教學課程。
但是體育館的經濟狀況不佳,所有者想知道這些出勤假設和人員配備水平是否正確。所有者決定在六個星期內計算每天的健身參與者人數。然後,他們可以將體育館的出勤率與觀察到的出勤率進行比較,例如,使用卡方擬合測試。
現在他們有了新數據,他們可以確定如何最好地管理健身房並改善盈利能力。
擬合優度是什麼意思?
擬合優度是一種統計假設檢驗,用於查看觀察到的數據鏡如何預期數據。擬合優點測試可以幫助確定樣本是否遵循正態分佈,分類變量是否相關,或者隨機樣本是否來自同一分佈。
為什麼擬合的善意很重要?
合適的測試有助於確定觀察到的數據是否與預期的數據保持一致。可以根據進行假設檢驗的結果做出決定。例如,零售商想知道哪種產品可吸引年輕人。零售商對年輕人的隨機樣本進行了調查,以確定哪種產品是首選。他們使用卡方,他們以95%的信心確定產品A和年輕人之間存在關係。基於這些結果,可以確定該樣本代表年輕人的人口。零售營銷人員可以用它來改革他們的運動。
卡方測試中的合適性是什麼?
卡方檢驗是否存在分類變量之間的關係以及樣本是否代表整體。它估計觀察到的數據如何反映了預期數據或它們的合適程度。
您如何進行合適的測試?
合適性測試由不同的測試方法組成。測試的目標將有助於確定要使用的方法。例如,如果目標是在相對較小的樣本上測試正態性,則Shapiro-Wilk測試可能是合適的。如果要確定樣品是否來自人群中的特定分佈,將使用Kolmogorov-Smirnov測試。每個測試都使用自己的獨特公式。但是,它們具有共同點,例如零假設和意義水平。
底線
合適的測試確定樣本數據適合人群的期望程度。從樣本數據中,通過差異度量收集觀察到的值並將其與計算出的期望值進行了比較。根據您想要的結果,可用的合適性假設測試不同。
選擇正確的合適性測試很大程度上取決於您想了解的樣本以及樣本的大小。例如,如果想知道分類數據的觀察值是否與分類數據的預期值匹配,請使用卡方。如果想知道一個小樣本是否遵循正態分佈,則shapiro-wilk測試可能是有利的。有許多測試可確定合適性。