平方(RSS)的殘差總和是一種用於測量量的統計技術方差在不通過回歸模型本身解釋的數據集中。相反,它估計殘差的差異或錯誤術語。
線性回歸是一種測量值,有助於確定因變量與一個或多個其他因素(稱為獨立或解釋變量)之間關係的強度。
關鍵要點
- 平方(RSS)的殘差總和測量回歸模型的誤差項或殘差的方差水平。
- 平方的殘差總和越小,您的模型越適合您的數據;平方的殘差總和越大,您的模型越差。
- 零值意味著您的模型非常合適。
- 投資者和投資組合經理使用統計模型來跟踪投資的價格並使用該數據來預測未來的變動。
- 財務分析師使用RSS來估計其計量經濟學模型的有效性。
了解平方的殘留總和(RSS)
一般而言,正方形的總和是回歸分析中用於確定數據點分散的統計技術。在回歸分析中,目標是確定數據系列可以如何擬合到可能有助於解釋數據系列生成的函數。平方的總和被用作一種數學方式來找到該功能最適合(最小不同)與數據不同。
RSS測量了運行模型後的回歸函數與數據集之間剩餘的誤差量。較小的RSS圖表示與數據非常合適的回歸函數。
RSS,也稱為平方殘差之和,基本上決定了回歸模型的解釋或表示模型中的數據。
如何計算平方的殘差總和
RSS =∑ni = 1 ((y我- f((x我))2
在哪裡:
y我= iTh要預測變量的值
f(x我)= y的預測值我
n =求和的上限
正方形(RSS)與剩餘標準誤差(RSE)的剩餘總和
殘留標準誤差(RSE)是描述差異的另一個統計術語標準偏差回歸分析中點所示的觀察值與預測值。是一個擬合優度可以用來分析一組數據點與實際模型的程度的度量。
RSE是通過將RSS除以樣品中的觀測值的數量來計算的。1/2
最小化RSS以獲得最佳擬合
在回歸分析的領域中,最大程度地減少平方的殘差總和對於實現模型與數據的最佳擬合至關重要。在實現這一目標的不同技術中,最基本和廣泛使用的方法之一是最小二乘回歸。
最小二乘回歸是一種旨在找到線路或曲線的方法,以最大程度地減少平方差的總和。這些差異將在觀測值和模型預測的值之間。從本質上講,最小二乘回歸試圖取得平衡,使該模型捕獲數據的潛在趨勢,同時仍然最大程度地減少了觀察到的內容與預測的內容之間的差異。
通過最小二乘回歸最小化RSS的過程涉及迭代調整模型的參數。這通常是在達到最佳擬合度之前完成的。對於簡單的線性回歸模型,這通常需要找到最適合數據的線路的斜率和截距。在更複雜的情況下,該過程變得更加複雜,但具有許多相同的原則。
RSS的局限性
RSS有一些局限性。首先,RSS給所有殘差都相等。這意味著離群值可能會過分影響RSS,這意味著估計的係數可能會呈負偏斜。另一個缺點是RSS依賴於幾個假設。如果違反了任何假設,例如線性,錯誤的獨立性或同質性,則RSS可能會導致估計和不正確的推論。
儘管RSS可用於評估單個模型的擬合度,但僅使用RSS比較多個模型的擬合可能很困難。這是因為RSS取決於模型中參數的數量。它並不是要將模型與不同數量的參數進行比較。
最後,儘管RSS易於計算和解釋,但它提供了對數據基礎結構的有限洞察力。在了解預測變量與響應變量之間的關係很重要的情況下,可能會有更好的指標可以使用。在某些方面,RSS可以像黑匣子這些關係並不完全知道;只有最終值是最重要的。
特殊考慮
金融市場越來越多地驅動驅動;因此,為了尋找優勢,許多投資者正在使用先進的統計技術來幫助他們的決策。大數據,機器學習和人工智能應用程序進一步需要使用統計特性來指導當代投資策略。剩餘的正方形(或RSS統計)是許多具有文藝復興時期的統計特性之一。
投資者和投資組合經理使用統計模型來跟踪投資的價格並使用該數據來預測未來的變動。這項研究的回歸分析 - 可能涉及分析商品與從事生產商品的公司股票之間的價格變動之間的關係。
快速事實
手工找到剩餘的正方形可能是困難且耗時的。因為它涉及大量減法,平方和總和,所以計算可能容易出現錯誤。因此,您可以決定使用諸如Excel之類的軟件進行計算。
任何模型都可能在預測值和實際結果之間具有差異。儘管差異可能通過回歸分析來解釋,但RSS表示未解釋的差異或錯誤。
由於可以使足夠複雜的回歸函數幾乎密切適應任何數據集,因此需要進一步的研究以確定回歸函數實際上是否有助於解釋數據集的方差。
但是,通常,RSS的較小或較小的值在任何模型中都是理想的選擇,因為這意味著數據集的變化較小。換句話說,平方殘差的總和越低,回歸模型在解釋數據方面越好。
RSS的示例
對於RSS計算的簡單(但冗長)的演示,請考慮一個國家的消費者支出與其之間的眾所周知GDP。以下圖表反映了公開的值消費者支出以及歐盟27個州的國內生產總值。請注意,自從發布以來,此信息可能已經略有變化,但是剩餘的正方形總和仍然有效。
消費者支出與歐盟成員國的GDP | ||
---|---|---|
國家 | 消費者支出 (百萬) |
GDP (百萬) |
奧地利 | 309,018.88 | 433,258.47 |
比利時 | 388,436.00 | 521,861.29 |
保加利亞 | 54,647.31 | 69,889.35 |
克羅埃西亞 | 47,392.86 | 57,203.78 |
賽普勒斯 | 20,592.74 | 24,612.65 |
捷克共和國 | 164,933.47 | 245,349.49 |
丹麥 | 251,478.47 | 356,084.87 |
愛沙尼亞 | 21,776.00 | 30,650.29 |
芬蘭 | 203,731.24 | 269,751.31 |
法國 | 2,057,126.03 | 2,630,317.73 |
德國 | 2,812,718.45 | 3,846,413.93 |
希臘 | 174,893.21 | 188,835.20 |
匈牙利 | 110,323.35 | 155,808.44 |
愛爾蘭 | 160,561.07 | 425,888.95 |
義大利 | 1,486,910.44 | 1,888,709.44 |
拉脫維亞 | 25,776.74 | 33,707.32 |
立陶宛 | 43,679.20 | 56,546.96 |
盧森堡 | 35,953.29 | 73,353.13 |
馬爾他 | 9,808.76 | 14,647.38 |
荷蘭 | 620,050.30 | 913,865.40 |
波蘭 | 453,186.14 | 596,624.36 |
葡萄牙 | 190,509.98 | 228,539.25 |
羅馬尼亞 | 198,867.77 | 248,715.55 |
斯洛伐克共和國 | 83,845.27 | 105,172.56 |
斯洛維尼亞 | 37,929.24 | 53,589.61 |
西班牙 | 997,452.45 | 1,281,484.64 |
瑞典 | 382,240.92 | 541,220.06 |
消費者支出和GDP具有很強的正相關性,並且可以根據消費者支出(CS)來預測一個國家的GDP。使用公式進行最佳擬合線,可以將這種關係近似為:
GDP = 1.3232 x CS + 10447
GDP和消費者支出的單位均以數百萬美元的價格為單位。
對於大多數目的,此公式非常準確,但由於每個國家經濟的個體變化,它並不完美。以下圖表根據上面的公式和世界銀行記錄的實際GDP進行了比較每個國家的預計GDP。
歐盟成員國的預計和實際GDP數字以及殘留的正方形 | ||||
---|---|---|---|---|
國家 | 消費者花費最新價值(數百萬) | GDP最新價值(數百萬) | 預計GDP(基於趨勢線) | 殘留廣場(投影 - 真實)^2 |
奧地利 | 309,018.88 | 433,258.47 | 419,340.782016 | 193,702,038.819978 |
比利時 | 388,436.00 | 521,861.29 | 524,425.52 | 6,575,250.87631504 |
保加利亞 | 54,647.31 | 69,889.35 | 82,756.320592 | 165,558,932.215393 |
克羅埃西亞 | 47,392.86 | 57,203.78 | 73,157.232352 | 254,512,641.947534 |
賽普勒斯 | 20,592.74 | 24,612.65 | 37,695.313568 | 171,156,086.033474 |
捷克共和國 | 164,933.47 | 245,349.49 | 228,686.967504 | 277,639,655.929706 |
丹麥 | 251,478.47 | 356,084.87 | 343,203.311504 | 165,934,549.28587 |
愛沙尼亞 | 21,776.00 | 30,650.29 | 39,261.00 | 74,144,381.8126542 |
芬蘭 | 203,731.24 | 269,751.31 | 280,024.176768 | 105,531,791.633079 |
法國 | 2,057,126.03 | 2,630,317.73 | 2,732,436.162896 | 10,428,174,337.1349 |
德國 | 2,812,718.45 | 3,846,413.93 | 3,732,236.05304 | 13,036,587,587.0929 |
希臘 | 174,893.21 | 188,835.20 | 241,865.695472 | 2,812,233,450.00581 |
匈牙利 | 110,323.35 | 155,808.44 | 156,426.85672 | 382,439.239575558 |
愛爾蘭 | 160,561.07 | 425,888.95 | 222,901.407824 | 41,203,942,278.6534 |
義大利 | 1,486,910.44 | 1,888,709.44 | 1,977,926.894208 | 7,959,754,135.35658 |
拉脫維亞 | 25,776.74 | 33,707.32 | 44,554.782368 | 117,667,439.825176 |
立陶宛 | 43,679.20 | 56,546.96 | 68,243.32 | 136,804,777.364243 |
盧森堡 | 35,953.29 | 73,353.13 | 58,020.393328 | 235,092,813.852894 |
馬爾他 | 9,808.76 | 14,647.38 | 23,425.951232 | 77,063,312.875298 |
荷蘭 | 620,050.30 | 913,865.40 | 830,897.56 | 6,883,662,978.71 |
波蘭 | 453,186.14 | 596,624.36 | 6102.900448 | 181,671,052.608372 |
葡萄牙 | 190,509.98 | 228,539.25 | 262,529.805536 | 1,155,357,865.6459 |
羅馬尼亞 | 198,867.77 | 248,715.55 | 273,588.833264 | 618,680,220.331183 |
斯洛伐克共和國 | 83,845.27 | 105,172.56 | 121,391.061264 | 263,039,783.25037 |
斯洛維尼亞 | 37,929.24 | 53,589.61 | 60,634.970368 | 49,637,102.7149851 |
西班牙 | 997,452.45 | 1,281,484.64 | 1,330,276.08184 | 2,380,604,796.8261 |
瑞典 | 382,240.92 | 541,220.06 | 516,228.185344 | 624,593,798.821215 |
右側的列表示殘差正方形 - 每個投影值及其實際值之間的平方差。這些數字看起來很大,但是對於任何其他可能的趨勢線來說,它們的總和實際上低於RSS。如果另一個線路對於這些數據點具有較低的RSS,則該線將是最佳擬合線路。
平方的殘差總和與R平方相同嗎?
剩餘的正方形總和(RSS)是解釋的絕對量,而R平方是絕對變化量的絕對量,是總變異的比例。
RSS與錯誤估計的總和(SSE)相同嗎?
剩餘的正方形總和(RSS)也稱為誤差估計的總和(SSE)。
平方的殘差和總和總和之間有什麼區別?
正方形總和(TSS)衡量觀察到的數據中有多少變化,而剩餘的正方形總和衡量了觀察到的數據和建模值之間誤差的變化。在統計中,平方的殘差總和和正方形總和(TSS)的值通常相互相比。
剩餘的平方總和可以為零嗎?
平方的殘留總和可以為零。平方的殘差總和越小,您的模型越適合您的數據;平方的殘差總和越大,您的模型越差。零值意味著您的模型非常合適。
底線
平方的殘留總和量化了觀察到的數據點與回歸模型的預測之間的差異,該模型計算為平方殘差的總和。最小化RSS是回歸分析中的一個基本目標,因為它代表了該模型準確捕獲數據變異性的程度。