什麼是殘差平方和 (RSS)?
殘差平方和 (RSS) 是一種統計技術,用於測量數據集中無法由迴歸模型本身解釋的方差量。相反,它估計殘差或誤差項的方差。
線性迴歸是一種有助於確定因變量與一個或多個其他因素(稱爲自變量或解釋變量)之間關係強度的度量。
重點摘要
- 殘差平方和 (RSS) 衡量回歸模型的誤差項或殘差的方差水平。
- 殘差平方和越小,模型越適合您的數據;殘差平方和越大,您的模型越適合您的數據。
- 值爲零表示您的模型非常適合。
- 投資者和投資組合經理使用統計模型來跟蹤投資價格並使用該數據來預測未來走勢。
- 金融分析師使用 RSS 來估計其計量經濟模型的有效性。
瞭解殘差平方和
一般而言,平方和是迴歸分析中用於確定數據點離散度的統計技術。在迴歸分析中,目標是確定數據系列與可能有助於解釋數據系列是如何生成的函數的擬合程度。平方和用作從數據中找到最適合(變化最小)的函數的數學方法。
RSS 測量模型運行後迴歸函數和數據集之間剩餘的誤差量。較小的 RSS 數字表示非常適合數據的迴歸函數。
RSS,也稱爲殘差平方和,本質上決定了迴歸模型解釋或表示模型中數據的程度。
如何計算殘差平方和
RSS = ∑ n i=1 (y i - f(x i )) 2
在哪裏:
y i = 要預測的變量的第 i個值
f(x i ) = y i的預測值
n = 總和的上限
殘差平方和 (RSS) 與殘差標準誤差 (RSE)
殘差標準誤差 (RSE) 是另一個統計術語,用於描述觀察值與預測值的標準偏差差異,如迴歸分析中的點所示。它是一種擬合優度度量,可用於分析一組數據點與實際模型的擬合程度。
RSE 的計算方法是將 RSS 除以樣本中的觀測數減去 2,然後取平方根:RSE = [RSS/(n-2)] 1/2
特別注意事項
金融市場越來越受數量驅動;因此,爲了尋求優勢,許多投資者正在使用先進的統計技術來幫助他們做出決策。大數據、機器學習和人工智能應用進一步需要使用統計屬性來指導當代投資策略。殘差平方和(或 RSS 統計)是許多正在復興的統計屬性之一。
投資者和投資組合經理使用統計模型來跟蹤投資價格並使用該數據來預測未來走勢。這項稱爲迴歸分析的研究可能涉及分析商品與從事生產該商品的公司股票之間的價格變動關係。
手動查找殘差平方和 (RSS) 可能既困難又耗時。因爲它涉及大量的減法、平方和求和,所以計算很容易出錯。因此,您可能決定使用 Excel 等軟件進行計算。
任何模型都可能在預測值和實際結果之間存在差異。儘管迴歸分析可以解釋方差,但 RSS 表示未解釋的方差或誤差。
由於可以製作足夠複雜的迴歸函數以緊密擬合幾乎任何數據集,因此需要進一步研究以確定迴歸函數實際上是否有助於解釋數據集的方差。
然而,通常情況下,較小或較低的 RSS 值在任何模型中都是理想的,因爲這意味着數據集中的變化較小。換句話說,殘差平方和越低,迴歸模型對數據的解釋越好。
殘差平方和的示例
對於 RSS 計算的簡單(但冗長)演示,請考慮一個國家的消費者支出與其GDP之間衆所周知的相關性。下圖反映了截至 2020 年歐盟 27 個國家公佈的消費者支出和國內生產總值的數值。
歐盟成員國的消費者支出與 GDP | ||
---|---|---|
國家 | 消費支出 (百萬) | 國內生產總值 (百萬) |
奧地利 | 309,018.88 | 433,258.47 |
比利時 | 388,436.00 | 521,861.29 |
保加利亞 | 54,647.31 | 69,889.35 |
克羅地亞 | 47,392.86 | 57,203.78 |
塞浦路斯 | 20,592.74 | 24,612.65 |
捷克共和國 | 164,933.47 | 245,349.49 |
丹麥 | 251,478.47 | 356,084.87 |
愛沙尼亞 | 21,776.00 | 30,650.29 |
芬蘭 | 203,731.24 | 269,751.31 |
法國 | 2,057,126.03 | 2,630,317.73 |
德國 | 2,812,718.45 | 3,846,413.93 |
希臘 | 174,893.21 | 188,835.20 |
匈牙利 | 110,323.35 | 155,808.44 |
愛爾蘭 | 160,561.07 | 425,888.95 |
意大利 | 1,486,910.44 | 1,888,709.44 |
拉脫維亞 | 25,776.74 | 33,707.32 |
立陶宛 | 43,679.20 | 56,546.96 |
盧森堡 | 35,953.29 | 73,353.13 |
馬耳他 | 9,808.76 | 14,647.38 |
荷蘭 | 620,050.30 | 913,865.40 |
波蘭 | 453,186.14 | 596,624.36 |
葡萄牙 | 190,509.98 | 228,539.25 |
羅馬尼亞 | 198,867.77 | 248,715.55 |
斯洛伐克共和國 | 83,845.27 | 105,172.56 |
斯洛文尼亞 | 37,929.24 | 53,589.61 |
西班牙 | 997,452.45 | 1,281,484.64 |
瑞典 | 382,240.92 | 541,220.06 |
消費支出與GDP具有很強的正相關關係,可以根據消費支出(CS)來預測一個國家的GDP。使用最佳擬合線的公式,這種關係可以近似爲:
GDP = 1.3232 x CS + 10447
GDP 和消費者支出的單位都是百萬美元。
這個公式在大多數情況下都非常準確,但由於每個國家經濟的個體差異,它並不完美。下圖比較了根據上述公式預測的每個國家的 GDP 和世界銀行記錄的實際 GDP。
歐盟成員國的預計和實際 GDP 數據,以及殘差平方 | ||||
---|---|---|---|---|
國家 | 消費者支出的最新價值(百萬) | GDP 最新值(百萬) | 預計 GDP(基於趨勢線) | 殘差平方(投影 - 實數)^2 |
奧地利 | 309,018.88 | 433,258.47 | 419,340.782016 | 193,702,038.819978 |
比利時 | 388,436.00 | 521,861.29 | 524,425.52 | 6,575,250.87631504 |
保加利亞 | 54,647.31 | 69,889.35 | 82,756.320592 | 165,558,932.215393 |
克羅地亞 | 47,392.86 | 57,203.78 | 73,157.232352 | 254,512,641.947534 |
塞浦路斯 | 20,592.74 | 24,612.65 | 37,695.313568 | 171,156,086.033474 |
捷克共和國 | 164,933.47 | 245,349.49 | 228,686.967504 | 277,639,655.929706 |
丹麥 | 251,478.47 | 356,084.87 | 343,203.311504 | 165,934,549.28587 |
愛沙尼亞 | 21,776.00 | 30,650.29 | 39,261.00 | 74,144,381.8126542 |
芬蘭 | 203,731.24 | 269,751.31 | 280,024.176768 | 105,531,791.633079 |
法國 | 2,057,126.03 | 2,630,317.73 | 2,732,436.162896 | 10,428,174,337.1349 |
德國 | 2,812,718.45 | 3,846,413.93 | 3,732,236.05304 | 13,036,587,587.0929 |
希臘 | 174,893.21 | 188,835.20 | 241,865.695472 | 2,812,233,450.00581 |
匈牙利 | 110,323.35 | 155,808.44 | 156,426.85672 | 382,439.239575558 |
愛爾蘭 | 160,561.07 | 425,888.95 | 222,901.407824 | 41,203,942,278.6534 |
意大利 | 1,486,910.44 | 1,888,709.44 | 1,977,926.894208 | 7,959,754,135.35658 |
拉脫維亞 | 25,776.74 | 33,707.32 | 44,554.782368 | 117,667,439.825176 |
立陶宛 | 43,679.20 | 56,546.96 | 68,243.32 | 136,804,777.364243 |
盧森堡 | 35,953.29 | 73,353.13 | 58,020.393328 | 235,092,813.852894 |
馬耳他 | 9,808.76 | 14,647.38 | 23,425.951232 | 77,063,312.875298 |
荷蘭 | 620,050.30 | 913,865.40 | 830,897.56 | 6,883,662,978.71 |
波蘭 | 453,186.14 | 596,624.36 | 610,102.900448 | 181,671,052.608372 |
葡萄牙 | 190,509.98 | 228,539.25 | 262,529.805536 | 1,155,357,865.6459 |
羅馬尼亞 | 198,867.77 | 248,715.55 | 273,588.833264 | 618,680,220.331183 |
斯洛伐克共和國 | 83,845.27 | 105,172.56 | 121,391.061264 | 263,039,783.25037 |
斯洛文尼亞 | 37,929.24 | 53,589.61 | 60,634.970368 | 49,637,102.7149851 |
西班牙 | 997,452.45 | 1,281,484.64 | 1,330,276.08184 | 2,380,604,796.8261 |
瑞典 | 382,240.92 | 541,220.06 | 516,228.185344 | 624,593,798.821215 |
右側的列表示殘差平方——每個預測值與其實際值之間的平方差。這些數字看起來很大,但它們的總和實際上低於任何其他可能趨勢線的 RSS。如果不同的線對這些數據點具有較低的 RSS,則該線將是最佳擬合線。
殘差平方和是否與 R 平方相同?
殘差平方和 (RSS) 是解釋變異的絕對量,而 R 平方是變異的絕對量佔總變異的比例。
RSS 是否與誤差平方和 (SSE) 相同?
殘差平方和 (RSS) 也稱爲誤差平方和 (SSE)。
殘差平方和和總平方和有什麼區別?
總平方和 (TSS) 衡量觀測數據中存在多少變化,而殘差平方和衡量觀測數據和建模值之間的誤差變化。在統計學中,殘差平方和和總平方和 (TSS) 的值經常相互比較。
殘差平方和可以爲零嗎?
殘差平方和可以爲零。殘差平方和越小,模型越適合您的數據;殘差平方和越大,您的模型越適合您的數據。值爲零表示您的模型非常適合。