残差平方和 (RSS) 定义

  |  

什么是残差平方和 (RSS)?

残差平方和 (RSS) 是一种统计技术,用于测量数据集中无法由回归模型本身解释的方差量。相反,它估计残差或误差项的方差。

线性回归是一种有助于确定因变量与一个或多个其他因素(称为自变量或解释变量)之间关系强度的度量。

概要

  • 残差平方和 (RSS) 衡量回归模型的误差项或残差的方差水平。
  • 残差平方和越小,模型越适合您的数据;残差平方和越大,您的模型越适合您的数据。
  • 值为零表示您的模型非常适合。
  • 投资者和投资组合经理使用统计模型来跟踪投资价格并使用该数据来预测未来走势。
  • 金融分析师使用 RSS 来估计其计量经济模型的有效性。

了解残差平方和

一般而言,平方和是回归分析中用于确定数据点离散度的统计技术。在回归分析中,目标是确定数据系列与可能有助于解释数据系列是如何生成的函数的拟合程度。平方和用作从数据中找到最适合(变化最小)的函数的数学方法。

RSS 测量模型运行后回归函数和数据集之间剩余的误差量。较小的 RSS 数字表示非常适合数据的回归函数。

RSS,也称为残差平方和,本质上决定了回归模型解释或表示模型中数据的程度。

如何计算残差平方和

RSS = n i=1 (y i - f(x i )) 2
在哪里:
y i = 要预测的变量的第 i
f(x i ) = y i的预测值
n = 总和的上限

残差平方和 (RSS) 与残差标准误差 (RSE)

残差标准误差 (RSE) 是另一个统计术语,用于描述观察值与预测值的标准偏差差异,如回归分析中的点所示。它是一种拟合优度度量,可用于分析一组数据点与实际模型的拟合程度。

RSE 的计算方法是将 RSS 除以样本中的观测数减去 2,然后取平方根:RSE = [RSS/(n-2)] 1/2

特别注意事项

金融市场越来越受数量驱动;因此,为了寻求优势,许多投资者正在使用先进的统计技术来帮助他们做出决策。大数据、机器学习和人工智能应用进一步需要使用统计属性来指导当代投资策略。残差平方和(或 RSS 统计)是许多正在复兴的统计属性之一。

投资者和投资组合经理使用统计模型来跟踪投资价格并使用该数据来预测未来走势。这项称为回归分析的研究可能涉及分析商品与从事生产该商品的公司股票之间的价格变动关系。

手动查找残差平方和 (RSS) 可能既困难又耗时。因为它涉及大量的减法、平方和求和,所以计算很容易出错。因此,您可能决定使用 Excel 等软件进行计算。

任何模型都可能在预测值和实际结果之间存在差异。尽管回归分析可以解释方差,但 RSS 表示未解释的方差或误差。

由于可以制作足够复杂的回归函数以紧密拟合几乎任何数据集,因此需要进一步研究以确定回归函数实际上是否有助于解释数据集的方差。

然而,通常情况下,较小或较低的 RSS 值在任何模型中都是理想的,因为这意味着数据集中的变化较小。换句话说,残差平方和越低,回归模型对数据的解释越好。

残差平方和的示例

对于 RSS 计算的简单(但冗长)演示,请考虑一个国家的消费者支出与其GDP之间众所周知的相关性。下图反映了截至 2020 年欧盟 27 个国家公布的消费者支出和国内生产总值的数值。

欧盟成员国的消费者支出与 GDP
国家消费支出
(百万)
国内生产总值
(百万)
奥地利309,018.88 433,258.47
比利时388,436.00 521,861.29
保加利亚54,647.31 69,889.35
克罗地亚47,392.86 57,203.78
塞浦路斯20,592.74 24,612.65
捷克共和国164,933.47 245,349.49
丹麦251,478.47 356,084.87
爱沙尼亚21,776.00 30,650.29
芬兰203,731.24 269,751.31
法国2,057,126.03 2,630,317.73
德国2,812,718.45 3,846,413.93
希腊174,893.21 188,835.20
匈牙利110,323.35 155,808.44
爱尔兰160,561.07 425,888.95
意大利1,486,910.44 1,888,709.44
拉脱维亚25,776.74 33,707.32
立陶宛43,679.20 56,546.96
卢森堡35,953.29 73,353.13
马耳他9,808.76 14,647.38
荷兰620,050.30 913,865.40
波兰453,186.14 596,624.36
葡萄牙190,509.98 228,539.25
罗马尼亚198,867.77 248,715.55
斯洛伐克共和国83,845.27 105,172.56
斯洛文尼亚37,929.24 53,589.61
西班牙997,452.45 1,281,484.64
瑞典382,240.92 541,220.06
世界银行,2020。

消费支出与GDP具有很强的正相关关系,可以根据消费支出(CS)来预测一个国家的GDP。使用最佳拟合线的公式,这种关系可以近似为:

GDP = 1.3232 x CS + 10447

GDP 和消费者支出的单位都是百万美元。

这个公式在大多数情况下都非常准确,但由于每个国家经济的个体差异,它并不完美。下图比较了根据上述公式预测的每个国家的 GDP 和世界银行记录的实际 GDP。

欧盟成员国的预计和实际 GDP 数据,以及残差平方
国家消费者支出的最新价值(百万) GDP 最新值(百万)预计 GDP(基于趋势线)残差平方(投影 - 实数)^2
奥地利309,018.88 433,258.47 419,340.782016 193,702,038.819978
比利时388,436.00 521,861.29 524,425.52 6,575,250.87631504
保加利亚54,647.31 69,889.35 82,756.320592 165,558,932.215393
克罗地亚47,392.86 57,203.78 73,157.232352 254,512,641.947534
塞浦路斯20,592.74 24,612.65 37,695.313568 171,156,086.033474
捷克共和国164,933.47 245,349.49 228,686.967504 277,639,655.929706
丹麦251,478.47 356,084.87 343,203.311504 165,934,549.28587
爱沙尼亚21,776.00 30,650.29 39,261.00 74,144,381.8126542
芬兰203,731.24 269,751.31 280,024.176768 105,531,791.633079
法国2,057,126.03 2,630,317.73 2,732,436.162896 10,428,174,337.1349
德国2,812,718.45 3,846,413.93 3,732,236.05304 13,036,587,587.0929
希腊174,893.21 188,835.20 241,865.695472 2,812,233,450.00581
匈牙利110,323.35 155,808.44 156,426.85672 382,439.239575558
爱尔兰160,561.07 425,888.95 222,901.407824 41,203,942,278.6534
意大利1,486,910.44 1,888,709.44 1,977,926.894208 7,959,754,135.35658
拉脱维亚25,776.74 33,707.32 44,554.782368 117,667,439.825176
立陶宛43,679.20 56,546.96 68,243.32 136,804,777.364243
卢森堡35,953.29 73,353.13 58,020.393328 235,092,813.852894
马耳他9,808.76 14,647.38 23,425.951232 77,063,312.875298
荷兰620,050.30 913,865.40 830,897.56 6,883,662,978.71
波兰453,186.14 596,624.36 610,102.900448 181,671,052.608372
葡萄牙190,509.98 228,539.25 262,529.805536 1,155,357,865.6459
罗马尼亚198,867.77 248,715.55 273,588.833264 618,680,220.331183
斯洛伐克共和国83,845.27 105,172.56 121,391.061264 263,039,783.25037
斯洛文尼亚37,929.24 53,589.61 60,634.970368 49,637,102.7149851
西班牙997,452.45 1,281,484.64 1,330,276.08184 2,380,604,796.8261
瑞典382,240.92 541,220.06 516,228.185344 624,593,798.821215
世界银行,2020。

右侧的列表示残差平方——每个预测值与其实际值之间的平方差。这些数字看起来很大,但它们的总和实际上低于任何其他可能趋势线的 RSS。如果不同的线对这些数据点具有较低的 RSS,则该线将是最佳拟合线。

残差平方和是否与 R 平方相同?

残差平方和 (RSS) 是解释变异的绝对量,而 R 平方是变异的绝对量占总变异的比例。

RSS 是否与误差平方和 (SSE) 相同?

残差平方和 (RSS) 也称为误差平方和 (SSE)。

残差平方和和总平方和有什么区别?

总平方和 (TSS) 衡量观测数据中存在多少变化,而残差平方和衡量观测数据和建模值之间的误差变化。在统计学中,残差平方和和总平方和 (TSS) 的值经常相互比较。

残差平方和可以为零吗?

残差平方和可以为零。残差平方和越小,模型越适合您的数据;残差平方和越大,您的模型越适合您的数据。值为零表示您的模型非常适合。

推荐阅读

相关文章

REIT 与房地产基金:有什么区别?

REITs 与房地产基金:概述REIT 是直接投资于创收房地产并像股票一样交易的公司、信托或协会。房地产基金是一种共同基金,主要专注于投资公共房地产公司提供的证券。虽然您可以使用其中任何一种来分散您的投资组合,但需要了解一些关键差异。

如何以股息为生

对于大多数投资者来说,安全和健康的退休是第一要务。许多人的大部分资产都进入了专门用于此目的的账户。但是,一旦您最终退休,靠投资生活可能与为舒适的退休储蓄一样具有挑战性。大多数提款方法要求将债券的利息收入支出和出售股票以支付其余部分相结合。个人理财着名的4% 规则正是基于这一事实。

资本收益和股息如何以不同方式征税

股息是通过投资股票、共同基金或交易所交易基金获得的收入,它们包含在您的附表 B 1040 表格的纳税申报表中。资本收益是资产在购买和出售之间的价值增加量。美国税法分别对股息和短期资本收益以及合格股息和长期资本收益给予了类似的处理。要点赚取股息或资本收益的投资者须就这些收益纳税。

(TVIX) VelocityShares 每日 2 倍 VIX 短期 ETN

VelocityShares Daily 2X VIX Short-Term ETN (TVIX) 是多少? VelocityShares Daily 2X VIX Short-Term ETN (TVIX) 是一种交易所交易票据(ETN),它跟踪CBOE 波动率指数(VIX) 短期期货指数,

股息如何影响股东权益

公司向股东支付现金股利时,其股东权益减去所有已支付股利的总价值;但是,股息的影响会因公司支付的股息种类而异。股票股利对股东权益的影响与现金股利不同。重点摘要公司发行股息作为奖励现有股东和鼓励新投资者购买股票的一种方式。公司可以以现金、公司额外股票或两者结合的形式支付股息。要计算股东权益,请将公司资产负债表上列出的总资产

标准偏差与方差:有什么区别?

标准偏差与方差:概述标准差和方差是两个基本的数学概念,在金融部门的各个部分都有重要的地位,从会计到经济学再到投资。两者都使用一组数字的平均值来衡量数据集中数字的可变性。它们对于帮助确定波动性和回报分布非常重要。但两者之间存在着内在的差异。虽然标准偏差测量方差的平方根,但方差是每个点与平均值的平均值。

相关词条

自动票据交换所 (ACH) 定义

什么是自动票据交换所 (ACH)?自动清算所 (ACH) 网络是自 1974 年以来由前国家自动清算所协会 (NACHA)运营的电子资金转账系统。

零加刻度

什么是零加刻度?零加价或零上涨是一种证券交易,以与前一交易相同的价格运行,但价格高于不同价格的最后一笔交易。例如,如果连续的交易发生在 10 美元、10.01 美元和 10.01 美元,则后面的交易将被视为零加价或零上涨交易,因为它与前一交易的价格相同,但价格高于以不同价格进行的最后一笔交易。

可摊销债券溢价

什么是可分期债券溢价? 可摊销债券溢价是一个税收术语,指的是为债券支付的超出其面值的超额价格。根据债券的类型,保费可以免税,并在债券的整个生命週期内按比例摊销。 重点 作为一个税收术语,可摊销债券溢价是指为债券支付的超额价格(溢价),超过其面值。

EV多重定义

什么是 EBIT/EV 倍数? EBIT/EV 倍数是息税前利润 (EBIT) 除以企业价值(EV) 的简写,是用于衡量公司“收益收益率”的财务比率。以 EBIT/EV 倍数作为收益收益率和价值的代表的概念是由着名的价值投资者兼哥伦比亚商学院教授 Joel Greenblatt 提出的。

股市定义

什么是股市?股票市场泛指交易所和其他进行上市公司股票买卖和发行的场所的集合。此类金融活动是通过制度化的正式交易所(无论是实体的还是电子的)或通过在一套明确的法规下运作的场外交易 (OTC)市场进行的。虽然“股票市场”和“证券交易所”这两个术语经常互换使用,但后者通常包含前者的一个子集。

股息定义

什么是股息?股息是将公司的部分收益分配给公司董事会确定的一类股东。支付股息公司的普通股股东通常有资格