同方差:回归模型中的含义及示例

  |  

什么是同方差?

同方差(也拼作“homoscedastic”)是指回归模型中残差或误差项的方差为常数的情况。也就是说,误差项不会随着预测变量值的变化而发生很大变化。另一种说法是,所有数据点的方差大致相同。

这表明了一定程度的一致性,并且使得通过回归建模和处理数据变得更加容易;然而,缺乏同方差可能表明回归模型可能需要包括额外的预测变量来解释因变量的表现。

重点摘要

  • 当回归模型中误差项的方差为常数时,就会出现同方差性。
  • 如果误差项的方差是同方差的,则模型定义良好。如果方差太大,则模型可能定义不明确。
  • 添加额外的预测变量可以帮助解释因变量的表现。
  • 相反,当误差项的方差不是恒定的时,就会出现异方差。

同方差如何发挥作用

同方差性是线性回归建模的一个假设,这种类型的数据适用于最小二乘法。如果回归线周围的误差方差变化很大,则回归模型可能定义不明确。

同方差性的反义词是异方差性,正如“同质”的反义词是“异质性”。异方差性(也拼作“异方差性”)是指回归方程中误差项的方差不是常数的情况。

特别注意事项

一个简单的回归模型或方程由四个项组成。左侧是因变量。它表示模型试图“解释”的现象。右侧是常数、预测变量和残差或误差项。误差项显示因变量中无法由预测变量解释的变异量。

同方差的例子

例如,假设你想用每个学生花在学习上的时间来解释学生的考试成绩。在这种情况下,考试成绩将是因变量,而学习时间将是预测变量。

误差项表示测试分数中不能用学习时间解释的方差量。如果方差是均匀的,或同方差的,那么就表明该模型可能足以解释测试成绩——用学习时间来解释。

但方差可能是异方差的。误差项数据图可能显示,大量的学习时间与高考试成绩非常接近,但较少的学习时间的考试成绩差异很大,甚至包括一些非常高的分数。

因此,分数的差异不能仅通过一个预测变量(学习时间)来很好地解释。在这种情况下,其他因素可能在起作用,可能需要增强模型才能识别它或它们。

当考虑到方差是预测结果和特定情况的实际结果之间的测量差异时,确定同方差有助于确定哪些因素需要调整以提高准确性。

进一步调查可能会发现,一些学生提前看到了考试答案,或者他们以前参加过类似的考试,因此不需要为这次考试复习。就此而言,结果可能只是学生的考试通过能力水平不同,与他们的学习时间和以前考试的表现无关,无论科目是什么。

为了改进回归模型,研究人员必须尝试其他解释变量,以便更准确地拟合数据。例如,如果一些学生提前看到了答案,那么回归模型将有两个解释变量:学习时间,以及学生是否事先知道答案。

有了这两个变量,测试分数的更多方差就可以得到解释,并且误差项的方差可能具有同方差,这表明该模型定义明确。

异方差性是什么意思?

统计学中的异方差是误差方差。这是样本中至少有一个独立变量的散射依赖性。这意味着可预测变量的标准差是不恒定的。

如何判断回归是否具有同方差性?

您可以通过查看最大方差与最小方差之间的比率来判断回归是否为同方差。如果比率为 1.5 或更小,则回归为同方差。

为什么同方差很重要?

同方差性很重要,因为它可以识别群体中的差异。群体或样本中任何不均匀的方差都会产生扭曲或有偏差的结果,从而使分析不正确或毫无价值。

推荐阅读

相关文章

方形与条纹:有什么区别?

Square (SQ) 和 Stripe 已成为小型和成长型企业的两种流行支付处理服务。 Square 主要专注于面对面支付,而 Stripe 则专为在线交易而设计。随着这些服务的广泛使用,其简单的固定费率支付处理费吸引了知名支持者使用和推广其系统。

制药公司的主要财务比率

制药公司的关键财务比率是什么?在人口老龄化、医疗保健成本上升以及新药和利润丰厚的药物不断开发的时代,制药公司一直是医疗保健行业的佼佼者。寻求投资最好的制药公司的投资者面临着众多可供选择的上市公司。为了做出明智的选择,投资者需要考虑对制药公司的分析和股权评估最有帮助的关键财务比率。

每股收益与每股股息:有什么区别?

每股收益 (EPS) 与每股股息 (DPS):概述每股收益 (EPS) 和每股股息 (DPS) 都反映了公司的盈利能力,但这就是任何相似之处的结束。每股收益是衡量公司每股股票盈利能力的比率。另一方面,每股股息计算公司收益中支付给股东的部分。这两项指标对寻求分解和评估公司盈利能力和前景的投资者都有其用途。

线性与多元回归:有什么区别?

线性回归与多重回归:概述回归分析是金融和投资中常用的统计方法。线性回归是回归分析中最常用的技术之一。多元回归是更广泛的回归类别,包括具有多个解释变量的线性和非线性回归。回归作为一种工具有助于将数据汇集在一起,以帮助人们和公司做出明智的决策。

风险衡量:风险类型及其衡量方法

风险管理是做出投资决策的关键过程。风险管理涉及识别和分析投资风险,并根据投资的预期回报决定是否接受该风险。一些常见的风险衡量标准包括标准差、夏普比率、贝塔值、风险价值 (VaR)、条件风险价值 (CVaR) 和 R 平方。要点风险管理是对投资回报与其风险进行比较的分析,并期望更大程度的风险应该由更高的预期回报来补偿。

R 平方与调整 R 平方:有什么区别?

R 平方与调整后的 R 平方:概述R 平方和调整后的 R 平方可让投资者衡量共同基金相对于基准的表现。投资者还可以使用它们来计算其投资组合相对于给定基准的表现。在投资领域,R 平方以 0 到 100 之间的百分比表示,100 表示完全相关,0 表示完全不相关。该数字并不表示特定证券组的表现如何。

相关词条

董事会(B of D)

什么是董事会(B of D)?董事会(B of D)是公司的管理机构,在上市公司的情况下由股东选举产生,以制定战略和监督管理。董事会通常定期举行会议。每个上市公司都必须有董事会。一些私人公司和非营利组织也有董事会。重点摘要上市公司的董事会由股东选举产生。

大卖场

什么是大卖场?大卖场是结合了百货商店和杂货超市的零售商店。大卖场通常是一个非常大的场所,提供各种各样的产品,例如电器、服装和杂货。大卖场为购物者提供一站式购物体验。这家大卖场背后的理念是在一个屋檐下为消费者提供他们需要的所有商品。

审查定义

什么是审核?审查是在决定推进联合项目之前对个人、公司或其他实体进行彻底调查的过程。背景审查是对潜在员工进行审查的一个例子。一旦审查过程结束,就可以做出明智的招聘决定。经理、投资者和分析师使用这样的流程,通过称为尽职调查的流程来识别有价值的投资。

(权利的)理论价值定义

(权利)的理论价值是多少? (权利的)理论价值是认购权的价值。在直到认购权到期前三天宣布新的权利发行的这段时间(称为兼权利期),权利的价值是具体的,可以很容易地计算出来。要计算权利在其有效窗口内的价值,必须告知投资者认购价格和购买一股股票所需的权利数量。

留存收益定义表

什么是留存收益表?留存收益表(Retained Earning Statement)是一份财务报表,概述了公司在特定时期内留存收益的变化。该报表使用来自其他财务报表的净收入等信息来调节该期间的期初和期末留存收益,并被分析师用来了解如何利用公司利润。留存收益表也称为所有者权益表、权益表或股东权益表。

最小二乘法定义

什么是最小二乘法?最小二乘法是数学回归分析的一种形式,用于确定一组数据的最佳拟合线,提供数据点之间关系的直观演示。每个数据点代表已知自变量和未知因变量之间的关系。要点最小二乘法是一种统计过程,通过最小化绘制曲线中各点的偏移或残差之和来找到一组数据点的最佳拟合。最小二乘回归用于预测因变量的行为。