方差膨胀因子 (VIF)

  |  

什么是方差膨胀因子 (VIF)?

方差膨胀因子 (VIF) 是衡量一组多重回归变量中多重共线性程度的指标。从数学上讲,回归模型变量的 VIF 等于整体模型方差与仅包含该单个独立变量的模型方差之比。此比率针对每个独立变量计算。高 VIF 表示相关独立变量与模型中的其他变量高度共线。

重点

  • 方差膨胀因子 (VIF) 衡量了多元回归模型中独立变量之间的多重共线性。
  • 检测多重共线性很重要,因为虽然多重共线性不会降低模型的解释能力,但它会降低独立变量的统计显著性。
  • 独立变量的方差膨胀因子 (VIF) 较大,表明与其他变量具有高度共线关系,在模型结构和独立变量的选择中应考虑或调整该关系。

了解方差膨胀因子 (VIF)

方差膨胀因子是一种帮助识别多重共线性程度的工具。当人们想要测试多个变量对特定结果的影响时,会使用多元回归。因变量是受独立变量(即模型的输入)影响的结果。当一个或多个独立变量或输入之间存在线性关系或相关性时,就会存在多重共线性。

多重共线性在多元回归中会产生问题,因为输入都会相互影响。因此,它们实际上并不独立,而且很难测试回归模型中独立变量的组合对因变量或结果的影响有多大。

从统计学角度来看,如果多元回归模型存在较高的多重共线性,则更难估计每个独立变量与因变量之间的关系。所用数据或模型方程结构的微小变化都可能导致独立变量的估计系数发生较大且不稳定的变化。

为了确保模型正确指定并正常运行,可以对多重共线性进行测试。方差膨胀因子就是这样一种测量工具。使用方差膨胀因子有助于确定任何多重共线性问题的严重程度,以便调整模型。方差膨胀因子衡量独立变量的行为(方差)受其与其他独立变量的相互作用/相关性影响或膨胀的程度。

方差膨胀因子可以快速衡量变量对回归中标准误差的贡献程度。当存在显著的多重共线性问题时,方差膨胀因子对于所涉及的变量将非常大。确定这些变量后,可以使用多种方法来消除或合并共线变量,从而解决多重共线性问题。

多重共线性

虽然多重共线性不会降低模型的整体预测能力,但它会产生统计上不显著的回归系数估计值。从某种意义上说,它可以被认为是模型中的一种重复计算。

当两个或多个独立变量密切相关或测量几乎相同的事物时,它们测量的潜在效应会在变量之间被考虑两次(或更多次)。很难或不可能说出哪个变量真正影响了独立变量。这是一个问题,因为许多计量经济学模型的目标是准确测试独立变量和因变量之间的这种统计关系。

例如,假设一位经济学家想要检验失业率(独立变量)和通货膨胀率(因变量)之间是否存在统计上的显著关系。如果再添加一些与失业率相关的独立变量(如首次申请失业救济人数),就有可能将多重共线性引入模型中。

总体模型可能显示出强大的、统计上充分的解释力,但无法确定这种影响主要是由于失业率还是新的首次失业救济申请。这就是 VIF 可以检测到的,并且它会建议从模型中删除其中一个变量或找到某种方法来合并它们以捕捉它们的联合效应,具体取决于研究人员想要测试的具体假设。

推荐阅读

相关文章

您需要了解的有关就业报告的内容

劳工统计局 (BLS)在每个月的第一个星期五东部时间上午 8:30 发布就业情况摘要,也称为就业或工作报告。该报告基于家庭当前人口调查和雇主当前就业统计调查。它估计了经济中的就业人数和失业人数,以及他们上个月的工作小时数,以及无数相关数据。该数据令人广泛期待。

线性与多元回归:有什么区别?

线性回归与多重回归:概述回归分析是金融和投资中常用的统计方法。线性回归是回归分析中最常用的技术之一。多元回归是更广泛的回归类别,包括具有多个解释变量的线性和非线性回归。回归作为一种工具有助于将数据汇集在一起,以帮助人们和公司做出明智的决策。

如何使用 Excel 计算相关性?

什么是相关性?相关性衡量两个变量之间的线性关系。通过测量和关联每个变量的方差,相关性可以指示关系的强度。换句话说,相关性回答了这样一个问题:变量 A(自变量)在多大程度上解释了变量 B(因变量)?要点相关性是两个变量之间变化的统计线性对应关系。在金融领域,相关性用于分析的多个方面,包括投资组合标准差的计算。

风险衡量:风险类型及其衡量方法

风险管理是做出投资决策的关键过程。风险管理涉及识别和分析投资风险,并根据投资的预期回报决定是否接受该风险。一些常见的风险衡量标准包括标准差、夏普比率、贝塔值、风险价值 (VaR)、条件风险价值 (CVaR) 和 R 平方。要点风险管理是对投资回报与其风险进行比较的分析,并期望更大程度的风险应该由更高的预期回报来补偿。

R 平方与调整 R 平方:有什么区别?

R 平方与调整后的 R 平方:概述R 平方和调整后的 R 平方可让投资者衡量共同基金相对于基准的表现。投资者还可以使用它们来计算其投资组合相对于给定基准的表现。在投资领域,R 平方以 0 到 100 之间的百分比表示,100 表示完全相关,0 表示完全不相关。该数字并不表示特定证券组的表现如何。

在 Excel 中创建线性回归模型

什么是线性回归?线性回归是一种数据分析,它考虑因变量与一个或多个自变量之间的线性关系。它通常用于直观地显示各种因素之间关系或相关性的强度以及结果的离散性——所有这些都是为了解释因变量的行为。线性回归模型的目标是估计变量之间关系的大小以及它是否具有统计显著性。假设我们想测试冰淇淋的摄入量与肥胖之间的关系强度。

相关词条

硬通货:它是什么、如何运作、替代品

什么是硬通货?硬钱最初是指金属货币的物理属性,与纸币不同,硬钱是由坚硬的物质制成的。这就是英语口语表达“冷硬现金”的由来。 “硬”金属硬币和“软”纸币之间的区别在于,金属硬币是实心的物理代币,具有独立于其货币地位的内在经济价值。而纸质法定货币仅代表在赎回时以实物货币支付给持有人的承诺。

社会经济学定义

什么是社会经济学?社会经济学研究社会情绪及其对社会态度和行为的影响。更具体地说,它试图了解社会情绪如何调节政治、流行文化、金融市场和经济等领域社会行为的整体基调和特征。社会经济学理论认为,领导人及其政策实际上无力改变社会情绪,他们的行为总体上表达了社会情绪,而不是调节社会情绪。

后悔理论:意义、心理学、应用

什么是后悔理论?后悔理论指出,如果人们做出错误的选择,人们就会预期会后悔,并且他们在做决定时会考虑这种预期。对后悔的恐惧可以在阻止某人采取行动或激励某人采取行动方面发挥重要作用。后悔理论会影响投资者的理性行为,削弱他们做出对他们有利而不是有害的投资决策的能力。

1987 年股市崩盘的定义

什么是 1987 年的股市崩盘? 1987 年的股市崩盘是 1987 年 10 月下旬在几天内发生的美国股票价格迅速而严重的下跌。虽然崩盘起源于美国,但该事件影响了世界上所有其他主要股市。在 1987 年崩盘前的五年中,道琼斯工业平均指数 ( DJIA ) 上涨了两倍多。

国际清算银行 (BIS)

什么是国际清算银行(BIS)?国际清算银行 (BIS) 是一家为各国中央银行提供银行服务的国际金融机构,也是讨论货币和监管政策的论坛。由 63 个国家中央银行拥有的国际清算银行也提供独立的经济分析。重点摘要BIS 充当货币政策讨论的论坛,并促进中央银行的金融交易。

多重共线性

什么是多重共线性?多重共线性是指多元回归模型中两个或多个独立变量之间存在高度相关性。当研究人员或分析师试图确定每个独立变量如何最有效地用于预测或理解统计模型中的因变量时,多重共线性可能会导致结果扭曲或误导。一般来说,多重共线性会导致更宽的置信区间,从而产生模型中独立变量效应的可靠性较低的概率。