什么是方差膨胀因子 (VIF)?
方差膨胀因子 (VIF) 是衡量一组多重回归变量中多重共线性程度的指标。从数学上讲,回归模型变量的 VIF 等于整体模型方差与仅包含该单个独立变量的模型方差之比。此比率针对每个独立变量计算。高 VIF 表示相关独立变量与模型中的其他变量高度共线。
重点
- 方差膨胀因子 (VIF) 衡量了多元回归模型中独立变量之间的多重共线性。
- 检测多重共线性很重要,因为虽然多重共线性不会降低模型的解释能力,但它会降低独立变量的统计显著性。
- 独立变量的方差膨胀因子 (VIF) 较大,表明与其他变量具有高度共线关系,在模型结构和独立变量的选择中应考虑或调整该关系。
了解方差膨胀因子 (VIF)
方差膨胀因子是一种帮助识别多重共线性程度的工具。当人们想要测试多个变量对特定结果的影响时,会使用多元回归。因变量是受独立变量(即模型的输入)影响的结果。当一个或多个独立变量或输入之间存在线性关系或相关性时,就会存在多重共线性。
多重共线性在多元回归中会产生问题,因为输入都会相互影响。因此,它们实际上并不独立,而且很难测试回归模型中独立变量的组合对因变量或结果的影响有多大。
从统计学角度来看,如果多元回归模型存在较高的多重共线性,则更难估计每个独立变量与因变量之间的关系。所用数据或模型方程结构的微小变化都可能导致独立变量的估计系数发生较大且不稳定的变化。
为了确保模型正确指定并正常运行,可以对多重共线性进行测试。方差膨胀因子就是这样一种测量工具。使用方差膨胀因子有助于确定任何多重共线性问题的严重程度,以便调整模型。方差膨胀因子衡量独立变量的行为(方差)受其与其他独立变量的相互作用/相关性影响或膨胀的程度。
方差膨胀因子可以快速衡量变量对回归中标准误差的贡献程度。当存在显著的多重共线性问题时,方差膨胀因子对于所涉及的变量将非常大。确定这些变量后,可以使用多种方法来消除或合并共线变量,从而解决多重共线性问题。
多重共线性
虽然多重共线性不会降低模型的整体预测能力,但它会产生统计上不显著的回归系数估计值。从某种意义上说,它可以被认为是模型中的一种重复计算。
当两个或多个独立变量密切相关或测量几乎相同的事物时,它们测量的潜在效应会在变量之间被考虑两次(或更多次)。很难或不可能说出哪个变量真正影响了独立变量。这是一个问题,因为许多计量经济学模型的目标是准确测试独立变量和因变量之间的这种统计关系。
例如,假设一位经济学家想要检验失业率(独立变量)和通货膨胀率(因变量)之间是否存在统计上的显著关系。如果再添加一些与失业率相关的独立变量(如首次申请失业救济人数),就有可能将多重共线性引入模型中。
总体模型可能显示出强大的、统计上充分的解释力,但无法确定这种影响主要是由于失业率还是新的首次失业救济申请。这就是 VIF 可以检测到的,并且它会建议从模型中删除其中一个变量或找到某种方法来合并它们以捕捉它们的联合效应,具体取决于研究人员想要测试的具体假设。