什麼是方差膨脹因子 (VIF)?
方差膨脹因子 (VIF) 是衡量一組多重迴歸變量中多重共線性程度的指標。從數學上講,迴歸模型變量的 VIF 等於整體模型方差與僅包含該單個獨立變量的模型方差之比。此比率針對每個獨立變量計算。高 VIF 表示相關獨立變量與模型中的其他變量高度共線。
要點
- 方差膨脹因子 (VIF) 衡量了多元迴歸模型中獨立變量之間的多重共線性。
- 檢測多重共線性很重要,因爲雖然多重共線性不會降低模型的解釋能力,但它會降低獨立變量的統計顯著性。
- 獨立變量的方差膨脹因子 (VIF) 較大,表明與其他變量具有高度共線關係,在模型結構和獨立變量的選擇中應考慮或調整該關係。
瞭解方差膨脹因子 (VIF)
方差膨脹因子是一種幫助識別多重共線性程度的工具。當人們想要測試多個變量對特定結果的影響時,會使用多元迴歸。因變量是受獨立變量(即模型的輸入)影響的結果。當一個或多個獨立變量或輸入之間存在線性關係或相關性時,就會存在多重共線性。
多重共線性在多元迴歸中會產生問題,因爲輸入都會相互影響。因此,它們實際上並不獨立,而且很難測試迴歸模型中獨立變量的組合對因變量或結果的影響有多大。
從統計學角度來看,如果多元迴歸模型存在較高的多重共線性,則更難估計每個獨立變量與因變量之間的關係。所用數據或模型方程結構的微小變化都可能導致獨立變量的估計係數發生較大且不穩定的變化。
爲了確保模型正確指定並正常運行,可以對多重共線性進行測試。方差膨脹因子就是這樣一種測量工具。使用方差膨脹因子有助於確定任何多重共線性問題的嚴重程度,以便調整模型。方差膨脹因子衡量獨立變量的行爲(方差)受其與其他獨立變量的相互作用/相關性影響或膨脹的程度。
方差膨脹因子可以快速衡量變量對迴歸中標準誤差的貢獻程度。當存在顯著的多重共線性問題時,方差膨脹因子對於所涉及的變量將非常大。確定這些變量後,可以使用多種方法來消除或合併共線變量,從而解決多重共線性問題。
多重共線性
雖然多重共線性不會降低模型的整體預測能力,但它會產生統計上不顯著的迴歸係數估計值。從某種意義上說,它可以被認爲是模型中的一種重複計算。
當兩個或多個獨立變量密切相關或測量幾乎相同的事物時,它們測量的潛在效應會在變量之間被考慮兩次(或更多次)。很難或不可能說出哪個變量真正影響了獨立變量。這是一個問題,因爲許多計量經濟學模型的目標是準確測試獨立變量和因變量之間的這種統計關係。
例如,假設一位經濟學家想要檢驗失業率(獨立變量)和通貨膨脹率(因變量)之間是否存在統計上的顯著關係。如果再添加一些與失業率相關的獨立變量(如首次申請失業救濟人數),就有可能將多重共線性引入模型中。
總體模型可能顯示出強大的、統計上充分的解釋力,但無法確定這種影響主要是由於失業率還是新的首次失業救濟申請。這就是 VIF 可以檢測到的,並且它會建議從模型中刪除其中一個變量或找到某種方法來合併它們以捕捉它們的聯合效應,具體取決於研究人員想要測試的具體假設。