什麼是同方差?
同方差(也拼作“homoscedastic”)是指回歸模型中殘差或誤差項的方差爲常數的情況。也就是說,誤差項不會隨着預測變量值的變化而發生很大變化。另一種說法是,所有數據點的方差大致相同。
這表明了一定程度的一致性,並且使得通過迴歸建模和處理數據變得更加容易;然而,缺乏同方差可能表明迴歸模型可能需要包括額外的預測變量來解釋因變量的表現。
摘要
- 當迴歸模型中誤差項的方差爲常數時,就會出現同方差性。
- 如果誤差項的方差是同方差的,則模型定義良好。如果方差太大,則模型可能定義不明確。
- 添加額外的預測變量可以幫助解釋因變量的表現。
- 相反,當誤差項的方差不是恆定的時,就會出現異方差。
同方差如何發揮作用
同方差性是線性迴歸建模的一個假設,這種類型的數據適用於最小二乘法。如果迴歸線周圍的誤差方差變化很大,則迴歸模型可能定義不明確。
同方差性的反義詞是異方差性,正如“同質”的反義詞是“異質性”。異方差性(也拼作“異方差性”)是指回歸方程中誤差項的方差不是常數的情況。
特別注意事項
一個簡單的迴歸模型或方程由四個項組成。左側是因變量。它表示模型試圖“解釋”的現象。右側是常數、預測變量和殘差或誤差項。誤差項顯示因變量中無法由預測變量解釋的變異量。
同方差的例子
例如,假設你想用每個學生花在學習上的時間來解釋學生的考試成績。在這種情況下,考試成績將是因變量,而學習時間將是預測變量。
誤差項表示測試分數中不能用學習時間解釋的方差量。如果方差是均勻的,或同方差的,那麼就表明該模型可能足以解釋測試成績——用學習時間來解釋。
但方差可能是異方差的。誤差項數據圖可能顯示,大量的學習時間與高考試成績非常接近,但較少的學習時間的考試成績差異很大,甚至包括一些非常高的分數。
因此,分數的差異不能僅通過一個預測變量(學習時間)來很好地解釋。在這種情況下,其他因素可能在起作用,可能需要增強模型才能識別它或它們。
當考慮到方差是預測結果和特定情況的實際結果之間的測量差異時,確定同方差有助於確定哪些因素需要調整以提高準確性。
進一步調查可能會發現,一些學生提前看到了考試答案,或者他們以前參加過類似的考試,因此不需要爲這次考試複習。就此而言,結果可能只是學生的考試通過能力水平不同,與他們的學習時間和以前考試的表現無關,無論科目是什麼。
爲了改進迴歸模型,研究人員必須嘗試其他解釋變量,以便更準確地擬合數據。例如,如果一些學生提前看到了答案,那麼迴歸模型將有兩個解釋變量:學習時間,以及學生是否事先知道答案。
有了這兩個變量,測試分數的更多方差就可以得到解釋,並且誤差項的方差可能具有同方差,這表明該模型定義明確。
異方差性是什麼意思?
統計學中的異方差是誤差方差。這是樣本中至少有一個獨立變量的散射依賴性。這意味着可預測變量的標準差是不恆定的。
如何判斷迴歸是否具有同方差性?
您可以通過查看最大方差與最小方差之間的比率來判斷迴歸是否爲同方差。如果比率爲 1.5 或更小,則迴歸爲同方差。
爲什麼同方差很重要?
同方差性很重要,因爲它可以識別羣體中的差異。羣體或樣本中任何不均勻的方差都會產生扭曲或有偏差的結果,從而使分析不正確或毫無價值。