多重共線性

  |  

什麼是多重共線性?

多重共線性是指多元迴歸模型中兩個或多個獨立變量之間存在高度相關性。當研究人員或分析師試圖確定每個獨立變量如何最有效地用於預測或理解統計模型中的因變量時,多重共線性可能會導致結果扭曲或誤導。

一般來說,多重共線性會導致更寬的置信區間,從而產生模型中獨立變量效應的可靠性較低的概率。

概要

  • 多重共線性是一個統計概念,其中模型中的幾個獨立變量是相關的。
  • 如果兩個變量的相關係數爲 +/- 1.0,則認爲它們完全共線。
  • 獨立變量之間的多重共線性將導致統計推斷的可靠性降低。
  • 在建立使用兩個或多個變量的多元迴歸模型時,最好使用不相關或重複的獨立變量。
  • 數據集中存在多重共線性會由於標準誤差較大而導致結果的可靠性降低。

理解多重共線性

統計分析師使用多元迴歸模型根據兩個或多個獨立變量的值預測特定因變量的值。因變量有時被稱爲結果、目標或標準變量。

一個例子是多元迴歸模型,它試圖根據市盈率(P/E 比率)、市值、過往表現或其他數據來預測股票收益。股票收益是因變量,而各種財務數據是自變量。

多元迴歸模型中的多重共線性表示共線獨立變量以某種方式相關,儘管這種關係可能是偶然的,也可能不是偶然的。例如,過去的表現可能與市值有關,因爲過去表現良好的股票的市值將會上升。

換句話說,當兩個獨立變量高度相關時,就會存在多重共線性。如果一個獨立變量是根據數據集中的其他變量計算出來的,或者兩個獨立變量提供相似且重複的結果,也會出現多重共線性。

特別注意事項

消除多重共線性問題的最常見方法之一是首先識別共線獨立變量,然後刪除除一個變量之外的所有變量。

也可以通過將兩個或多個共線變量合併爲一個變量來消除多重共線性。然後可以進行統計分析來研究指定的因變量與單個自變量之間的關係。

包含多重共線性的模型的統計推斷可能不可靠。

多重共線性的例子

在投資方面

對於投資而言,在進行技術分析以預測證券(例如股票或商品期貨)未來價格可能變動時,多重共線性是一個常見的考慮因素。

市場分析師應避免使用共線技術指標,因爲這些指標基於非常相似或相關的輸入;它們往往會對價格變動的因變量做出類似的預測。相反,市場分析必須基於明顯不同的獨立變量,以確保他們從不同的獨立分析角度分析市場。

潛在多重共線性問題的一個例子是僅使用幾個相似的指標進行技術分析。

著名技術分析師、布林線指標的創始人約翰·布林格指出:“成功使用技術分析的一條基本規則是避免指標之間的多重共線性。”爲了解決這個問題,分析師避免使用兩個或多個相同類型的技術指標。相反,他們使用一種指標(如動量指標)分析證券,然後使用另一種指標(如趨勢指標)進行單獨分析。

例如,隨機指標相對強弱指數 (RSI)和威廉斯 %R 都是依賴類似輸入的動量指標,並且可能產生類似的結果。在這種情況下,最好刪除所有指標,只留下一個,或者找到一種方法將其中幾個指標合併爲一個指標,同時添加一個不太可能與動量指標高度相關的趨勢指標。

在生物學中

多重共線性在許多其他情況下也存在。其中一個情況就是人類生物學。例如,一個人的血壓與年齡不共線,體重、壓力和脈搏也不共線。

如何檢測多重共線性?

一種稱爲方差膨脹因子(VIF) 的統計技術用於檢測和測量多元迴歸模型中的共線性量。

如何處理多重共線性?

爲了減少模型中發現的多重共線性,可以刪除被確定爲最共線性的特定變量。您還可以嘗試合併或轉換有問題的變量以降低它們的相關性。如果這不起作用或無法實現,可以使用改進的迴歸模型來更好地處理多重共線性,例如嶺迴歸、主成分迴歸或偏最小二乘迴歸。

什麼是完全共線性?

當模型中的兩個獨立變量之間存在精確的 1:1 對應關係時,即存在完全共線性。這可以是 +1.0 或 -1.0 的相關性。

爲什麼多重共線性是一個問題?

多重共線性是一個問題,因爲它會產生不太可靠的迴歸模型結果。這是因爲置信區間越寬(標準誤差越大),迴歸係數的統計顯著性就越低。

推薦閱讀

相關文章

什麼是公司行為?

當一家上市公司發佈 公司行為時,它正在做一些會影響其股價的事情。如果您是股東或考慮購買公司股票,您需要瞭解一項行動將如何影響公司的股票。公司行動還可以告訴您有關公司財務狀況及其短期未來的大量資訊。 例子 公司行為包括股票分割、股息、併購、供股和分拆。所有這些都是通常需要公司董事會批准並得到股東授權的重大決策。

已發行股本與認購股本:有什麼區別?

已發行股本與認購股本:概述股本是指公司通過向公眾投資者出售股票籌集的資金數額。這意味著公司向股東授予公司的少量所有權股份,以換取貨幣投資。股本是股權融資的主要來源,可以通過出售普通股或優先股獲得。普通股是大多數人在談論股票市場時所想到的。普通或普通股東擁有投票權並參與公司的重大決策。

美國價格最高的 5 隻股票

一些最搶手的股票是那些價格不菲的股票。那是因為我們中的許多人將價值等同於價格。價格越高,價值越高,因此公司就越受歡迎。但讓我們面對現實吧,普通投資者可能買不起其中一些公司的股票。這就是為什麼散戶投資者必須知道哪些股票可能因為每股高價而難以交易。還值得注意的是,並非所有經紀人都為其客戶提供購買零股的選擇權。即使公司的股價

線性與多元迴歸:有什麼區別?

線性迴歸與多重回歸:概述迴歸分析是金融和投資中常用的統計方法。線性迴歸是迴歸分析中最常用的技術之一。多元迴歸是更廣泛的迴歸類別,包括具有多個解釋變量的線性和非線性迴歸。迴歸作爲一種工具有助於將數據彙集在一起,以幫助人們和公司做出明智的決策。

有效使用交易指標

許多投資者和活躍交易者使用技術交易指標來幫助識別高概率的交易進入和退出點。大多數交易平臺都提供數百種指標;因此,很容易使用過多的指標或使用效率低下。本文將解釋如何選擇多個指標、如何避免信息過載以及如何優化指標以最有效地利用這些技術分析工具。

R 平方與調整 R 平方:有什麼區別?

R 平方與調整後的 R 平方:概述R 平方和調整後的 R 平方可讓投資者衡量共同基金相對於基準的表現。投資者還可以使用它們來計算其投資組合相對於給定基準的表現。在投資領域,R 平方以 0 到 100 之間的百分比表示,100 表示完全相關,0 表示完全不相關。該數字並不表示特定證券組的表現如何。

相關詞條

賣空規則

什麼是賣空規則?賣空規則是 1938 年至 2007 年間實施的一項交易法規,限制在股票市場價格下跌時賣空股票。重點摘要1938 年至 2007 年間,市場參與者不能在股票下跌時做空股票。美國證券交易委員會 (SEC) 於 2007 年取消了這一禁令,允許在任何價格變動時進行賣空。

堅定的定義和例子

什麼是堅定者? Stalwart 是一個投資術語,由傳奇選股者Peter Lynch推廣,用於描述一家大型、成熟的公司,但仍具有長期增長潛力。林奇使用了幾個標準來確定他將包括在他的投資組合中的中堅力量,以及他指定爲緩慢增長者、快速增長者、週期性和週轉公司的公司。

贖回費

什麼是贖回費?贖回費是從基金出售股票時向投資者收取的費用。該費用也稱爲退出費、擇時費或短線交易費,由基金公司收取,然後加回基金。通常,它僅適用於在指定時間範圍內出售股票的情況。重點摘要贖回費是投資者在指定時間段前出售某些股票時所承擔的費用。收取贖回費後,它會直接返回共同基金,在那裏可以投資於基金的投資組合。

跨欄率定義

什麼是障礙率?最低迴報率是經理或投資者要求的項目或投資的最低回報率。它允許公司就是否進行特定項目做出重要決定。障礙率描述了對當前風險水平的適當補償——風險較高的項目通常比風險較小的項目具有更高的障礙率。爲了確定費率,以下是必須考慮的一些領域:相關風險、資本成本以及其他可能的投資或項目的回報。

賽跑者

什麼是跑步者?跑步者是初級經紀自營商員工的簡稱,他們將交易訂單交付給經紀商的場內交易員以供執行。跑步者通常是入門級職位,會導致職員和最終交易員或經紀人。重點摘要跑步者是證券交易所場內的初級員工,將有關交易的訂單信息傳輸到適當的目的地。雖然場內交易正在讓位於電子市場,但在剩餘的交易場中,跑步者仍然發揮著至關重要的作用。

迴歸定義

什麼是迴歸?迴歸是一種用於金融、投資和其他學科的統計方法,它試圖確定一個因變量(通常用 Y 表示)與一系列其他變量(稱爲自變量)之間關係的強度和特徵。迴歸有助於投資和財務經理評估資產並瞭解變量之間的關係,例如商品價格和從事這些商品交易的企業的股票。