在 Excel 中創建線性迴歸模型

  |  

什麼是線性迴歸?

線性迴歸是一種數據分析,它考慮因變量與一個或多個自變量之間的線性關係。它通常用於直觀地顯示各種因素之間關係或相關性的強度以及結果的離散性——所有這些都是爲了解釋因變量的行爲。線性迴歸模型的目標是估計變量之間關係的大小以及它是否具有統計顯著性

假設我們想測試冰淇淋的攝入量與肥胖之間的關係強度。我們將冰淇淋的攝入量作爲獨立變量,並將其與肥胖作爲因變量聯繫起來,看看是否存在關係。鑑於迴歸是這種關係的圖形顯示,數據的變異性越低,關係越強,迴歸線的擬合度就越高。

在金融領域,線性迴歸用於確定資產價格與經濟數據之間的關係,應用範圍廣泛。例如,它用於確定Fama-French 模型中的因子權重,並且是確定資本資產定價模型(CAPM) 中股票貝塔係數的基礎。

在這裏,我們研究如何使用導入到 Microsoft Excel 的數據執行線性迴歸以及如何解釋結果。

概要

  • 線性迴歸模擬因變量和自變量之間的關係。
  • 線性迴歸也稱爲普通最小二乘法 (OLS),本質上是估計模型中所有變量之間的最佳擬合線。
  • 如果變量是獨立的,不存在異方差,並且變量的誤差項不相關,則可以認爲迴歸分析是穩健的。
  • 使用數據分析工具庫可以更輕鬆地在 Excel 中建立線性迴歸模型。
  • 迴歸輸出可以解釋爲因變量上一個或多個變量之間的相關性的大小和強度。

重要注意事項

要進行迴歸分析,必須對數據集做出幾個關鍵假設。否則,結果將被錯誤解釋或出現偏差:

  1. 變量必須真正獨立(使用卡方檢驗)。
  2. 數據不能有不同的誤差方差(這稱爲異方差性(也拼寫爲異方差性))。
  3. 每個變量的誤差項必須不相關。 如果不是,則表示變量是序列相關的

如果這三點聽起來很複雜,那確實如此。但如果其中一個考慮因素不成立,就會導致估計有偏差。本質上,你會錯誤地陳述你正在衡量的關係。

在 Excel 中輸出迴歸

在 Excel 中運行迴歸分析的第一步是仔細檢查是否安裝了免費的 Excel 插件數據分析工具庫。此插件使計算一系列統計數據變得非常容易。它不需要繪製線性迴歸線,但它使創建統計表變得更簡單。要驗證是否已安裝,請從工具欄中選擇“數據”。如果“數據分析”是一個選項,則該功能已安裝並可供使用。如果未安裝,您可以通過單擊 Office 按鈕並選擇“Excel 選項”來請求此選項。

使用數據分析工具庫,只需單擊幾下即可創建迴歸輸出。

Excel 中的獨立變量處於 X 範圍內。

假設我們想知道,給定標準普爾 500 指數的回報,我們是否可以估計 Visa ( V )股票回報的強度和關係。Visa (V) 股票回報數據填充第 1 列作爲因變量。標準普爾 500 指數回報數據填充第 2 列作爲自變量。

  1. 從工具欄中選擇“數據”。顯示“數據”菜單。
  2. 選擇“數據分析”。顯示“數據分析 - 分析工具”對話框。
  3. 從菜單中選擇“迴歸”,然後單擊“確定”。
  4. 在迴歸對話框中,單擊“輸入 Y 範圍”框並選擇因變量數據(Visa(V)股票收益)。
  5. 單擊“輸入X範圍”框並選擇獨立變量數據(標準普爾500指數回報)。
  6. 單擊“確定”運行結果。

[注意:如果表格看起來很小,請右鍵單擊圖像並在新選項卡中打開以獲得更高的分辨率。]

解釋結果

使用該數據(與我們的R 平方文章相同),我們得到下表:

R 2值,也稱爲判定係數,用於測量自變量解釋因變量變異的比例,或迴歸模型與數據的擬合程度。R 2值的範圍爲 0 到 1,值越大表示擬合度越高。p 值或概率值的範圍也爲 0 到 1,表示檢驗是否顯著。與 R 2值相比,p 值越小越有利,因爲它表示因變量和自變量之間存在相關性。

解釋結果

這裏的底線是 Visa 股票的變化似乎與標準普爾 500 指數高度相關。

  • 在上面的迴歸輸出中,我們可以看到 Visa 每變化 1 個點,標準普爾 500 指數就會相應變化 1.36 個點。
  • 我們還可以看到 p 值非常小(0.000036),這也對應於非常大的 T 檢驗。這表明這一發現具有高度的統計顯著性,因此這一結果由偶然因素造成的可能性極低。
  • 從 R 平方我們可以看出,僅 V 價格就能解釋標準普爾 500 指數中 62% 以上的波動。

然而,分析師此時可能會出於以下原因而保持謹慎:

  • 由於模型中只有一個變量,因此尚不清楚 V 是否影響標準普爾 500 指數的價格,標準普爾 500 指數是否影響 V 價格,或者某個未觀察到的第三個變量是否影響兩個價格。
  • Visa 是標準普爾 500 指數的成分股,因此這裏的變量之間可能存在相關性。
  • 只有 20 個觀察結果,可能不足以做出正確的推斷。
  • 數據是時間序列,因此也可能存在自相關
  • 所研究的時間段可能不代表其他時間段。

在 Excel 中繪製迴歸圖表

我們可以在 Excel 中通過突出顯示數據並將其繪製爲散點圖來繪製迴歸圖。要添加回歸線,請從“圖表工具”菜單中選擇“佈局”。在對話框中,選擇“趨勢線”,然後選擇“線性趨勢線”。要添加 R 2值,請從“趨勢線”菜單中選擇“更多趨勢線選項”。最後,選擇“在圖表上顯示 R 平方值”。視覺結果總結了關係的強度,儘管其代價是沒有提供上表那麼多細節。

如何解釋線性迴歸?

迴歸模型的輸出將產生各種數值結果。係數(或 beta 值)告訴您其他所有變量保持不變的情況下獨立變量與因變量之間的關聯。如果係數爲 +0.12,則表示該變量每變化 1 個點,因變量就會在同一方向上變化 0.12 個點。如果係數爲 -3.00,則意味着解釋變量變化 1 個點,因變量就會在相反方向上變化 3 倍。

如何知道迴歸是否顯著?

除了產生 beta 係數外,迴歸輸出還將根據每個係數的標準誤差(例如p 值置信區間)指示統計顯著性檢驗。分析師通常使用 0.05 或更小的 p 值來表示顯著性;如果 p 值更大,則不能排除由此產生的 beta 係數的偶然性或隨機性。迴歸模型中的其他顯著性檢驗可以是每個變量的t 檢驗,以及用於模型中所有變量聯合顯著性的 F 統計量或卡方。

如何解釋線性迴歸的 R 平方?

R 2 ( R 平方) 是線性迴歸模型擬合優度的統計量度(從 0.00 到 1.00),也稱爲判定係數。一般而言,R 2越高,模型擬合度越高。R 平方也可以解釋爲因變量的變化中有多少是由模型中的獨立(解釋)變量解釋的。因此,R 平方爲 0.50 表示因變量中觀察到的所有變化中有一半可以由因變量解釋。

推薦閱讀

相關文章

奧馳亞如何賺錢:香菸和雪茄、口服菸草產品和葡萄酒

Altria Group Inc. ( MO ) 是一家控股公司,通過其子公司生產和銷售香菸、機制大雪茄和菸斗菸草,以及溼無煙菸草產品。該公司還擁有一家釀酒商,擁有主要由槓桿租賃組成的金融資產組合,並銷售口服尼古丁袋。奧馳亞旗下的熱門品牌包括萬寶路、Parliament、哥本哈根和 IQOS。

風險調整貼現率快速指南

在分析投資或項目的盈利能力時,現金流折現爲現值,以確保獲取企業的真實價值。通常,這些應用程序中使用的貼現率是市場利率。但是,根據與項目或投資相關的情況,可能需要使用風險調整後的貼現率。關鍵點貼現率考慮了貨幣的時間價值,以將未來賺取的美元與其今天的購買力相稱。

市盈率 (P/E) 如何誤導投資者?

市盈率 (P/E) 的計算方法是將公司的每股股價除以每股收益 (EPS),讓投資者了解股票是否被低估或高估。高市盈率可能表明,與市盈率較低的公司相比,投資者預計未來的盈利增長會更高。市盈率表示投資者可以預期投資於一家公司的美元金額,以便他們可以獲得該公司一美元的收益。

如何使用 Excel 計算相關性?

什麼是相關性?相關性衡量兩個變量之間的線性關係。通過測量和關聯每個變量的方差,相關性可以指示關係的強度。換句話說,相關性回答了這樣一個問題:變量 A(自變量)在多大程度上解釋了變量 B(因變量)?要點相關性是兩個變量之間變化的統計線性對應關係。在金融領域,相關性用於分析的多個方面,包括投資組合標準差的計算。

線性與多元迴歸:有什麼區別?

線性迴歸與多重回歸:概述迴歸分析是金融和投資中常用的統計方法。線性迴歸是迴歸分析中最常用的技術之一。多元迴歸是更廣泛的迴歸類別,包括具有多個解釋變量的線性和非線性迴歸。迴歸作爲一種工具有助於將數據彙集在一起,以幫助人們和公司做出明智的決策。

R 平方與調整 R 平方:有什麼區別?

R 平方與調整後的 R 平方:概述R 平方和調整後的 R 平方可讓投資者衡量共同基金相對於基準的表現。投資者還可以使用它們來計算其投資組合相對於給定基準的表現。在投資領域,R 平方以 0 到 100 之間的百分比表示,100 表示完全相關,0 表示完全不相關。該數字並不表示特定證券組的表現如何。

相關詞條

“只是說不”防禦定義

什麼是“只說不”的辯護? “只說不”防禦是董事會採用的一種策略,通過簡單地拒絕談判和完全拒絕潛在買家可能提供的任何東西來阻止敵意收購。 “只說不”抗辯的合法性可能取決於目標公司是否有其所追求的長期戰略,其中可能包括與提出收購要約的公司以外的公司合併,或者收購要約是否低估公司。

估值定義

什麼是估值?估值是確定資產或公司當前(或預計)價值的分析過程。有許多用於估值的技術。對公司進行估值的分析師會關注企業的管理、資本結構的構成、未來收益的前景以及資產的市場價值等指標。估值中經常使用基本面分析,儘管可能會使用其他幾種方法,例如資本資產定價模型 ( CAPM ) 或股息貼現模型 ( DDM )。

迴歸定義

什麼是迴歸?迴歸是一種用於金融、投資和其他學科的統計方法,它試圖確定一個因變量(通常用 Y 表示)與一系列其他變量(稱爲自變量)之間關係的強度和特徵。迴歸有助於投資和財務經理評估資產並瞭解變量之間的關係,例如商品價格和從事這些商品交易的企業的股票。

殘差平方和 (RSS) 定義

什麼是殘差平方和 (RSS)?殘差平方和 (RSS) 是一種統計技術,用於測量數據集中無法由迴歸模型本身解釋的方差量。相反,它估計殘差或誤差項的方差。線性迴歸是一種有助於確定因變量與一個或多個其他因素(稱爲自變量或解釋變量)之間關係強度的度量。重點摘要殘差平方和 (RSS) 衡量回歸模型的誤差項或殘差的方差水平。

逐步迴歸

什麼是逐步迴歸?逐步迴歸是迴歸模型的逐步迭代構建,其中涉及選擇要在最終模型中使用的自變量。它涉及連續添加或刪除潛在的解釋變量,並在每次迭代後測試統計顯着性。統計軟件包的可用性使得逐步迴歸成爲可能,即使在具有數百個變量的模型中也是如此。關鍵點逐步迴歸是一種迭代檢查線性迴歸模型中每個自變量的統計顯着性的方法。

最小二乘法定義

什麼是最小二乘法?最小二乘法是數學回歸分析的一種形式,用於確定一組數據的最佳擬合線,提供數據點之間關係的直觀演示。每個數據點代表已知自變量和未知因變量之間的關係。要點最小二乘法是一種統計過程,通過最小化繪製曲線中各點的偏移或殘差之和來找到一組數據點的最佳擬合。最小二乘迴歸用於預測因變量的行爲。