线性回归与多重回归:概述
回归分析是金融和投资中常用的统计方法。线性回归是回归分析中最常用的技术之一。多元回归是更广泛的回归类别,包括具有多个解释变量的线性和非线性回归。
回归作为一种工具有助于将数据汇集在一起,以帮助人们和公司做出明智的决策。回归中有不同的变量在起作用,包括因变量(您试图理解的主要变量)和自变量(可能对因变量产生影响的因素)。
为了使回归分析起作用,您必须收集所有相关数据。它可以显示在带有 x 轴和 y 轴的图表上。
人们使用回归分析有几个主要原因:
- 预测未来的经济状况、趋势或价值
- 确定两个或多个变量之间的关系
- 了解当另一个变量发生变化时一个变量如何变化
有许多不同类型的回归分析。出于本文的目的,我们将研究两个:线性回归和多元回归。
要点
- 回归分析是金融和投资中常用的统计方法。
- 当只有两个变量时,线性回归是最常用的回归分析技术之一。
- 多元回归是更广泛的回归类别,包括具有多个解释变量的线性和非线性回归。
- 线性回归只有一个自变量影响关系的斜率,而多元回归包含多个自变量。
- 多元回归中的每个自变量都有自己的系数,以确保每个变量的权重适当。
线性回归
也称为简单回归,线性回归建立两个变量之间的关系。线性回归使用直线以图形方式描述,斜率定义一个变量的变化如何影响另一个变量的变化。线性回归关系的 y 截距表示当另一个变量的值为 0 时一个变量的值。
在线性回归中,每个因值都有一个对应的独立变量来驱动其值。例如,在 y = 3x + 7 的线性回归公式中,如果将“x”定义为 2,则“y”只有一种可能的结果。
如果两个变量之间的关系不遵循直线,则可以使用非线性回归代替。线性回归和非线性回归的相似之处在于,它们都跟踪一组变量的特定响应。随着变量之间的关系变得更加复杂,非线性模型具有更大的灵活性和描述非常数斜率的能力。
多重回归
对于数据之间的复杂联系,这种关系可能由不止一个变量来解释。在这种情况下,分析师使用多元回归,试图使用多个自变量来解释因变量。
多元回归分析有两个主要用途。一是根据多个自变量确定因变量。例如,您可能有兴趣根据温度、降雨量和其他自变量确定作物产量。第二个是确定每个变量之间的关系有多强。例如,您可能想知道如果降雨量增加或温度降低,作物产量将如何变化。
多元回归假设每个自变量之间没有很强的关系。它还假设每个自变量和单个因变量之间存在相关性。这些关系中的每一个都经过加权,以通过向每个自变量添加唯一的回归系数来确保更具影响力的自变量驱动因值。
公司不仅可以使用回归分析来了解某些情况,例如为什么客户服务电话正在下降,而且还可以做出前瞻性预测,例如未来的销售数据。
线性回归与多重回归示例
考虑一位分析师,他希望建立公司股票价格的每日变化与交易量的每日变化之间的关系。使用线性回归,分析师可以尝试确定两个变量之间的关系:
股票价格的每日变化 =(系数)(交易量的每日变化)+(y 截距)
如果股票价格在任何交易发生前上涨 0.10 美元,并且每卖出一股股票就上涨 0.01 美元,则线性回归结果为:
每日股价变化 = ($0.01)(每日交易量变化) + $0.10
然而,分析师意识到还有其他几个因素需要考虑,包括公司的市盈率、股息和现行通货膨胀率。分析师可以执行多元回归来确定每个变量对股票价格的影响程度以及影响程度:
每日股价变动 = (系数)(每日成交量变动) + (系数)(公司市盈率) + (系数)(股息) + (系数)(通胀率)
多元线性回归比简单线性回归更好吗?
多元线性回归是比简单线性回归更具体的计算。对于直截了当的关系,简单的线性回归可以很容易地捕捉到两个变量之间的关系。对于需要更多考虑的更复杂的关系,多元线性回归通常更好。
什么时候应该使用多元线性回归?
当多个自变量确定单个因变量的结果时,应使用多元线性回归。在预测更复杂的关系时通常会出现这种情况。
你如何解释多重回归?
多元回归公式具有多个斜率(每个变量一个)和一个 y 截距。除了有多个变量都会影响关系的斜率之外,它的解释与简单的线性回归公式相同。