什么是最佳拟合线
最佳拟合线是指通过数据点散点图的一条线,最能表达这些点之间的关系。统计学家通常使用最小二乘法来得出直线的几何方程,通过手动计算或回归分析软件。一条直线将来自两个或多个自变量的简单线性回归分析。在某些情况下,涉及多个相关变量的回归会产生曲线。
最佳拟合线的基础知识
最佳拟合线是回归分析最重要的输出之一。回归是指对一个或多个自变量与结果因变量之间关系的定量测量。回归适用于从科学和公共服务到财务分析等广泛领域的专业人士。
为了进行回归分析,统计学家收集一组数据点,每个数据点都包括一组完整的因变量和自变量。例如,因变量可以是公司的股票价格,而自变量可以是标准普尔 500指数和全国失业率,假设该股票未在标准普尔 500 指数中列出。样本集可以是这些中的每一个过去 20 年的三个数据集。
在图表上,这些数据点将显示为散点图,一组点可能会或可能不会沿任何线组织。如果线性图案很明显,则可以绘制一条最佳拟合线,以最小化这些点与该线的距离。如果在视觉上没有明显的组织轴,回归分析可以基于最小二乘法生成一条线。此方法构建的线使每个点与最佳拟合线的平方距离最小。
为了确定这条线的公式,统计学家将过去 20 年的这三个结果输入到回归软件应用程序中。该软件生成一个线性公式,表达标准普尔 500 指数、失业率和相关公司股价之间的因果关系。这个方程是最佳拟合线的公式。它是一种预测工具,为分析师和交易员提供了一种基于这两个独立变量来预测公司未来股价的机制。
最佳拟合方程线及其分量
具有两个自变量的回归(例如上面讨论的示例)将产生具有以下基本结构的公式:
y= c + b 1 (x 1 ) + b 2 (x 2 )
在这个方程中,y 是因变量,c 是常数,b 1是第一个回归系数,x 1是第一个自变量。第二个系数和第二个自变量是b 2和x 2 。从上面的例子中可以看出,股票价格为 y,标准普尔 500 指数为 x 1 ,失业率为 x 2 。每个自变量的系数表示该变量中每个附加单元的 y 变化程度。如果标准普尔 500 指数上涨 1,则所得 y 或股价将上涨系数的数量。第二个自变量失业率也是如此。在具有一个自变量的简单回归中,该系数是最佳拟合线的斜率。在此示例或具有两个自变量的任何回归中,斜率是两个系数的混合。常数 c 是最佳拟合线的 y 截距。
摘要
- 最佳拟合线用于在不同数据点的散点图中表达关系。
- 它是回归分析的输出,可用作指标和价格走势的预测工具。