什么是皮尔逊系数?
皮尔逊系数是一种相关系数,表示在相同区间或比率范围内测量的两个变量之间的关系。皮尔逊系数是两个连续变量之间关联强度的度量。
了解皮尔逊系数
为了找到皮尔逊系数(也称为皮尔逊相关系数或皮尔逊积矩相关系数),将两个变量放置在散点图上。变量表示为 X 和 Y。要计算的系数必须具有一定的线性;与线性关系没有任何相似之处的散点图将毫无用处。散点图越接近直线,关联强度越高。在数值上,皮尔逊系数的表示方式与线性回归中使用的相关系数相同,范围从 -1 到 +1。 +1 值是两个或多个变量之间完美正相关的结果。正相关表明两个变量朝同一方向移动。相反,值 -1 表示完美的负关系。负相关表明,随着一个变量的增加,另一个变量会减少;它们是负相关的。零表示没有相关性。
要点
- 皮尔逊系数是表示两个变量(表示为 X 和 Y)之间关系的数学相关系数。
- 皮尔逊系数的范围从+1到-1,+1代表正相关,-1代表负相关,0代表没有关系。
- 皮尔逊系数显示相关性,而不是因果关系。
- 英国数学家和统计学家卡尔·皮尔逊 (Karl Pearson) 因开发了许多统计技术而受到赞誉,包括皮尔逊系数、卡方检验、p 值和线性回归。
皮尔逊系数的好处
对于希望投资组合多元化的投资者来说,皮尔逊系数可能很有用。根据资产对(例如股票-债券、股票-商品、债券-房地产等)或更具体的资产(例如大盘股、小盘股和债务)之间的历史回报散点图进行计算新兴市场股票——将产生皮尔逊系数,以帮助投资者根据风险和回报参数组建投资组合。但请注意,皮尔逊系数衡量的是相关性,而不是因果关系,这意味着一个变量在另一个变量中产生了结果。如果大盘股和小盘股的系数为0.8,则无法知道是什么导致了相对较高的关联强度。
卡尔·皮尔逊是谁?
卡尔·皮尔逊(Karl Pearson,1857-1936)是一位英国学者,在数学和统计学领域做出了多产的贡献。他被认为是现代统计学的主要创始人和优生学的倡导者。除了同名系数之外,皮尔逊还因卡方检验和 p 值等概念以及线性回归和分布分类的发展而闻名。 1911年,培生在伦敦大学学院创建了世界上第一个大学统计系——应用统计系。
1901年,皮尔逊创办了第一份现代统计学杂志《Biometrika》。