pandas通过皮尔逊积矩线性相关系数(Pearson’s r)计算数据相关性

皮尔逊积矩线性相关系数(Pearson’s r)用于计算两组数组之间是否有线性关联,举个例子:

计算两组数据的线性相关性,就是,b是否随着a的增长而增长,或者随着a的增长而减小,或者两者不相关:

皮尔逊积矩线性相关系数的公式是: (标准化数据a * 标准化数据b).mean()

*注意: 在计算皮尔逊积矩线性相关系数的时候,获取数据标准差时必需添加参数 (ddof=0)

下面以 a b 为例:

结果是1.0,说明是正相关的

修改 a b,查看系数的变化:

a b负相关:

让 a b负相关性低一点

让 a b没有什么相关性:

这里只是随便举几个例子.总之,皮尔逊积矩线性相关系数的范围是-1.0到1.0,如果是正数,就是正相关,负数就是负相关

如果b完全随着a的增加而增加,就是1.0,反之则是-1.0,越接近于0,两者之间的相关性越小

上面这个网站可以查看数据相关性情况和对应的皮尔逊积矩线性相关系数值

Original: https://www.cnblogs.com/liulangmao/p/9293822.html
Author: 诗&远方
Title: pandas通过皮尔逊积矩线性相关系数(Pearson’s r)计算数据相关性

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/9192/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

免费咨询
免费咨询
扫码关注
扫码关注
联系站长

站长Johngo!

大数据和算法重度研究者!

持续产出大数据、算法、LeetCode干货,以及业界好资源!

2022012703491714

微信来撩,免费咨询:xiaozhu_tec

分享本页
返回顶部