斯皮尔曼相关系数和皮尔逊相关系数选择:
1. 连续数据， 正态分布， 线性关系，使用pearson相关系数最为恰当，用spearman相关系数也可以，就是效率没有pearson相关系数高。
2.上述三个条件均满足才能使用pearson相关系数，否则就用spearman相关系数。
3. 定序数据之间也只用spearman相关系数，不能用pearson相关系数。

注：（1）定序数据是指仅仅反映观测对象等级、顺序关系的数据，是由定序尺度计量形成的，表现为类别，可以进行排序，属于品质数据。
例如，对成绩进行排名后，对排名进行数学运算就没有意义了。定序数据最重要的意义代表了一组数据中的逻辑顺序。
（2）斯皮尔曼相关系数的适用条件比皮尔逊相关系数要广，只要数据满足 单调关系（例如线性函数、指数函数、对数函数等）就能够使用。

二、相关系数

1.皮尔逊相关系数（Pearson correlation）

当两个变量都是正态连续变量，且两者之间呈线性关系时，则可以用Pearson来计算相关系数。 取值范围[-1,1]。计算公式如下：

数学建模：相关性分析学习——皮尔逊（pearson）相关系数与斯皮尔曼（spearman）相关系数

从形式上看即为概率论中所学的相关系数。

变量相关强度：

相关程度极强相关强相关中等程度相关弱相关极弱相关或无相关相关系数绝对值0.8——10.6——0.80.4——0.60.2——0.40——0.2

1、线性检验

一般使用 散点图进行线性检验：

import numpy as np
from matplotlib import pyplot as plt

def linear_test():

    #为显示线性关系手动输入的数据
    x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
    y = np.array([1, 1, 3, 4, 3, 6, 5, 7, 9, 8, 9])

    fig = plt.figure()
    ax1 = fig.add_subplot(1, 1, 1)
    ax1.set_title('Linear Test')
    ax1.set_xlabel('X')
    ax1.set_ylabel('Y')
    ax1.scatter(x, y, c='k', marker='.')
    plt.savefig('linear_test.png')

linear_test()

2、正态检验

这里运用到 scipy模块的 kstest方法，具体代码如下：

def normal_test():

    data = np.array([1, 2, 5, 4, 4, 6, 7, 3, 9, 5, 4, 7, 1, 2, 9])
    u = data.mean()
    std = data.std()
    result = stats.kstest(data, 'norm', (u, std))
    print(result)

结果：KstestResult(statistic=0.12726344134326134, pvalue=0.9427504251048978)

结果返回两个值：statistic → D值， pvalue → P值

H0:样本符合
H1:样本不符合
p值>0.05则接受H0，该数据为正态分布。

3、求相关系数

若以上 验证均成功则采取皮尔逊相关系数进行相关性分析：

import pandas as pd

读取数据
df = pd.read_excel('spearman_data.xlsx')
df = pd.DataFrame(df)
print(df)

生成相关性矩阵
rho = df.corr(method='pearson')
print(rho)

对生成的相关系数矩阵进行 可视化操作（生成 热力图）：

def heatmapplot():

    plt.rcParams['font.family'] = ['SimHei']
    plt.rcParams['axes.unicode_minus'] = False
    sns.heatmap(rho, annot=True)
    plt.title('Heat Map', fontsize=18)
    plt.savefig('heatmap1.png', dpi=300)

2、斯皮尔曼相关系数（Spearman correlation）

1、秩相关系数

秩相关系数（Coefficient of Rank Correlation），又称等级相关系数，反映的是两个随机变量的变化趋势方向和强度之间的关联，是将两个随机变量的样本值按数据的大小顺序 排列位次，以各要素样本值的 位次代替实际数据而求得的一种统计量。它是反映等级相关程度的统计分析指标，常用的等级相关分析方法有 Spearman相关系数和Kendall秩相关系数等。主要用于数据分析。斯皮尔曼相关系数被定义成等级变量之间的皮尔逊相关系数。

2、使用条件

数据为非线性或非正态
至少有一组数据为 等级类型，如排名，位次
数据中有 异常值或错误值，斯皮尔曼相关系数对于异常值不太敏感，因为它基于排序位次进行计算，实际数值之间的差异大小对于计算结果没有直接影响

3、求相关系数

较为常用简单的计算公式如下所示：

表示第i个数据对的位次值之差
n 总的观测样本数

使用python求解与上文类似（metho = ‘spearman’）

3、结果对比

两种相关系数的热力图对比：

pearson：

spearman：

可见，对于同组数据，在满足了正态和线性检验的条件下，Pearson所得结果相对于Spearman会更加的精确和严格。

总结

第一次写学习笔记若有错误希望大佬赐教！

球球各位 点个赞。

先行发布，之后会在补充显著性检验等内容。

Original: https://blog.csdn.net/weixin_67565775/article/details/126533149
Author: 美肚鲨ccc
Title: 数学建模：相关性分析学习——皮尔逊（pearson）相关系数与斯皮尔曼（spearman）相关系数

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/669423/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

多级小波分解网络：可解释的时间序列分析

文章信息本周阅读的论文是题目为《Multilevel Wavelet Decomposition Network for Interpretable Time Series An…

人工智能 2023年7月13日
0067
Matlab数字图像处理 02 灰度变化（图像直方图、直方图均衡化、直方图匹配）

第二章灰度变化 2.1 图像的亮度、对比度和动态范围 * 2.1.1 亮度 2.1.2 对比度 2.1.3 动态范围 2.2 线性灰度变换 * 2.2.1 具有饱和处理的线性灰度…

人工智能 2023年6月17日
0063
鲁棒性的含义以及如何提高模型的鲁棒性

1、含义鲁棒是Robust的音译，也就是健壮和强壮的意思。它也是在异常和危险情况下系统生存的能力。比如说，计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下，能否不死机、不…

人工智能 2023年6月23日
0091
记录Win10正确安装CUDA和cuDNN的过程（记录一些坑）

目录前言 CUDA安装 * 直接安装（失败）根据驱动程序版本对照安装（失败）重新安装驱动程序（失败）再次安装CUDA（失败）安装CUDA 10.2（成功） cuDNN安装…

人工智能 2023年5月25日
0071
【只需2步快速解决tensorflow-hub的调用问题】

再经历无数次试错之后，终于可以跑tensorflow-hub了，在此写出来，让大家少走弯路。 1、用pip安装库首先一定要用 pip来安装如下的包。（原因：text包需要用pip…

人工智能 2023年5月23日
0053
基于BP神经网络、kmeans聚类和HC模型的火焰特征数据识别算法matlab仿真

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月31日
0071
Linux网络编程10——libevent库

目录一、介绍、下载、解压和安装 1.1 libevent 库简介 1.2 下载 1.3 解压 1.4 源码包安装二、libevent 框架 2.1 流程 2.2 分析 hell…

人工智能 2023年6月28日
0083
算法 | A*算法实现最优路径规划

启发式探索是利用问题拥有的启发信息来引导搜索，达到减少探索范围、降低问题复杂度的目的。A*寻路算法是启发式探索的一个典型实践，在寻路搜索的过程中，给每个节点绑定了一个估计值(即启发…

人工智能 2023年7月4日
0053
聚类算法——基于密度的聚类算法DBSCAN

1.DBSCAN算法名词概念邻域（Eps）：以给定对象为圆心，半径内的区域为该对象的邻域核心对象：对象的邻域内至少有MinPts（设定的阈值）个对象，则该对象为核心对象边界对…

人工智能 2023年6月15日
0064
解决Error:Kotlin: Module was compiled with an incompatible version of Kotlin. The binary version of ..

文章目录 1. 问题 2. 分析问题 3. 升级kotlin插件版本 * 3.1 升级方法1 3.1 升级方法2 4. 其他问题 * 4.1 方法1中的Cannot downloa…

人工智能 2023年5月30日
0068
Opengl入门基础-基础知识

通过之前的教程，我们已经拥有了开发环境，但是在真正开发程序之前，我们首先了解下Opengl的基本概念。 Opengl是什么？通常网上会说Opengl是一种规范，一种接口，但是这种…

人工智能 2023年6月18日
0068
JS新年倒计时

✅作者简介：热爱国学的Java后端开发者，修心和技术同步精进。🍎个人主页：Java Fans的博客🍊个人信条：不迁怒，不贰过。小知识，大智慧。💞当前专栏：前端案例分享专栏✨特色专栏…

人工智能 2023年7月29日
0056
findContours函数详细解析

1: image, cnts, hierarchy = cv2.findContours(a,b,c)//寻找图&…

人工智能 2023年7月19日
0047
机器学习之分类模型评估指标及sklearn代码实现

文章目录前言 Accuracy（准确率）、Recall（召回率）、Precision（精确率）、 F1评分（F1-Score） * Accuracy（准确率） Recall（召回…

人工智能 2023年6月30日
0082
ORB特征点提取与均匀化——ORBSLAM2源码讲解（一）

文章目录前言一、基础知识二、ORB特征均匀化策略对性能的影响三、ORB特征金字塔四、ORB提取扩展图像五、ORB特征均匀化总结 ; 前言本博客结合哔哩大学视频ORB…

人工智能 2023年7月19日
0046
机器学习（第三章）3.3对数几率回归

机器学习（第三章）3.3对数几率回归 1、对数几率回归的机器学习三要素 1.模型：根据具体问题，确定假设空间——此篇为线性模型，输出值范围为[0,1]，为近似阶跃的单调可微函数； …

人工智能 2023年6月17日
0065

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

数学建模：相关性分析学习——皮尔逊（pearson）相关系数与斯皮尔曼（spearman）相关系数

1、什么是相关性分析

2、什么是相关系数

3、适用范围比较

1.皮尔逊相关系数（Pearson correlation）

1、线性检验

2、正态检验

3、求相关系数

2、斯皮尔曼相关系数（Spearman correlation）

1、秩相关系数

2、使用条件

3、求相关系数

3、结果对比

大家都在看