Scikit-learn库中，回归性能评估所用的score函数含义详解

2023年6月16日下午9:06 • 人工智能 • 阅读 48

一.LinearRegression().score方法

关于LinearRegression().score(self, X, y, sample_weight=None)方法，官方描述为：
Returns the coefficient of determination R^2 of the prediction.

The coefficient R^2 is defined as (1 − (u)/(v)), where u is the residual sum of squares ((y_true – y_pred) 2).sum() and v is the total sum of squares ((y_true – y_true.mean()) 2).sum(). The best possible score is 1.0 and it can be negative (because the model can be arbitrarily worse). A constant model that always predicts the expected value of y, disregarding the input features, would get a R2 score of 0.0.

其返回值为决定系数R^2，计算公式为：

其中u的计算公式为：

RSS为residual sum of squares即残差平方和。
其中v的计算公式为：

TSS为total sum of squares，即总体平方差
其中，

是实际的观察值，

是模型预测的输出值。 Scikit-learn库中，回归性能评估所用的score函数含义详解

是表示的是所有观察值的均值。

; 二.决定系数

在统计学中， 决定系数反映了因变量y 的波动，有多少百分比能被自变量x（用机器学习的术语来说， x 就是特征）的波动所描述。简单来说，该参数可以用来判断统计模型对数据的拟合能力（或说服力）。

于是，回归残差(residual)可定义为：

图1. 残差示意图

那么， 平均观察值可定义为:

于是， 总体离差平方和(Sum of Squares for total，亦简称SST)为：

回归平方和(Sum of Squares for regression，简称亦SSR)为：

请注意公式（3）和公式（4）的差别。
其中，

是实际的观察值，

是模型预测的输出值。

是表示的是公式（2）呈现的均值。

也可写为

也就是说，

图2. 决定系数示意图

如图2所示，线性回归（右侧子图）的拟合效果很好，蓝色方块的边长代表残差大小，蓝色方块的面积就是残差的平方，很显然，蓝色方块越小，残差就越小，说明拟合的效果越棒！

反之，R²的值越小，说明拟合程度越差。
对于R2我们需要注意:
1.R2 -般用在线性模型中(虽然非线性模型总也可以用)
2. R2不能完全反映模型预测能力的高低

对拟合效果打分的，具体方法是，在性能评估模块中，通过一个叫做score()函数实现的，请参考下面的范例。

三.预测糖尿病实例（使用拟合度评估）

在下面的范例中，我们将分别查看在训练集和测试集中的决定系数。

我们使用皮马印第安人糖尿病数据集(pima Indians Diabetes Data Set)测试。这也是Scikit-learn中一个内置的经典数据集。

在该数据集中，包括442个病人的生理数据及一年以后的病情发展情况。

数据集中的特征值总共10项：年龄、性别、体质指数、血压、s1~s6（6种血清的化验数据）。但需要注意的，以上的数据是经过预处理， 10个特征都做了归一化处理。

第11项数据，是我们的要预测的目标值，一年疾后的病情定量测量，它是一个连续的实数值，符合线性回归模型评估的范畴。

我们可以利用sklearn的常用操作来了解这个数据集合的更多信息。在成功安装Scikit-Learn软件包，只用如下指令即可完成数据的加载：

from sklearn.datasets import load_diabetes
pima = load_diabetes()
print(pima.keys())

运行上述代码，得到结果是：

dict_keys([‘data’, ‘target’, ‘frame’, ‘DESCR’, ‘feature_names’, ‘data_filename’, ‘target_filename’])

需要指出的是，在Scikit-Learn中，所有内置数据集都有data, target, frame, DESCR, feature_names这5个关键字（key），其中，data并不是泛指数据，而是在狭义上指除标签之外的特征数据，针对pima数据集，它指的是前面的10个特征值。
【输出结果】

[[ 0.03807591 0.05068012 0.06169621 … -0.00259226 0.01990842
-0.01764613]
[-0.00188202 -0.04464164 -0.05147406 … -0.03949338 -0.06832974
-0.09220405]
[ 0.08529891 0.05068012 0.04445121 … -0.00259226 0.00286377
-0.02593034]
…

[ 0.04170844 0.05068012 -0.01590626 … -0.01107952 -0.04687948
0.01549073]
[-0.04547248 -0.04464164 0.03906215 … 0.02655962 0.04452837
-0.02593034]
[-0.04547248 -0.04464164 -0.0730303 … -0.03949338 -0.00421986
0.00306441]]

如果我们想输出第一条数据的第三个特征，就用
即可完成数据的输出：

print(pima.data[0][2])

【输出结果】

0.0616962065186885

如果对这个数据集合比较陌生，或许你想知道，data数据集合中的每条数据都有10个特征，它们分别是什么意思呢？这里我们可以用输出feature_names这个关键字来看看它们的含义：

print(pima.feature_names)

【输出结果】

[‘age’, ‘sex’, ‘bmi’, ‘bp’, ‘s1’, ‘s2’, ‘s3’, ‘s4’, ‘s5’, ‘s6’]

言归正转。下面我们用这个数据集来评估一下线性回归在训练集合和测试集合的『决定系数』，从而在某种程度上推断，拟合的模型是否过拟合了。

from sklearn.datasets import load_diabetes
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
import numpy as np
from sklearn.metrics import r2_score

X, y = load_diabetes().data, load_diabetes().target

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state = 0)

LR = LinearRegression()
performance = LR.fit(X_train, y_train)

y_pred_train = LR.predict(X_train)
y_pred_test = LR.predict(X_test)

print("训练集合上R^2 = {:.3f}".format(performance.score(X_train, y_train)))
print("测试集合上R^2 = {:.3f} ".format(performance.score(X_test, y_test)))

print("训练集合上R^2 = {:.3f}".format(r2_score(y_train, y_pred_train)))
print("测试集合上R^2 = {:.3f} ".format(r2_score(y_test,y_pred_test)))

np.set_printoptions(precision=3, suppress=True)

print('w0 = {0:.3f}'.format(LR.intercept_))
print('W = {}'.format(LR.coef_))

训练集合上R^2 = 0.555
测试集合上R^2 = 0.359
训练集合上R^2 = 0.555
测试集合上R^2 = 0.359
w0 = 153.068
W = [ -43.268 -208.671 593.398 302.898 -560.277 261.477 -8.833 135.937
703.227 28.348]

在本例中，我们利用了Scikit-learn中的普通线性规划模型。从运行结果可以看出，训练集合的拟合优度R2（0.555）高于测试集合（0.359），这是符合预期的。

简单来说，R2→1模型的数据拟合性就越好，反之，R2→0，表明模型的数据拟合度越差。

但如果测试集合和训练集合这二者的R2值差别如果过大，则我们有理由怀疑，训练出来的模型存在一定程度上的过拟合。

此外，我们还可以看到，在模型的评估部分，在训练集合上，performance.score(X_train, y_train))和r2_score(y_train, y_pred_train))的输出结果是一致的。在测试结合上，亦是如此。

这表明，Scikit-learn框架中，性能评估的分数(Score)，其实使用的就是『决定系数』

四.回归任务中常用的其他的性能指标

除了R^2外，回归任务中常用的性能度量有均方误差（Mean Squared Error即MSE），均方根误差(Root Mean Squared Error即RMSE)，平均绝对值误差(Mean Absolute Error即MAE)
1)均方误差
均方误差是各数据偏离真实值差值的平方和的平均数，也就是误差平方和的平均数，其计算公式如下：

2)均方根误差
RMSE，全称是Root Mean Square Error，即均方根误差，它其实就是均方误差的开方。它表示预测值和观测值之间差异（称为残差）的样本标准差。均方根误差为了说明样本的离散程度。做非线性拟合时,RMSE越小越好。

标准差与均方根误差的区别：

标准差是用来衡量一组数自身的离散程度，而均方根误差是用来衡量观测值同真值之间的偏差，它们的研究对象和研究目的不同，但是计算过程类似。
均方根误差算的是观测值与其真值，或者观测值与其模拟值之间的偏差，而不是观测值与其平均值之间的偏差。
其计算公式为：

3)平均绝对值误差
MAE，全称是Mean Absolute Error，即平均绝对值误差，它表示预测值和观测值之间绝对误差的平均值。
MAE是一种线性分数，所有个体差异在平均值上的权重都相等，比如，10和0之间的绝对误差是5和0之间绝对误差的两倍。但这对于RMSE而言不一样，后续的例子将进一步详细讨论。MAE很容易理解，因为它就是对残差直接计算平均，而RMSE相比MAE，会对高的差异惩罚更多。
其计算公式为：

实例讲解
让我们通过两个例子来理解一下：

案例1：真实值= [2,4,6,8]，预测值= [4,6,8,10]
案例2：真实值= [2,4,6,8]，预测值= [4,6,8,12]
案例1的MAE = 2.0，RMSE = 2.0
案例2的MAE = 2.5，RMSE = 2.65

从上述例子中，我们可以发现RMSE比MAE更加多地惩罚了最后一项预测值。通常，RMSE要大于或等于MAE。等于MAE的唯一情况是所有残差都 相等或都为零，如案例1中所有的预测值与真实值之间的残差皆为2，那么MAE和RMSE值就相等。
一般遵守的准则
尽管RMSE更复杂且偏向更高的误差，它仍然是许多模型的默认度量标准，因为用RMSE来定义损失函数是平滑可微的，且更容易进行数学运算。

参考网址：
https://zhuanlan.zhihu.com/p/67706712
https://www.cnblogs.com/jiangkejie/p/10677858.html
https://blog.csdn.net/wydbyxr/article/details/82894256

Original: https://blog.csdn.net/m0_48520385/article/details/119354081
Author: wenlish
Title: Scikit-learn库中，回归性能评估所用的score函数含义详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/626613/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

B44 – 基于stm32蓝牙智能语音识别分类播报垃圾桶

文章目录任务效果原理图指令编码语音识别模块 * 简介代码设计驱动舵机模块 * 简介驱动主程序源代码任务题目:基于stm32蓝牙智能语音识别分类播报垃圾桶实现…

人工智能 2023年5月27日
0067
遥感目标检测数据集

遥感目标检测数据集目标检测（Object Detection）的任务是找出图像中所有感兴趣的目标（物体），确定它们的类别和位置，是计算机视觉领域的核心问题之一。由于各类物体有不同…

人工智能 2023年7月21日
0077
如何用matlab的CurveFitting拟合复杂特定公式的二维数据

今天分享一个如何用 CurveFitting拟合一个由五万多个数据组成的特定公式的曲线首先打开一个在桌面上名为 laohua.xlsx的 excel列表(文件所在位置很重要，放在桌…

人工智能 2023年7月15日
00175
YOLOv7（目标检测）入门教程详解—检测，推理，训练

目录一.前言二.yolov7源码下载三.detect（检测）四.Train（训练）数据准备： labellmg: 配置训练的相关文件配置数据集文件正式训练：推理： …

人工智能 2023年7月28日
0078
图神经网络（一）DGL框架搭建GCN图卷积神经网络模型

一、DGL DGL是基于pytorch开发的一个专门用于图神经网络模型搭建的框架，到现在为止，DGL已经高度封装了如GCN、GraphSage、GAT等常见的图神经网络模型，可以直…

人工智能 2023年6月16日
0096
音频之AMR-NB、AMR-WB

首先明白什么是Amr-Nb和Amr-wb? 一、什么是AMR、AMR-WB全称Adaptive Multi-Rate和Adaptive Multi-Rate Wideband，主要…

人工智能 2023年5月27日
0071
Windows下卸载重装CUDA和CUDnn_解决pycharm无法加载CUDA动态库的问题

文章目录写在前面正文开始 * step1. 卸载CUDA step2. 安装CUDA和CUDnn step3. Tensorflow-gpu安装安装完成，GPU可以用了，cm…

人工智能 2023年5月23日
00115
目标检测指标mAP详解

前言相信刚刚接触目标检测的小伙伴也是有点疑惑吧，目标检测的知识点和模型属实有点多，想要工作找CV的话，目标检测是必须掌握的方向了。我记得在找实习的时候，面试官就问到了我目标检测的…

人工智能 2023年6月23日
0079
解决：RuntimeError: CUDA out of memory. Tried to allocate 128.00 MiB (GPU 0； 2.00 GiB total capacity； 1

1. 问题 2. 分析 3. 解决问题训练模型时报错：RuntimeError: CUDA out of memory. Tried to allocate 128.00 Mi…

人工智能 2023年7月14日
00116
ViewPager+Fragment设置数据后不刷新问题解决方案

一、前言日常开发中使用ViewPager+Fragment搭建页面很方便，但是ViewPager的缓存问题会导致设置数据后，Fragment中数据更新不及时，可谓让开发者又爱又恨…

人工智能 2023年6月29日
0069
企业数字化转型的意义，数字化转型不是一道选择题

随着人工智能、云计算、大数据、区块链、物联网、互联网等新一代信息化、数字化技术的应用，社会的数字化程度不断提高，让数据成为了构建现代化社会的重要元素，最终于2020年成为了继土地、…

人工智能 2023年7月15日
0042
Machine Learning 算法总结（一）分类算法——KNN，Linear分类，决策树DecisionTree，支持向量机SVM，朴素贝叶斯

一、Bayes Classification Bayes的预测条件概率分布的方法在之前一篇文章中已经总结过，其实就是通过抽取样本信息、先验信息和总体信息去得到变量的后验分布。举个…

人工智能 2023年7月1日
0057
中值滤波-理论基础

“平滑处理”（smoothing）也称”模糊处理”（bluring），是一项简单且使用频率很高的图像处理方法。平滑处理的用途有很多，…

人工智能 2023年7月19日
0060
Yolov5自学笔记之二–在游戏中实时推理并应用（实例：哈利波特手游跳舞小游戏中自动按圈圈）

上一篇帖子我已经自学了Yolov5的基本流程，并运用yolov5进行图片、视频、摄像头、网络视频流等多种方式的推理，这些结合到实际工作中就可以有很广泛的应用了。但是还有一类情况，就…

人工智能 2023年5月26日
0086
Mx-yolov3环境配置+本地模型训练+K210

文章目录一、Mx-yolov3环境配置二、模型训练 1.测试 2.数据集制作 3.VOTT标注与模型测试三、部署到k210 1.模型转换 2.脚本运行 3.脱机运行 4.一个…

人工智能 2023年7月6日
0075
U-Net介绍

Unet 发表于 2015 年，属于 FCN 的一种变体。Unet 的初衷是为了解决生物医学图像的问题，由于效果确实很好后来也被广泛的应用在语义分割的各个方向，如卫星图像分割，工业…

人工智能 2023年7月25日
0098

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Scikit-learn库中，回归性能评估所用的score函数含义详解

大家都在看