模型泛化能力的评估（准确率、精确率、召回率、F1、ROC、AUC）与代码实现

2023年7月1日下午10:43 • 人工智能 • 阅读 96

泛化能力指训练好的模型在测试集上的表现
指标：准确度、精确率、召回率、F1值、ROC、AUC等。
对于二分类问题，有混淆矩阵：

实际结果 1 实际结果 0预测结果 111（TP) 10 (FP)预测结果 001(FN) 00 (TN)

T—-True; F—False; P(positive) =1; N(Negative) =0
注: 先看预测结果（P/N），再针对实际结果对比预测结果，给出判断结果（T/F）

定义
预测正确的结果占总样本的百分比
准确率 = (TP + TN) / (TP + TN + FP + FN)
特点
可以判断总的正确率，但在样本不均衡的情况下，并不能很好的来衡量结果。

from sklearn.metrics import accuracy_score
accuracy(y_test, y_pred)

定义
针对预测结果而言，含义是在所有被预测为正的样本中实际为正的样本的概率。
精确度 = TP/(TP+FP)
准确率与精确率的区别
准确率代表整体的预测准确程度，包含正样本和负样本；
精确率代表对正样本结果中的预测准确程度。

定义
针对原样本而言，在实际为正的样本中被预测为正的概率。
召回率 = TP/(TP+FN)

精确率和召回率可通过P-R图表示，两者是矛盾，无法做到双高。
F1-Score可以同时考虑精确率和召回率，让两者同时达到最高，取得平衡。
平衡点： F1-Score = 2 _Precision_Recall / (Precision + Recall)

TPR（真正率）= TP/(TP+FN) : 模型预测覆盖的程度
FPR（假正率） = FP/(FP+TN) : 模型虚报的程度
这两个指标分别针对不同类别计算，不会受到样本不平衡的影响。
ROC曲线
FPR为横坐标，TPR为纵坐标
TPR越大越好，FPR越小越好
因此ROC曲线越好越陡峭
AUC曲线
取值：[0.5, 1]
定义：表示ROC曲线下面的面积，用于判断模型的优劣
AUC判别标准：
0.5~0.7 : 效果较低
0.7~0.85 ：效果一般
0.85~0.95 ：效果很好
0.95~1 ：效果非常好

from sklearn.metrics import classification_report
model.score(y_test, y_pred)
model.classification_report(y_test, y_pred)

我在学这一块儿知识的时候会有疑惑：这么多指标到底看哪一个呢？
通常在选择最优模型时看的Accuracy和loss。后来接触了实际的项目发现，一个模型的部署要考虑其业务场景，比如当误报的风险比较大，漏报的风险不是很大时，要考虑Recall(这个要看具体的0和1是怎么指定的)。有些业务场景只需要全局的准确率足够高即可。

理论参考《西瓜书》 BY 周志华
代码参考：github: datawhalechina
机器学习笔记

Original: https://blog.csdn.net/AAAAAAABBgg/article/details/125132880
Author: 请工作善待我
Title: 模型泛化能力的评估（准确率、精确率、召回率、F1、ROC、AUC）与代码实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/664201/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

机器学习应用——监督学习（下）“手写数字识别”（神经网络实现&KNN实现）

前言机器学习应用博客中，将核心介绍三大类学习，即：无监督学习、监督学习、强化学习。本篇将简要介绍监督学习的”手写数字识别”实例运用MNIST数据集和D…

人工智能 2023年7月13日
0070
毕设：基于yolov5的手势识别与应用-项目概况

科技以造福人类为本，构成我们庞大社会的不只有四肢健全，感知正常的普通百姓，更有许许多多身体条件有缺陷的残疾人，为这类朋友们造福也是科学研发的重中之重。手语是聋哑人士的主要沟通工具，…

人工智能 2023年6月25日
00123
yolov5环境搭建之“CUDA10.0也可以正常运行pytorch1.7.1”及其他小问题总结

问题一：CUDA10.0也可以正常运行pytorch1.7.1 在初步搭建完毕yolov5环境之后运行程序，发现出现下面这个问题:通过查阅资料，出现这个问题大概率是因为torch版…

人工智能 2023年5月28日
00111
语音识别SpeechRecognition中文包对应文件名的处理

背景: win8.1, python 3.9.7 自带idle, 模块SpeechRecognition-3.8.(pip install SpeechRecognition安装默…

人工智能 2023年5月23日
0077
flow_from_directory返回值

tensorflow2.0 ImageDataGenerator中关于flow_from_directory返回值的方法列举 ImageDataGenerator * ImageD…

人工智能 2023年5月26日
00115
Tomcat安装步骤及详细配置教程（2022最新版）

网上的tomcat安装及配置教程一大堆，但是好多都过时了，根本不适用现在的版本，今天凯歌整理一篇Tomcat安装步骤及详细配置教程，2022年最新版~ Tomcat安装及配置教程主…

人工智能 2023年7月29日
00106
第三节课 Pandas，Numpy的简单使用

1、安装numpy 2、numpy的操作 3、相关操作 4、Pandas数据分析 5、绘图 6、数据清洗 pip install numpy 安装jupyter，安装noteboo…

人工智能 2023年7月18日
0063
dateframe如何重排列_如何更改DataFrame列的顺序？

I have the following DataFrame (df): import numpy as np import pandas as pd df = pd.DataFr…

人工智能 2023年7月8日
00103
【Pandas学习笔记01】强大的分析结构化数据的工具集

在进行量化分析的过程中，总是需要使用大量的数据基础，对数据之间的关联进行挖掘，最终找到我们需要的数据。只通过Python进行数据分析是非常复杂的，有没有更简单的工具帮助我们能够高效…

人工智能 2023年7月8日
0096
深度学习遥感场景分类数据集整理

RSSCN7 数据集由武汉大学的秦邹于 2015 年发布，相关论文有《Deep learning based feature selection for remotesensing…

人工智能 2023年7月2日
00109
【CVPR 2022】目标检测SOTA：DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection

DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection 摘要：论文简介： …

人工智能 2023年5月28日
00103
目标检测-＞SSD算法

目标检测算法总体分为：基于区域的算法和基于回归的算法 1）基于区域的算法： RCNN, Fast RCNN, Faster RCNN, Mask RCNN 等。整个检测过程分为两个…

人工智能 2023年6月23日
00222
人工智能AI系列 – PaddlePaddle 开源项目的java部署实现

通过DJL框架可以实现算法Java 当然，这并不意味着它是完全可替代的，但目前大多数场景都是兼容的，特别是关于 [En] Of course, this does not mea…

人工智能 2023年5月25日
00153
RTX3070显卡笔记本运行 torch.cuda.device_count() 显示 0 解决办法、Tensorflow包安装全解

RTX3070显卡笔记本运行 torch.cuda.device_count() 显示 0 解决办法、Tensorflow包安装全解注：第一次使用 NAIDIA显卡的笔记本，要使…

人工智能 2023年5月23日
00117
Image Inpainting via Conditional Texture and Structure Dual Generation 论文解读和感想

Image Inpainting via Conditional Texture and Structure Dual Generation 论文解读和感想背景和动机本文是一篇…

人工智能 2023年6月16日
0093
机器学习之聚类（基本知识点整理）

无监督学习无监督学习是机器学习的一种方法，没有给定事先标记过的训练示例，自动对输入数据进行分类或分群。无监督学习的优点：①算法不受监督信息（偏见）的约束，可能考虑到新的信息。②不…

人工智能 2023年5月31日
0087

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

模型泛化能力的评估（准确率、精确率、召回率、F1、ROC、AUC）与代码实现

大家都在看