深度学习（3）：不同分类模型的评价指标（F1、Recall、P）

2023年6月30日下午3:17 • 人工智能 • 阅读 126

一、引入

我们在训练模型的过程中，需要用未知的数据集（为被训练过的）送入训练好的模型进行验证，来检测该模型是否适用于该项目。哪该如何来进行判断呢？这个就需要评价指标了。模型的评价指标有很多，比如：精确率（查准率）、F1-Score、召回率（查全率）、准确率、P-R曲线、ROC曲线等。我们这里就主要介绍精确率（查准率）、F1-Score、召回率（查全率）、准确率。

二、评价指标介绍

不同的分类指标有不同的含义，比如在商品推荐系统中，希望更精准的了解客户需求，避免推送用户不感兴趣的内容， 精确率就更加重要；在疾病检测的时候，不希望查漏任何一项疾病，这时 查全率就更重要。当两者都需要考虑时， F1-Score就是一种参考指标。

注意：评价模型过程中，需要不同的评价指标从不同角度对模型进行全面的评价，在诸多的评价指标中，大部分指标只能片面的反应模型的一部分性能，如果不能合理的运用评估指标，不仅不能发现模型本身的问题，而且会得出错误的结论。

精确率（查准率）、F1-Score、召回率（查全率）、准确率是我们在分类模型中用到的最多的四个评价指标，不同的评价指标有不同的计算公式。

accuracy = 预测正确的/预测的总数

哪在这些公式里面的TP、TN、FP、FN是什么意思呢？哪请看下面的内容：

三、二分类

什么是二分类？二分类就是我们的预测结果就只有两类，并且这两类是可以用数值来表示的。

假设我们现在有关需求，要来正确判断出猫和狗这两类，于是我们训练的一个模型，现在需要来评判该模型能否在实际中正常使用，于是我们把未知数据集[猫，猫，狗，狗，猫]送入模型得到预测结果为[猫，狗，狗，猫，猫]。

y_true = [猫，猫，狗，狗，猫]

y_pred = [猫，狗，狗，猫，猫]

TP = 1

TN = 2

FP = 1

FN = 1

accuracy = 3/5 = 0.6

precision = 2/(2+1) = 05

recall = 2/(1+1) = 0.5

F1 = (20.50.5)/(0.5+0.5) = 0.5

from sklearn.metrics import recall_score, f1_score, precision_score, accuracy_score

[&#x732B;&#xFF0C;&#x732B;&#xFF0C;&#x72D7;&#xFF0C;&#x72D7;&#xFF0C;&#x732B;]
y_true = [0, 0, 1, 1, 0]
[&#x732B;&#xFF0C;&#x72D7;&#xFF0C;&#x72D7;&#xFF0C;&#x732B;&#xFF0C;&#x732B;]
y_pred = [0, 1, 1, 0, 0]

print("accuracy&#xFF1A;%.2f" % accuracy_score(y_true, y_pred))
print("precision&#xFF1A;%.2f" % precision_score(y_true, y_pred))
print("recall&#xFF1A;%.2f" % recall_score(y_true, y_pred))
print("f1-score&#xFF1A;%.2f" % f1_score(y_true, y_pred))

四、多分类

多分类就是模型的预测结果不止有两类，有多类，比如说，三类，四类等。那么这时我们该如何求指标呢？

假设现在有三类，真实值为 [猫，狗，狗，鼠，猫，鼠]，预测值为[鼠，猫，狗，猫，猫，鼠]。

我们可以将其看成 3（3类）个二分类。

第一个：[猫，other]

y_true = [猫，other，other，other，猫，other]

y_pred = [other，猫，other，猫，猫，other]

TP = 1 TN = 2 FP = 2 FN = 1

precision = 1/3 = 0.33

recall = 1/2 = 0.5

F1 = (2 * precision * recall )/(precision + recall ) = 0.40

第二个：[狗，other]

y_true = [other，狗，狗，other，other，other]

y_pred = [other，other，狗，other，other，other]

TP = 1 TN = 4 FP = 0 FN = 1

precision = 1/1 = 1

recall = 1/2 = 0.5

F1 = (2 * precision * recall )/(precision + recall ) = 0.67

第三个：[鼠，other]

y_true = [other，other，other，鼠，other，鼠]

y_pred = [鼠，other，other，other，other，鼠]

TP = 1 TN = 3 FP = 1 FN = 1

precision = 1/2 = 0.5

recall = 1/2 = 0.5

F1 = (2 * precision * recall )/(precision + recall ) = 0.5

将上面三类进行求平均：

accuracy = 3/6 = 0.5

precision = (0.33+1+0.5)/3 = 0.61

recall = (0.5+0.5+0.5)/3 = 0.5

F1 = (0.4+0.67+0.5)/3 = 0.52

from sklearn.metrics import recall_score, f1_score, precision_score, accuracy_score
from sklearn.metrics import classification_report

[猫，狗，狗，鼠，猫，鼠]
y_true = [0, 1, 1, 2, 0, 2]
[鼠，猫，狗，猫，猫，鼠]
y_pred = [2, 0, 1, 0, 0, 2]

measure_result = classification_report(y_true, y_pred)
print('measure_result = \n', measure_result)

print("accuracy：%.2f" % accuracy_score(y_true, y_pred))
print("precision：%.2f" % precision_score(y_true, y_pred, labels=[0, 1, 2], average='macro'))
print("recall：%.2f" % recall_score(y_true, y_pred, labels=[0, 1, 2], average='macro'))
print("f1-score：%.2f" % f1_score(y_true, y_pred, labels=[0, 1, 2], average='macro'))

Original: https://blog.csdn.net/qq_48764574/article/details/125691998
Author: 牧子川
Title: 深度学习（3）：不同分类模型的评价指标（F1、Recall、P）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/661530/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

CUDA11.7版本与pytorch1.12下载（conda安装pytorch出现）相关出错解决 HTTP 000 CONNECTION FAILED for url

. HTTP 000 CONNECTION FAILED for url An HTTP error ocurred when trying to retrieve this UR…

人工智能 2023年6月16日
0050
学习笔记——详解马尔可夫，马尔可夫链，马尔可夫模型，隐马

目录（一），马尔可夫（Markov）综述 1.1，随机过程是啥玩意儿 1.2. 马尔可夫链（Markov Chain）又是什么鬼 1.3一个经典的马尔科夫链实例（二），隐…

人工智能 2023年7月2日
0066
双目相机 — IMU联合标定

声明：一些图片是不该有水印的，CSDN把图片链接的格式改了，暂时还不知道怎么去掉，请见谅！！！目录 * – 声明：一些图片是不该有水印的，CSDN把图片链接的格式改…

人工智能 2023年6月2日
0089
使用 Presto 和 Alluxio 在 AWS 上搭建高性能平台来支持实时游戏服务

概要速览美国艺电 (EA) 是游戏行业的翘楚，每年为全球几十亿用户提供数十款游戏。能否针对EA的在线服务做出近实时决策对于业务发展至关重要。本文介绍了在AWS上搭建的基于Pres…

人工智能 2023年7月15日
0043
OpenCV|练习笔记

配置：需要 pip install opencv-contrib-pythonpip install numpy在pycharm中配置好环境读入 cv2.inread() 输出 …

人工智能 2023年7月20日
0042
船舶专业本科零基础：从数据分析成功转行推荐算法成功上岸

基本情况毕业于985本科,船舶与海洋工程专业,年龄30+（报班之前做的数据分析），0.1的基础来自于船舶行业专业计算软件学到点的编程。契机 & 鸡汤我性格有非常非常多…

人工智能 2023年7月16日
0088
TensorFlow1.9全卷积神经网络与图像分割

全卷积神经网络与图像分割一、图像分割简介 1.图像分割图像分割(image segmentation）是指将图像分成若干具有相似性质的区域的过程从数学角度来看，图像分割是将图…

人工智能 2023年6月2日
0076
基于yolov3的目标检测与LPRnet字符识别的车牌识别（CCPD2020新能源车牌数据集）

文章目录前言一、程序思路二、使用步骤 * 1.配置环境 2.文件结构 3.准备数据集 4.训练有问题欢迎指正前言项目放这：车牌识别验证集70%多的识别率吧，效果不算特…

人工智能 2023年6月16日
0092
pytorch利用hook【钩子】获取torch网络每层结构【附代码】

写本文的目的是为了方便在剪枝中或其他应用中获取网络结构，如何有效的利用hook获取每层的结构来判断是否可以剪枝。要对网络进行trace，或者获取网络结构，需要知道 &#8220…

人工智能 2023年7月23日
0054
Transformer课程第39章：面向Knowledge-intensive任务的Transformer模型RAG的架构及完整源码实现

1，为何Transformer网络能够存储factual knowledge信息？ 2，pretrained dense retrieval数学原理分析 3，sequence-to…

人工智能 2023年5月30日
0076
医学图像～脑分类数据fMRI, voxel

目录 1. fMRI 1.1 fMRI应用：whole-brain fMRI classification 2. voxel, 体素 3. 张量tensor 医学图像相关的脑分类数…

人工智能 2023年7月3日
0072
Matlab图像特征提取的数学原理及实现

一、引言图像特征不论是对传统的图像处理，还是机器学习，都具有不可替代的地位和作用。图像特征其实就是可以用来刻画图像的像素集，这些像素和周围像素的变化幅度比较大。例如当你走在路上…

人工智能 2023年6月17日
0085
Cpu下不同环境部署Tensorflow模型性能测试（tf-serving、FastApi和Java）

前言与观点本文主要是在cpu环境（不是gpu）下对tensorflow模型的不同部署方法进行简要的性能测试，寻求一个较好的部署方案。涉及的部署方法： FastApi部署 tf-…

人工智能 2023年5月23日
0094
conda 和 pip 两种方式在anaconda安装pytorch cpu（总结，亲测有效）

上一篇说了在具体安装时踩到的各种坑，有兴趣的可以翻看我过往的博文。现在我再次总结一遍，不讨论犯过的错误，只讨论安装过程中要注意的点以及正确的命令。默认电脑已经安好了anaconda…

人工智能 2023年6月16日
0094
Pytorch：目标检测网络-人体关键点检测

Pytorch: 目标检测网络-人体关键点检测 Copyright: Jingmin Wei, Pattern Recognition and Intelligent System…

人工智能 2023年5月28日
00100
OpenCvSharp (C# OpenCV) 利用CvTrackbar滑动条实现二值化阈值调试(附源码)

点击下方卡片，关注” OpenCV与AI深度学习“公众号！视觉/图像重磅干货，第一时间送达! 前言 Python和C++版本的OpenCV中都封装了滑动…

人工智能 2023年6月22日
0068

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

深度学习（3）：不同分类模型的评价指标（F1、Recall、P）

大家都在看