分类模型评估指标

2023年7月1日下午12:11 • 人工智能 • 阅读 72

分类模型评估指标：

混淆矩阵：
混淆矩阵是一种用来呈现算法性能的矩阵，它的每一行代表真实的分类，每一列代表预测的分类。

True Positive（TP）：真正类。
False Negative（FN）：假负类。
False Positive（FP）：假正类。
True Negative（TN）：真负类。

准确率(Accuracy)：
准确率是指模型正确地预测样本的比例：
A c c u r a c y = T P + T N T P + F N + F P + T N Accuracy = \frac{TP+TN}{TP+FN+FP+TN}A c c u r a c y =T P +F N +F P +T N T P +T N

准确率是分类模型最常用的指标，在sklearn中，调用分类模型的score函数计算出的评估指标就是准确率。

精准率(Precision):
精确率用于评估测试是True的样本里，有多少真正是True
P r e c i s i o n = T P T P + F P Precision = \frac{TP}{TP+FP}P r e c i s i o n =T P +F P T P
如果只考虑预测结果的正确性，可以使用精确率这一指标。

召回率(Recall)：
召回率是指在实际标记为True的样本中，预测为True的比例是多少。

R e c a l l = T P T P + F N Recall = \frac{TP}{TP+FN}R e c a l l =T P +F N T P
假设我们需要考虑预测结果与整体样本的匹配度，那么召回率就比较适合评估。

F1分数：
F1分数是精确率和召回率的调和值，它接近于两个分数中较小的一个，所以精确率和召回率接近时，F值最大。
2 F 1 = 1 P r e c i s i o n + 1 R e c a l l \frac{2}{F1} = \frac{1}{Precision} + \frac{1}{Recall}F 1 2 =P r e c i s i o n 1 +R e c a l l 1
F1分数适合用于既要考虑精确率也要考虑召回率的场景。

; K折交叉验证：

训练集(Train Set)和：测试集(Test Set)：
训练集用来训练模型或确定模型参数的数据集，测试集用来验证模型的准确的数据集。

划分条件：
训练集和测试集的划分，必须同时满足训练集和测试集的交集为空集，并集为数据集两个条件。在实践中，先根据训练集的大小，从数据集中抽取训练集，然后把剩下的数据作为测试集，即可满足这个划分要求。

K折交叉验证(K-fold Cross Validation):
验证过程：
设置 k = 10,把原来的数据集随机分成10份，分别作{D1，D2…D10}
接着使用D1作为测试集，{D2 …D10}作为训练集，计算得分s1。
以此类推，
得到10个得分后，计算这组得分的平均值，作为模型的综合得分。
综合得分 = ∑ i = 1 10 s i 10 综合得分 = \frac{\sum_{i=1}^{10}s_i}{10}综合得分=1 0 ∑i =1 1 0 s i

KNN模型：

K最近邻算法，它判断未知类别数据的方法，是根据未知数据最近的K条记录，统计他们的分类，来确定未知类别数据的分类。
如下图所示，正方形和三角形代表两种不同的分类，圆点代表的是未知分类的点。
KNN算法首先会确定一个K值，假设K = 3 ，那么根据其他点与圆点的距离，找出最接近圆点的三个点，三点中，两个属于三角形，一个属于正方形，根据这一结果，KNN算法认为，圆点数以三角形点的分类。

在KNN算法中，参数K的设置会影响模型的效果，K值设置不同，分类结果也会不同。

Original: https://blog.csdn.net/CSDN_Arice/article/details/123590645
Author: CSDN_Arice
Title: 分类模型评估指标

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/663331/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

文本处理环境配置

第一步:安装相应软件根据自己电脑的配置去官网依次安装python、pycharm和anaconda,我自己的是macbook pro,自身没有GPU,但是我也用win,自己对比下…

人工智能 2023年5月24日
0093
计算机领域各大顶会顶刊集合梳理

兄弟萌冲啊冲啊，冲冲冲，为了idea，为了占位置，为了发文章！！！一、前言每一个领域内，都有很多优秀的、认可度高的会议或者期刊。其他领域不太了解，但一般用SCI一区，二区等来区…

人工智能 2023年7月26日
0094
从DataFrame中删除列

在操作数据的时候， DataFrame对象中删除一个或多个列是常见的操作，并且实现方法较多，然而这中间有很多细节值得关注。首先，一般被认为是”正确”的方法…

人工智能 2023年7月6日
0076
Hough 变换检测圆—-Matlab实现（以虹膜检测为例）

一、hough变换的原理：圆方程（1）xy空间一个圆对应三维参数空间一个点（a,b,r)（2）xy空间圆上一个点(x,y)对应参数空间一条曲线（3）xy空间圆上n个点对应参数空…

人工智能 2023年6月17日
0096
DataOps：深刻影响现代数据栈发展

嘉宾 | 代立冬整理 | 西狩出品 | CSDN云原生数字化的时代大潮推动了互联网的发展，云计算、大数据、云原生等技术不断成熟，使数据处理的方式发生变革，现代数据栈也因此开启…

人工智能 2023年7月15日
0070
33.图像定位

目录 1 常见图像处理任务 2 数据集展示 3 训练模型 3.1 导入库 3.2 处理数据集路径 3.3 定义解析xml函数 3.4 创建数据集 3.5 创建模型 3.6 编译模型…

人工智能 2023年6月21日
0088
面向法律领域的罪名预测、问题分类与FAQ问答模型设计与实现【NLP】

一、面向法律领域的罪名预测、问题分类与FAQ问答模型设计与实现【NLP】目前NLP技术在各个行业中应用逐步打开，尤其在金融，医疗，法律，旅游方面，NLP技术助力法律智能，能够在一…

人工智能 2023年7月1日
0081
基于matlab点云工具箱对点云进行处理四：对点云进行欧式聚类，并获得包围点云簇的外接凹多边形

基于matlab点云工具箱对点云进行处理四：对点云进行欧式聚类，并获得包围点云簇的外接凹多边形步骤：读取velodyne数据包pcap文件内的点云数据使用pcdownsamp…

人工智能 2023年6月2日
00117
unet模型及代码解析

什么是unet 一个U型网络结构，2015年在图像分割领域大放异彩，unet被大量应用在分割领域。它是在FCN的基础上构建，它的U型结构解决了FCN无法上下文的信息和位置信息的弊端…

人工智能 2023年7月26日
00212
002_SSSS_ Denoising Diffusion Implicit Models

Denoising Diffusion Implicit Models 个人笔记Github地址:https://github.com/xuekt98/readed-papers….

人工智能 2023年6月24日
0081
OpenCV人脸识别，训练模型为cv2.face.LBPHFaceRecognizer_create()

OpenCV内部自带有三种人脸检测方式：LBPH人脸识和其他两种方法（Eigen人脸识别，FisherFace人脸识别）本次主要说明第一种方式LBPH检测。 1.素材创建图（1….

人工智能 2023年6月18日
0062
Python之DataFrame表格型数据结构

对于dataframe 表格型数据结构当只传入单一个列表时，该列表会显示成一列 df0=pd.DataFrame([‘aa’,’ab’,’ac’,’bb’,’bc’]) prin…

人工智能 2023年7月7日
0052
超级详细的 Maven 教程（基础+高级）

1. Maven 是什么 Maven 是 Apache 软件基金会组织维护的一款专门为 Java 项目提供构建和依赖管理支持的工具。一个 Maven 工程有约定的目录结构，约…

人工智能 2023年7月31日
0069
模型压缩技术：综述【模型蒸馏/Distillation；量化/Quantization；剪枝/Pruning；参数共享】

BERT 在很多 NLP 任务上都取得不错的效果，但是其模型体积与计算量都很大，而且现在出现了更多越来越大的模型，例如 roBERTa 和 GPT2。由于这些模型的太大，难以用于一…

人工智能 2023年5月28日
0090
简单易懂的机器学习算法介绍

决策树 – – -决策树的基本原理决策树（Decision Tree）是⼀种分⽽治之的决策过程。⼀个困难的预测问题，通过树的分⽀节点，被划分成两个或多个较…

人工智能 2023年7月1日
0099
基于MATLAB的语音及音乐信号的采样、滤波及处理

资源下载地址：https://download.csdn.net/download/sheziqiong/85595944 一、实验目的 1、理解采样率和量化级数对语音信号的影响…

人工智能 2023年5月25日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

分类模型评估指标

分类模型评估指标：

; K折交叉验证：

KNN模型：

大家都在看