图像分类中的基础概念+分类任务中常见损失函数介绍

2023年7月2日下午3:16 • 人工智能 • 阅读 139

一、图像分类中的基础概念

（一）、正负样本

标签为正样本，分类结果为正样本——True Positive（TP）——正确的正样本
标签为正样本，分类结果为负样本——False Negative（FN）——错误的负样本
标签为负样本，分类结果为正样本——False Positive（FP）——错误的正样本
标签为负样本，分类结果为负样本——True Negative（TN）——正确的负样本

真实值预测值正样本负样本正样本TPFN负样本FPTN

（二）、精度、召回率、F1-score

精度 (precision, 查准率) ：被判定为正样本的测试样本中，真正的正样本所占的比例

召回率 (recall, 查全率) ：被判定为正样本的正样本占所有正样本的比例

F1-score：综合考虑了精度与召回率，其值越大则模型越好

精度与召回率的关系——相互矛盾的指标

召回率增加，精度下降
曲线与坐标值面积越大，性能越好
对正负样本不均衡问题敏感

图1 PR曲线

图2 ROC曲线（越偏向左上角越好）

ROC曲线解读：

横坐标：false positive rate(FPR)——正类中实际负实例占所有负实例的比例。

纵坐标：true positive rate(TPR)——正类中实际正实例占所有正实例的比例。

正负样本的分布变化，ROC曲线保持不变，对正负样本不均衡问题不敏感。

AUC：ROC曲线下的面积（ROC曲线以及右下角的面积），表示随机挑选一个正样本以及一个负样本，分类器会对正样本给出的预测值高于负样本的概率。

（三）、混淆矩阵——适用于多类别分类模型各个类别之间的分类情况

对于k分类问题，混淆矩阵为k*k矩阵，元素Cij表示第i类样本被分类器判定为第j类的数量。主对角线的元素之和为正确分类的样本数，其他元素之和为错误分类的样本数。对角线的值越大，分类器准确率越高。

混淆矩阵能很清晰的反映出各类别之间的错分概率，越好的分类器对角线上的值更大。

混淆矩阵的计算：

from sklearn.metrics import confusion_matrix
y_true = [2, 0, 2, 2, 0, 1]        # &#x6B63;&#x786E;&#x7684;&#x771F;&#x503C;
y_pred = [0, 0 ,2, 2, 0, 2]        # &#x5206;&#x7C7B;&#x5668;&#x8FD4;&#x56DE;&#x7684;&#x4F30;&#x8BA1;&#x76EE;&#x6807;
confusion_matrix(y_true, y_pred)

array([[2, 0, 0],
       [0, 0, 1],
       [1, 0, 2]])

二、分类任务优化目标——常见损失函数介绍

1. 0-1损失

只看分类的对与错，当标签与预测类别相等时，loss为0，否则为1

真实的优化目标，但是无法求导和优化，只有理论意义

2. 交叉熵损失

在介绍交叉熵的概念之前，我们先来回顾一下熵的概念：熵表示热力学系统的无序程度，在信息学中用于表示信息多少，不确定性越大，概率越低，则信息越多，熵越高。

熵是概率的单调递减函数：

交叉熵损失：

表示第i个样本属于第j类的标签，

表示第i个样本被预测为第j类的概率

参数说明：

n——batchsize
C——类别数
——第i个样本在第j类上的真实标签
——第i类样本在第j类上的预测概率

假设我们只有一个样本，两种类别，即

，

，且有：

依旧假设我们只有1个样本，但是类别数为C，该样本的真实标签是属于第m类，则有

表示第i个样本所属的类别，

表示第i个样本在其所属类别上的预测概率。

那么，将只包含一个样本的交叉熵损失公式推广到一个批次包含n个时，交叉熵损失就是n个样本各自交叉熵损失的求和平均，所以有

3. softmax loss及其变种

softmax loss是交叉熵损失的特例：神经网络中最后一层全连接层的输出结果成为logit，其范围为

，softmax的作用是将logit的范围转换到0~1，此时，第i个样本对第j类的预测概率

就可以表示为：

其中，

表示神经网络对第i个样本在第j类输出的logit。

所以，softmax loss的公式为：

交叉熵损失的变种：L softmaxloss

从内积的角度来理解最后一层全连接层的输出，

，即将分类的过程看作计算第i个样本

与神经网络最后一层全连接层权重

的余弦相似性，与

最相似的

（内积最大）便对应着

的类别。

先考虑简单的二分类问题，即

图3 L_softmax_loss

若

，样本就被分类为类别1；若

，样本就被分类为类别2，所以分类的决策边界就是

，我们考虑比较简单的情况，当

是，决策边界就简化为

。

那么我们如何使类内更加紧凑，类间更加分离呢？

首先，第i个样本被归为第一类，有

，如果取预设常数m来确定样本接近真实类别的强度，使得

，

，结合余弦函数在[0,Π]的单调递减性质可知，

可推得

比

更小，从而实现了类内压缩并且类间更加疏离的效果。

图4 L_softmax_loss类内压缩类间分离

4. KL散度

KL散度用来估计两个分布p和q的相似性，其中分布p是数据的真实分布，我们用分布q来近似p。KL散度的作用就是计算用q分布近似p分布时损失了多少信息。

如果p是一个已知的分布（标签），则

是一个常数，此时

与交叉熵

只有一个常数的差异。

KL散度的特性，大于等于0，当且仅当两个分布完全相同时等于0

这里需要注意的是KL散度不是距离，因为KL散度不对称，即

。

Original: https://blog.csdn.net/Tangguoseo/article/details/123663983
Author: ⒈顆糖果!
Title: 图像分类中的基础概念+分类任务中常见损失函数介绍

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/665693/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

no model named “compat“ ，Tensorflow 版本问题

查看我的版本： Module: tf.compat | TensorFlow Core v2.6.0 Compatibility functions.https://tensorf…

人工智能 2023年7月27日
0099
OpenCV（项目）人脸识别（图片识别、摄像头识别）

目录一、基础理论 1、基于特征的算法 2、基于图像的算法 3、Haar特征 4、adaboost级联决策器二、人脸识别（图片） 1、图片灰度化 2、训练一组数据 3、检测人脸 …

人工智能 2023年6月18日
0068
1×1卷积的作用

通道数放缩。池化层只能改变输入图像的高度和宽度，无法改变通道数，1×1卷积通过控制卷积核的数量，可以实现通道数的增加或者减少。 1×1卷积核的卷积过程相当于全连…

人工智能 2023年7月13日
0097
AI 绘画极简教程

昨天在朋友圈发了几张我用AI绘画工具Disco Diffusion画的画既然有同学问，就写个极简教程吧，画个图是足够了，想要深入了解还是自行百度吧，可以找到更详细的教程。第 0…

人工智能 2023年6月4日
0094
Python统计代码运行时间

Python统计代码运行时间前言方法1（推荐）：通过代码统计 * 说明步骤单位完整示例方法2：通过Pycharm编辑器前言 Python代码想统计运行时间有很多种方法…

人工智能 2023年7月4日
0087
深度学习从入门到精通——GoogLeNetV1分类算法

GoogLeNet 模型优势 * 不同尺度的特征信息 – 采用了1*1卷积池化层模型优势引入了Inception结构（融合不同尺度的特征信息）使用1×…

人工智能 2023年7月2日
0098
Anaconda环境下换源快速安装pytorch

Anaconda环境下换源快速安装pytorch 换源安装pytorch * 1 更换清华源 2 添加镜像源 3 安装pytorch 换源安装pytorch 1 更换清华源需要在…

人工智能 2023年7月27日
00138
RGB彩色图、灰度图、二值图，图像灰度化、图像二值化

图像是一个个的像素点排列组合而成 1. RGB RGB彩色图是三个颜色通道叠加，每个像素点都是由3个通道的数值叠加，从而代表这个像素点的颜色。OpenCV中图像通道顺序为BGR,m…

人工智能 2023年6月22日
00110
机器学习–数据清洗

数据清洗主要是删除原始数据集中的无关数据、重复数据，平滑噪声数据，筛选掉与挖掘主题无关的数据，处理缺失值、异常值等。处理缺失值的方法可分为3类：删除记录、数据插补和不处理。*缺失…

人工智能 2023年6月19日
0096
MAE源代码理解 part2 ：预训练调试

目录 1 事先准备二调试用MAE预训练的模型用于自己下游的分类 part1 ： MAE源代码理解 part1 ：调试理解法_YI_SHU_JIA的博客-CSDN博客 git…

人工智能 2023年7月26日
00214
Keras学习及运行官方实例（2022.2.24）

Keras学习及官方实例运行 2022.2.24 1、Keras简介 * 1.1 Keras的特点 1.2 Keras与Tensorflow的关系 1.3 Keras安装 1.4 …

人工智能 2023年5月25日
0094
第五章 Spark的DataFrame与Spark SQL

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档随着Spark版本的更迭，不足凸显出来，它处在底层，在实际开发中效率低下，因此进行了高层封装，诞生了Spark D…

人工智能 2023年7月7日
0088
Tensorflow车牌识别完整项目（含完整源代码及训练集）

基于TensorFlow的车牌识别系统设计与实现，运用tensorflow和OpenCV的相关技术，实现车牌的定位、车牌的二值化、车牌去噪增强、图片的分割，模型的训练和车牌的识别等…

人工智能 2023年7月26日
0081
统计学习实战–朴素贝叶斯分类手写数字图像（多项式模型、伯努利模型、高斯模型）

这次我们使用朴素贝叶斯分类最常用的3个衍生模型：多项式模型、伯努利模型、高斯模型对手写数字图像进行训练分类。我们直接采用sklearn框架，这个框架基本包含了所有机器学习统计学习…

人工智能 2023年7月2日
00117
pytorch对网络层的增，删，改, 修改预训练模型结构

#下载模型参数 model.load_state…

人工智能 2023年7月5日
0070
pandas数据分析——数据读取

pandas数据读取目录 pandas数据读取前言一、pandas读取表格类型数据二、操作 * 1.读取纯文本文件 – 读取csv文件读取txt文件 2.读取…

人工智能 2023年7月16日
0061

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31