关于label smoothing(标签平滑)

2023年7月22日上午5:32 • 人工智能 • 阅读 44

目的：

label smoothing常用于分类任务，防止模型在训练中过拟合，提高模型的泛化能力。

意义：

对于分类问题，我们通常使用one-hot编码，”非黑即白”，标签向量的目标类别概率为1，非目标类别概率为0：

神经网络在分类任务中会输出当前输入对应每个类别的置信度分数，通过softmax对这些分数进行归一化处理，最终可以得到当前输入数据对应每一个类别的概率。

然后计算交叉熵损失函数：

这就会导致真实标签与其他标签之间的关系被忽略，模型无法学到更多的东西；这样训练得到的模型泛化能力会很差；处理样本相似度较高、数据噪声较大的数据集等分类问题时，模型容易受到影响。

针对这些问题，研究学者提出了label smoothing方法。

; label smoothig(标签平滑)：

label smoothing的提出很好的解决了上述问题，主要是通过减少实际样本标签的类别在计算损失函数时的权重，来抑制过拟合问题。

增加标签平滑后的概率分布就变为：

交叉熵损失函数就变为：

优缺点：

label smoothing优点：

一定程度上缓解了模型过于绝对的问题（’非黑即白’）；

增强了模型的泛化能力；

体现了训练数据中类别之间的亲疏关系。

label smoothing缺点：

随机噪声的添加并不能完全反映label之间的关系，甚至会导致模型欠拟合。

参考文献：

C. -B. Zhang et al. , Delving Deep Into Label Smoothing.

代码实现：

import torch.nn.functional as F

def linear_combination(x, y, epsilon):
    return epsilon * x + (1 - epsilon) * y

def reduce_loss(loss, reduction='mean'):
    return loss.mean() if reduction == 'mean' else loss.sum() if reduction == 'sum' else loss

class LabelSmoothingCrossEntropy(nn.Module):
    def __init__(self, epsilon: float = 0.1, reduction='mean'):
        super().__init__()
        self.epsilon = epsilon
        self.reduction = reduction

    def forward(self, preds, target):
        n = preds.size()[-1]
        log_preds = F.log_softmax(preds, dim=-1)
        loss = reduce_loss(-log_preds.sum(dim=-1), self.reduction)
        nll = F.nll_loss(log_preds, target, reduction=self.reduction)
        return linear_combination(loss / n, nll, self.epsilon)

Original: https://blog.csdn.net/qq_45634318/article/details/125271386
Author: 阿飞没有花福蝶
Title: 关于label smoothing(标签平滑)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/708483/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Python】OpenCV读取视频帧并保存为图片

cv2.VideoCapture()读取视频帧 import cv2 VIDEO_PATH = ‘video.mp4’ video = cv2.VideoCapture(video…

人工智能 2023年6月25日
0064
如何评估回归算法的性能

问题描述评估回归算法的性能是机器学习任务中的关键步骤。在这里，我们将详细介绍如何评估回归算法的性能并提供相应的算法原理、公式推导、计算步骤和复杂的Python代码示例。算法原理…

人工智能 2023年12月31日
0043
机器学习的概率统计模型（附代码）（一）

目录概率论 1.1 离散随机变量分布 1）伯努利分布 2）二项分布 3）泊松分布 1.2 连续随机变量分布 1）均匀分布 2）指数分布 3）正态分布总结系列文章目录概率论 …

人工智能 2023年7月16日
00102
GEE|用随机森林进行农作物分类的一次尝试

参考：https://www.bilibili.com/video/BV1HL4y1M7ue?spm_id_from=333.337.search-card.all.click ;…

人工智能 2023年6月30日
0083
SqlSugar 4.数据事务

文章目录 * – 1.单库事务 – 2.多租户事务(可跨库) – 3.调试事务 – 4.语法糖 – + 4.1 语法糖一…

人工智能 2023年6月18日
0098
swin-transformer详解及代码复现

1. swin-transformer网络结构实际上，我们在进行代码复现时应该是下图,接下来我们根据下面的图片进行分段实现 ; 2. Patch Partition & …

人工智能 2023年6月23日
0092
基于MATLAB的图片中文字的提取及识别

基于MATLAB的图片中文字的提取及识别一．引言随着计算机科学的飞速发展，以图像为主的多媒体信息迅速成为重要的信息传递媒介，在图像中，文字信息(如新闻标题等字幕) 包含了丰富的…

人工智能 2023年6月16日
0096
云知声（Unisound）蜂鸟系列AI离线语音识别芯片方案介绍

云知声（Unisound）作为行业内领先的人工智能企业，拥有全栈式的语音技术，将语音识别、语义理解、自然语言处理、语音合成、声音降噪算法、海量语音数据、专用芯片开发等技术融合实现…

人工智能 2023年5月23日
00151
MediaPipe实现手指关键点检测及追踪，人脸识别及追踪

OpenCV 是一个用于计算机视觉应用程序的库。在 OpenCV 的帮助下，我们可以构建大量实时运行更好的应用程序。主要用于图像和视频处理。可以在此处获取有关 OpenCV 的更…

人工智能 2023年7月20日
0087
模型训练时应能根据训练数据自动改变网络结构和网络层数

概述神经网络和深度学习技术发展到如今的程度，已经在各行各业得到了广泛的应用，但是，我们看到的学术论文和各种技术报告中的神经网络结构，都是在训练之前设计好的，并且在训练过程中不会再…

人工智能 2023年7月14日
0069
全国大学生软件测试大赛【嵌入式测试个人赛】【练习题分析】

### 回答1：嵌入式软件测试_指的是对 _嵌入式_系统中的 _软件_进行 _测试_的一种方法。 _嵌入式_系统是指集成了 _软件、硬件和电子元器件等功能于一体的系统，…

人工智能 2023年7月6日
0054
视觉机器学习20讲-MATLAB源码示例（1）-Kmeans聚类算法

视觉机器学习20讲-MATLAB源码示例（1）-Kmeans聚类算法 1. K-means聚类算法 2. Matlab仿真 3. 仿真结果 4. 小结 ; 1. K-means聚类…

人工智能 2023年6月2日
0079
多分类任务中精确率(Precision)、召回率(Recall)以及准确率(Accuracy)评估指标的计算

1 三个评价指标的意义精确率：在被识别为正类别的样本（预测分类结果）中，确实为正类别的比例是多少召回率：在所有正类别样本（真实分类结果）中，被正确识别为正类别的比例是多少？准…

人工智能 2023年7月5日
0087
机器学习笔记(二)梯度下降法实现对数几率回归(Logistic Regression)

目录前言一、梯度下降法(Gradient Descent) * 1.1 Python简单实现二、对数几率回归模型三、梯度下降法实现对数几率回归 * 3.1 西瓜数据集展…

人工智能 2023年6月17日
0086
机器学习-科学数据库day4

1.pandas常用数据类型（1）Series 一维，带标签数组（2）DataFrame 二维，Series 容器 2.pandas 之Series 切片和索引 t 的输出： …

人工智能 2023年7月8日
0063
IMDB电影数据分析实践

IMDB电影数据分析实践根据IMDB5000部电影数据集进行下列数据分析：数据准备：读取数据并查看数据的基本信息数据清洗：缺失值处理，重复值处理，处理后”干净&#…

人工智能 2023年7月16日
0067

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

关于label smoothing(标签平滑)

大家都在看