关于label smoothing的理解

2023年5月30日下午8:41 • 人工智能 • 阅读 83

背景介绍

提到label smoothing（标签平滑），首先介绍一下什么是hard label和soft label.

简单来说，hard label就是非1即0，不存在既可能是A也可能是B的情况，soft label则不同，它并不要求所有的”精力”全部倾向一个，允许模棱两可的状态，比如这幅画有40%的概率是猫， 60%的概率是狗。

什么时候会用到

标签平滑在机器学习或者深度学习中可以看作是一种正则化的技巧。它能提高分类任务中模型的泛化性能和准确率，缓解数据分布不平衡的问题。

为什么说能提高模型的泛化性能和准确率呢，我们需要从公式角度出发理解：

对于hard label的情况，softmax之后输出的结果为：

![在这里插入图片描述](https://img-blog.csdnimg.cn/978a0cc999![在这里插入图

可以看出，如果要想损失的loss为0，那么极限条件就是让正样本的输出值为1，负样本的输出值为0，而要想达到负样本的概率为0，则要求模型输出的logits值为负无穷，而正样本的输出值为常数。这种做法的弊端显而易见：
（1）当数据样本中有信息标注错误时，造成的后果就是一错再错，泛化能力特别差。
（2）一般模型中最后的输出值一般都是有界的，并且由于模型中会加入一些正则化的手段等，不可能，很难更新到理想的效果，在同等训练epoch条件下。

label smooth是在《Rethinking the inception architecture for computer vision》里面提出来的。可以设定超参数对label进行soft。

这里的负样本的softmax后的值为a，正负样本之间的差距只要达到

就可以认为达到理想的值，loss为0，相比hard label的无穷大的界限，这种方法的界限是有界的，更容易让模型学习到，同时由于存在其他信息，会使模型的泛化能力更加好。
所以，在损失函数为交叉熵的情况下，如果我们使用label-smooth编码，错误类的logit不会要求是负无穷。且错误类和正确类的logit值有一定大小误差的情况下，loss就会很小很小。
关于label smoothing的理解

同时，可以看一下这张图，概率值达到一定值后，曲线变的越来越平缓，再优化很难更新。

综上，标签平滑可以产生相对较好的校准网络，从而更好的去泛化网络，最终用于对未知的数据进行预测。
【参考】
https://zhuanlan.zhihu.com/p/343807710

Original: https://blog.csdn.net/amf12345/article/details/123999241
Author: 星辰浩宇
Title: 关于label smoothing的理解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/544978/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【中秋赏码】Java程序员用中文编程教你做月饼。

; 一、前言什么? 花好月圆之日你还在写Bug? 什么? 花好月圆之日你还在加班? 什么? 花好月圆之日你还没有女朋友? 没关系我也没有😭。不过还好, 至少公司还发了一盒月饼。那…

人工智能 2023年5月30日
00128
一起来学强化学习系列(一)-gym环境搭建

前言为何开此系列：近期在学习强化学习，故开此系列博文和大家一起学习，一起交流，同时也是为了起到监督自己的效果。该系列使用到的教材：深入浅出强化学习我可能会如何学习：原理当然…

人工智能 2023年6月25日
0086
人人都能学会数据分析-笔记

第01周走进数据分析 1-1 互联网数据分析通用课程-导学课程导学随着互联网的发展，任何岗位都离不开数据分析互联网 => 数据 => 价值用户 => 网…

人工智能 2023年6月11日
00123
ROS下ZED相机的安装与标定

一、ROS Melodic的安装: 借鉴鱼香ROS的安装方法 sudo apt-get install curl && curl http://fishros.co…

人工智能 2023年6月2日
0087
Yolov5-5.0源码分享以及环境配置——Yolov5训练及测试教程(超详细含数据集制作，格式转换，数据集划分)

yolov5-5.0百度网盘连接链接: https://pan.baidu.com/s/1Hd2KKBixuEWRv3jcH6Bcsw 提取码: g6xf 复制这段内容后打开百度…

人工智能 2023年7月10日
0093
看门狗实验

独立看门狗适合精度低窗口看门狗适合精度高一直喂狗就不会复位了，但是如果程序跑飞，就喂不成狗，就会复位了。写入0x5555是取消保护，可以访问的意思0xCCCC启动看门狗单位ms，p…

人工智能 2023年6月30日
0076
多种方法（聚类、衍生变量、多重筛选、损失函数）解决解决异常值识别效果不佳问题（含2022年全国服务外包大赛实例）

我们以2022年全国服务外包大赛的A03题目作为示例。问题的主要任务时找出商品的销量异常和价格异常，提供4个月的商品信息数据，共1700万余条，4个月的店铺信息数据，共60万余条，…

人工智能 2023年7月16日
0084
js中的拖拽

拖拽基本实现思路（mouse事件替代）滑到盒子上，按住盒子；鼠标走，盒子拖着走；结束了，松开鼠标，即抬起； mousedown 按下 mousemove 跟着走 mouse…

人工智能 2023年6月28日
00102
Unity插件——文字转朗读语音RtVioce插件功能/用法/下载

目录插件 – RtVioce 一、使用步骤 * 1.导入进Unity（插件形式为 .unitypackage） 2.添加所需Prefab 3.代码调用二、下载地址 …

人工智能 2023年5月25日
00114
机器学习学习整理（二）对数几率回归与支持向量机

文章目录前言对数几率回归支持向量机 * 感知机支持向量机 – 线性可分近似线性可分线性不可分总结前言欢迎大家来看我的机器学习第二章，hhh这其实是第二…

人工智能 2023年6月17日
0075
Halcon区域形状特征-area_center、area_holes、select_shape、inner_circle和smallest_rectangle2算子

提示：文章参考了网络上其他作者的文章，以及相关书籍，如有侵权，请联系作者。前言在场景中选择物体的特征是图像测量或者识别的重要基础。区域的形状特征是非常常用的特征，在模式匹配中，…

人工智能 2023年5月26日
00124
MySQL库的操作

文章目录 MySQL库的操作 * 创建数据库创建数据库案例字符集和校验规则 – 查看系统默认字符集以及校验规则查看数据库支持的字符集查看数据库支持的字符集校验规…

人工智能 2023年7月31日
0049
Python 基于OpenCV+face_recognition实现人脸捕捉与人脸识别（照片对比）

1.安装包依赖与上篇通过摄像头动态识别人脸一样，先下载好opencv-python、face-recognition，这里因为使用的是照片对比的方式，特意使用tkinter画了一…

人工智能 2023年5月28日
0071
pandas模块和随堂笔记(1)

一个开源的python类库，用于数据分析、数据处理、数据可视化高性能、容易使用的数据结构、容易使用的数据分析工具 pandas数据类型 Series是由相同数据类型组成的一维数组…

人工智能 2023年7月8日
0065
基于opencv的车牌号码识别必备基础知识

车牌号码识别必备基础知识 1、cv2.split 拆分通道 2、cv2.merge 通道合并 3、cv2.imshow() 和 plt.show（） 4、卷积及相关操作 5、cv…

人工智能 2023年7月19日
0078
(三)Omniglot Dataset介绍

欢迎访问个人网络日志🌹🌹知行空间🌹🌹 Omniglot Dataset介绍 * – 0.用来做什么 – 1.什么时候从哪来 – 2.包含什么内容…

人工智能 2023年6月15日
0084

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

关于label smoothing的理解

背景介绍

什么时候会用到

大家都在看