深入剖析Focal loss损失函数

2023年7月26日下午6:33 • 人工智能 • 阅读 71

目标检测方法常常使用先验框提高预测性能，一张图像可能生成成千上万的先验框，但是其中只有很少一部分能匹配到目标(正样本)，而没有匹配到目标的先验框占大多数。这种情况造成了One-Stage目标检测方法的正负样本不平衡。

如下图所示，红色的先验框都没有匹配到目标，所以它们都属于负样本，只是图中间的黄色先验框匹配到目标，所以它们是正样本。显然，这里的正负样本严重失衡。

而对于two stage模型，比如Faster R-CNN这种two stage模型，第一阶段的RPN可以过滤掉很大一部分负样本，最终第二阶段的检测模块只需要处理少量的候选框，而且检测模块还采用正负样本固定比例抽样（比如1:3），所以可以在一定程度上解决正负样本不均衡的情况(其实two-stage模型也存在正负样本不均衡的情况，但是相对于one-stage模型来说，不均衡情况每那么严重)。

正因为正负样本的不均衡情况，使得One-Stage目标检测方法的检测效果比不上Two-Stage目标检测方法。

与此同时，在那些大量未匹配到目标的负样本中，大部分都是简单易分的负样本，这些简单的负样本对网络训练起不到太大的作用，但是由于数量太多，会淹没掉少量但有助于训练的样本。

比如假如一张图片上有10个正样本，每个正样本的损失值是3，那么这些正样本的总损失是10×3=30。而假如该图片上有10000个简单易分负样本，尽管每个负样本的损失值很小，假设是0.1，那么这些简单易分负样本的总损失是10000×0.1=1000，那么损失值要远远高于正样本的损失值。所以如果在训练的过程中使用全部的正负样本，那么它的训练效果会很差。而Focal Loss是一种新的用于平衡One-Stage目标检测方法正负样本的Loss方案。Focal Loss从另外的视角来解决样本不平衡问题，那就是根据置信度动态调整交叉熵loss，当预测正确的置信度增加时，loss的权重系数会逐渐衰减至0，这样模型训练的loss更关注难例，而大量容易的例子其loss贡献很低。

下面我们来逐步分析一下Focal Loss:

下面公式是二分类交叉熵损失函数

其中，y是样本的标签值，而p是模型预测某一个样本为正样本的概率，对于真实标签为正样本的样本，它的概率p越大说明模型预测的越准确，对于真实标签为负样本的样本，它的概率p越小说明模型预测的越准确，

对于上面的二分类交叉熵损失函数来说，如果将它展开，可以写成下面的公式一的形式：

注意：这里的log(x)其实就是ln(x)

如果我们定义p t p_t p t 为如下形式:

那么公式一可以表示成下面的公式二：

那么公式二变成了下面的公式三：

又因为样本有难易之分，所以我们必须要能区分出困难样本和简单样本，所以我们设置一个系数

它可以降低简单样本的损失贡献，而使得训练时更重视一些困难样本。
此时公式二变成了下面的公式四：

这里的γ \gamma γ通常设置为2，例如预测正样本概率是0.95（即对于一个真实标签为正样本的样本，使用模型预测它也是正样本的概率是0.95)，这显然是一个简单的样本，则该样本的难易权是

如果预测正样本概率是0.5 ，这显然是一个稍微困难一定的样本，则该样本的难易权值是

如果预测负样本的概率为0.9（即对于一个真实标签为负样本的样本，使用模型预测它是正样本的概率是0.9)，这显然是一个困难的样本，则该样本的难易权重是

如果预测负样本的概率为0.1（即对于一个真实标签为负样本的样本，使用模型预测它是正样本的概率是0.1)，这显然是一个简单的样本，则该样本的难易权重是

结合公式三和公式四，我们得到了Focal Loss损失函数，如下面公式五所示:

将公式五展开，Focal Loss损失函数可以写成如下公式六的形式：

如果将公式六进一步展开，可得到最终的Focal Loss损失函数：
深入剖析Focal loss损失函数

注意：Focal Loss损失函数容易受到噪声的干扰。也就是说训练集中标注的信息尽量不要出现错误的情况，否则Focal Loss损失函数就会针对那些标注错误的样本进行重点学习，使得模型的训练效果越来越差。因为根据Focal Loss损失函数的原理，它会重点关注困难样本，而此时如果我们将某个样本标注错误，那么该样本对于网络来说就是一个”困难样本”，所以Focal Loss损失函数就会重点学习这些”困难样本”，导致模型训练效果越来越差

下面我们将二分类交叉熵损失函数和Focal loss损失函数做一个对比。分别使用困难样本和简单样本来计算它们的两种损失值，由下表可知，显然Focal Loss损失函数可以明显的区分出简单样本和困难样本，对于简单样本，它所对应的Focal Loss损失值就会很小。对于困难样本，它所对应的Focal Loss损失值就会很大。并且根据二分类交叉熵损失函数和Focal loss损失函数的比值可知，对于困难样本来说，使用这两种损失函数计算的损失值相差不大，但是对于简单样本来说，使用这两种损失函数计算的损失值相差巨大，这也进一步证明了Focal loss损失函数要比二分类交叉熵损失函数更能区分出简单样本和困难样本。

Original: https://blog.csdn.net/m0_56192771/article/details/124270842
Author: 无码不欢的我
Title: 深入剖析Focal loss损失函数

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/717261/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

opencv读取图片通道以及显示

使用cv2读取的图像的通道到是BGR通道，所以测试模型之前需要做BGR转RGB的操作。 img=cv2.imread(‘515.jpg’) cv2.imshow("aa&…

人工智能 2023年7月19日
0060
Anaconda下安装tensorflow (windows系统)

因为之前Anaconda、python都已经装好了（可以看之前文章Anaconda超详细安装教程（Windows环境下）_fan18317517352的博客-CSDN博客（本人技术…

人工智能 2023年6月17日
0088
虚拟机基本使用 IV

虚拟机基本使用 IV 1.实现虚拟机搜索功能之前我我们已经修改了yml文件,将搜索的目标更换为虚拟机中的ES 在虚拟机的连接环境中,我们使用SpuEntity来实现ES的连接我…

人工智能 2023年6月28日
0073
对比学习 ——simsiam 代码解析。：

目录 1 ：事先准备。 2 ：代码阅读。 2.1: 数据读取 2.2：模型载入 3 训练过程： 4 测试过程： 5 ：线性验证 6 ：用自己数据集进行对比学习。第一： …

人工智能 2023年7月26日
0061
【吴恩达机器学习】Week4 编程作业ex3——多分类任务和神经网络

Multi-class Classification 1. 数据预处理和可视化 dispalyData.m function [h, display_array] = displa…

人工智能 2023年7月14日
00103
Golang仿云盘项目-2.1 基础版文件上传

目录结构 E:\goproj\FileStorageDisk │ main.go │ readme.txt │ ├─handler │ handler.go │ └─static …

人工智能 2023年6月4日
0075
深度学习模型计算量评价指标FLOPs, MACs, MAdds关系

在评价深度学习模型的大小和计算量时，经常使用的参数有：parameters, FLOPs, MACs, MAdds。除此以外，我们还经常见到MAC, FLOPS, GFLOPS, …

人工智能 2023年7月20日
0055
逻辑回归的损失函数是什么

问题：关于逻辑回归的损失函数是什么？详细介绍：逻辑回归是一种常用的统计学习方法，用于处理二分类问题。它通过在输入变量的线性组合上应用一个非线性函数（称为激活函数）来预测一个离散…

人工智能 2024年1月6日
0063
Ubuntu18.04+ZED SDK安装+ZED Python API+zed ros wrapper安装手把手详细教程

1.安装前准备 1.ubuntu显卡驱动要有，没有的可以搜索如何安装ubuntu显卡驱动，教程很多，这里不再详细说明 2.ROS需要提前安装好，可以搜索ubuntu如何安装ROS。…

人工智能 2023年7月9日
0090
OpenCV图像几何变换专题(缩放、翻转、仿射变换及透视)【python-Open_CV系列（五）】

OpenCV图像几何变换专题(缩放、翻转、仿射变换及透视)(python为工具) 【Open_CV系列（五）】文章目录准备图片 1. 缩放 cv2.resize()方法 2. …

人工智能 2023年6月17日
0071
Python数据分析上机

一,Numpy数值计算上机 1．创建数组并进行运算。（1）创建一个数值范围为0~1，间隔为0.01的数组，并查看该数组的维度。（2）创建100个服从正态分布的随机数，并查看数组的类…

人工智能 2023年7月16日
0070
SELD_net_questions

SELD-net实验问题梳理源代码调试时遇到的错误及解决 seld-net原版代码：https://gitee.com/karas1/seld-net 拿到源代码后，按照read…

人工智能 2023年5月25日
0073
【论文考古】量化SGD Federated Learning with Quantization Constraints

以减小量化后参数误差为目标，利用格编码和多用户合并时的增益，提升联邦学习的性能表现简介这篇文章是通信领域对FL进行量化的代表作，其中挂名的IEEE Fellow都是通信领域的大…

人工智能 2023年6月4日
0095
ubuntu20.04安装pytorch运行环境（附安装问题）

python3.7安装卸载默认版本 Ubuntu默认的python版本一般为python 2.x，因此需要手动安装自己需要的版本，并且将python的指向更新为自己的版本。如果已…

人工智能 2023年7月23日
0052
递归算法（1163~1167）(未完结)

递归算法（1163~1167） 1163：阿克曼(Ackmann)函数 1164：digit函数 1165：Hermite多项式 1166：求f(x,n) 1167：再求f(x,n…

人工智能 2023年6月27日
0091
【数字图像处理】实验（1）——图像基本变换

图像基本变换一、实验意义及目的二、实验内容三、实验原理四、Matlab相关函数介绍五、代码及结果 * （1）将Image1色彩通道互换，并显示效果；（2）将Image1…

人工智能 2023年6月17日
00156

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深入剖析Focal loss损失函数

大家都在看