「解析」FocalLoss 解决数据不平衡问题

2023年7月10日上午2:59 • 人工智能 • 阅读 68

Focal Loss for Dense Object Detection;
官方代码：https://github.com/facebookresearch/Detectron

FocalLoss 的出现，主要是为了解决 anchor-based (one-stage) 目标检测网络的分类问题。后面实例分割也常使用。

注意
这里是 目标检测网络的分类问题，而不是单纯的分类问题，这两者是不一样的。
区别在于，对于分配问题，一个图片一定是属于某一确定的类的；而检测任务中的分类，是有大量的anchor无目标的（可以称为负样本）。

分类任务

正常的 K类分类任务 的标签，是用一个K长度的向量作为标签，用one-hot（或者+smooth，这里先不考虑）来进行编码，最终的标签是一个形如[1,…, 0, …, 0]这样的。那么如果想要将背景分离出，自然可以想到增加一个1维，如果目标检测任务有K类，这里只要用K+1维来表示分类，其中1维代表无目标即可。对于分类任务而言，最后一般使用 softmax 来归一，使得所有类别的输出加和为1。

但是在检测任务中，对于无目标的anchor，我们并不希望最终结果加和为1，而是所有的概率输出都是0。那么可以这样，我们将一个多分类任务看做多个二分类任务(sigmoid)，针对每一个类别，我输出一个概率，如果接近0则代表非该类别，如果接近1，则代表这个anchor是该类别。

所以网络输出不需要用softmax来归一，而是对K长度向量的每一个分量进行sigmoid激活，让其输出值代表二分类的概率。对于无目标的anchor，gt中所有的分量都是0，代表属于每一类的概率是0，即标注为背景。

至此，FocalLoss解决的问题不是多分类问题，而是 多个二分类问题。

; 公式解析

首先看公式：只有标签y = 1 y=1 y =1时，公式/交叉熵才有意义，p t p_t p t 即为标签为1时对应的预测值/模型分类正确的概率
p t = ( 1 − p r e d _ s i g m o i d ) ∗ t a r g e t + p r e d _ s i g m o i d ∗ ( 1 − t a r g e t ) p_t = (1 – pred_sigmoid) * target + pred_sigmoid * (1 – target)p t =(1 −p re d _s i g m o i d )∗t a r g e t +p re d _s i g m o i d ∗(1 −t a r g e t )

C E ( p t ) = − α t log ⁡ ( p t ) F L ( p t ) = − α t ( 1 − p t ) γ log ⁡ ( p t ) F L ( p ) = { − α ( 1 − p ) γ log ⁡ ( p ) , i f y = 1 − ( 1 − α ) p γ log ⁡ ( 1 − p ) , i f y = 0 CE(p_t)=-\alpha_t \log(p_t) \ \quad \ FL(p_t)=-\alpha_t(1-p_t)^\gamma \log(p_t) \ \quad \ FL(p) = \begin{cases} \quad -\alpha(1-p)^\gamma \log(p) &, if \quad y=1 &\ -(1-\alpha)p^\gamma \log(1-p)&,if \quad y=0 \end{cases}CE (p t )=−αt lo g (p t )F L (p t )=−αt (1 −p t )γlo g (p t )F L (p )={−α(1 −p )γlo g (p )−(1 −α)p γlo g (1 −p ),i f y =1 ,i f y =0

参数p[公式3]：当 p->0时（概率很低/很难区分是那个类别），调制因子 (1-p)接近1，损失不被影响，当 p->1时，(1-p)接近0，从而减小易分样本对总 loss的贡献
参数γ \gamma γ：当γ = 0 \gamma=0 γ=0 时，Focal loss就是传统的交叉熵，
当γ \gamma γ 增加时，调节系数( 1 − p t ) (1-p_t)(1 −p t ) 也会增加。
当γ \gamma γ 为定值时，比如γ = 2 \gamma=2 γ=2 1⃣️对于easy example(p>0.5) p=0.9 的loss要比标准的交叉熵小 100倍，当 p=0.968时，要小1000+倍；2⃣️对于 hard example(p
α \alpha α 调节正负样本不平衡系数，γ \gamma γ 控制难易样本不平衡

代码复现

在官方给的代码中，并没有 target = F.one_hot(target, num_clas) 这行代码，这是因为


import torch
from torch.nn import functional as F

def sigmoid_focal_loss( inputs: torch.Tensor, targets: torch.Tensor, alpha: float = -1,
                        gamma: float = 2, reduction: str = "none") -> torch.Tensor:

    inputs  = inputs.float()
    targets = targets.float()
    p       = torch.sigmoid(inputs)
    target  = F.one_hot(target, num_clas+1)

    ce_loss = F.binary_cross_entropy_with_logits(inputs, targets, reduction="none")
    p_t     = p * targets + (1 - p) * (1 - targets)
    loss    = ce_loss * ((1 - p_t) ** gamma)

    if alpha >= 0:
        alpha_t = alpha * targets + (1 - alpha) * (1 - targets)
        loss = alpha_t * loss

    if reduction == "mean":
        loss = loss.mean()
    elif reduction == "sum":
        loss = loss.sum()

    return loss

sigmoid_focal_loss_jit: "torch.jit.ScriptModule" = torch.jit.script(sigmoid_focal_loss)

此外，torchvision 中也支持 focal loss

完整代码

官方完整代码：https://github.com/facebookresearch/

参考

https://zhuanlan.zhihu.com/p/391186824

Original: https://blog.csdn.net/ViatorSun/article/details/124861342
Author: ViatorSun
Title: 「解析」FocalLoss 解决数据不平衡问题

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/681957/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

关于猫狗大战中出现python编码错误：UnicodeDecodeError: ‘utf8‘ codec can‘t decode的解决办法

Traceback (most recent call last):File “D:/Anaconda3/My-TensorFlow-tutorials-master/…

人工智能 2023年5月25日
0094
是什么，它在AI算法中的作用是什么

问题：在AI算法中，Batch Normalization（批归一化）是什么？它的作用是什么？详细介绍： Batch Normalization是一种用于神经网络的技术，旨在解决…

人工智能 2024年1月2日
0041
OpenCV图像处理基本操作 Open_CV系列（一）

文章目录 1.安装OpenCV-Contrib-Python库 2.读取图片文件像素值数组 3.显示图像 * ①cv2.imshow() ②cv2.waitKey() ③cv.de…

人工智能 2023年6月19日
0087
深度学习理论：Categorical crossentropy 损失函数

分类交叉熵是一种用于多类分类任务的损失函数。在这些任务中，一个示例只能属于许多可能类别中的一个，模型必须决定哪个类别。形式上，它旨在量化两种概率分布之间的差异。分类交叉熵的数学…

人工智能 2023年7月27日
0072
NLP–文本清洗–停用词处理

导入停用词表停用词表主要包括了句子中常见的用语，这种用语对于所有文本都没有差异性。针对一般性的停用词表可以自行上网找相对应的stopwords导入，如nltk.corpus.st…

人工智能 2023年5月27日
0084
数据湖是什么？有什么优势？与数仓区别？未来的发展？

数据湖是什么？有什么优势？与数仓区别？未来的发展？一、什么是数据湖二、数据湖的发展三、数据湖有哪些优势四、数据湖应该具备哪些能力五、数据湖的实现遇到了哪些问题六、数据湖…

人工智能 2023年7月15日
0064
Mahout实践：Mahout聚类算法-10

Mahout实践：Mahout聚类算法 1、实验描述本实验通过在安装配置好的Hadoop集群和Mahout框架的基础上，完成了Kmeans算法的聚类任务。实验时长：45分钟主…

人工智能 2023年6月2日
0069
安装tensorflow-gpu

安装tensorflow，主要是关于GPU 一、写在前面二、两个XPU的区别三、前提 4、安装版本须知 * 4.1、CUDA和CUDNN 4.2 编辑系统环境变量 4.3、安装…

人工智能 2023年5月24日
0075
anaconda安装pytorch-gpu（无需换源）

如何在anaconda里面安装gpu版本的pytorch? 注：本人翻看了大量的帖子并参照了很多方法去安装，最后发现输入print(torch.cuda.is_available(…

人工智能 2023年7月24日
0082
《Python数据分析与应用》第5章使用Pandas进行数据预处理实训部分

《Python数据分析与应用》第5章使用Pandas进行数据预处理实训部分(源于大学课程python数据分析) 实训1合并线损、用电量趋势与线路告警数据 2.查看两表形状3.以I…

人工智能 2023年7月18日
0076
pytorch中的所有随机数（normal、rand、randn、randint、randperm) 以及随机数种子(seed、manual_seed、initial_seed)

torch的所有随机数官方已经整理在torch — PyTorch 1.10.0 documentation这个页面了，我又重新整理到了本blog中，用中文进行了部分解释，方便理解…

人工智能 2023年6月24日
0091
【SQL实战项目】电商平台数据分析项目

一.分析背景和目的背景介绍电商平台数据分析是最为典型的一个数据分析赛道，且电商数据分析有着比较成熟的数据分析模型，比如：人货场模型。此文中我将通过分析国内最大的电商平台——淘宝…

人工智能 2023年7月15日
00126
vue项目中实际封装DateRangePicker组件使用

vue项目中实际封装DateRangePicker组件使用前言一、封装el-date-picker 二、父组件中进行引用总结前言日期选择器在实际使用中，可能会要求默认固定…

人工智能 2023年6月28日
0072
如何系统学习VCU电控开发

新能源汽车（EV/HEV）整车控制器（VCU）是新能源汽车的核心控制部件，VCU控制技术水平直接影响着整车的动力性、安全性及经济性。作为国家重点发展的技术方向，近年来随着我国大力…

人工智能 2023年6月2日
0083
Python备忘录（自用）

师兄之前整理的python备忘录，上传防丢 1. Anaconda Prompt 怎么切换工作路径到E盘以及更改默认打开路径？链接: https://blog.csdn.net…

人工智能 2023年5月25日
0085
文本多标签分类模型开发记录

文本分类是NLP应用领域中最常见也最重要的任务类型，也是机器学习领域的经典应用场景之一。本文通过笔者工作中的一个真实案例，讨论通过机器学习实现文本多标签分类的过程以及一些优化经验…

人工智能 2023年7月1日
00105

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

「解析」FocalLoss 解决数据不平衡问题

分类任务

; 公式解析

代码复现

完整代码

参考

大家都在看