关于Focal loss损失函数的代码实现

2023年9月29日上午7:04 • Python • 阅读 42

Focal loss的公式：其中用到的交叉熵损失函数表达式是（3）
F L （ p t ） = − ( 1 − p t ) γ log ⁡ p t (1) FL（p_{t}） = – (1 – p_{t})^{\gamma}\log{p_{t}}\tag{1}F L （p t ）=−(1 −p t )γlo g p t (1 )
其中:
p t = { p i f y = 1 1 − p o t h e r w i s e (1.1) p_{t}=\begin{cases} p& if & y = 1 \ 1-p && otherwise \end{cases}\tag{1.1}p t ={p 1 −p i f y =1 o t h er w i se (1.1 )
BCE：二分类
L = − ∑ i = 1 N ( y i log ⁡ y ^ i + ( 1 − y i ) log ⁡ ( 1 − y ^ i ) ) (2) L = -\sum^N_{i=1}(y_{i}\log{\hat{y}{i}} + (1-y{i})\log{(1-\hat{y}}_{i}))\tag{2}L =−i =1 ∑N (y i lo g y ^i +(1 −y i )lo g (1 −y ^i ))(2 )
CE：多分类，当其是二分类时候与BCE有什么区别可见上面的链接
L = − ∑ i = 1 N ( y i log ⁡ y ^ i ) (3) L = -\sum^N_{i=1}(y_{i}\log{\hat{y}_{i}} )\tag{3}L =−i =1 ∑N (y i lo g y ^i )(3 )
pytorch中具体实现方法可以查看：[CrossEntropyLoss — PyTorch 1.12 documentation]
softmax，log_softmax，nllloss的表达式：
关于nllloss专门整理一篇介绍。
σ ( z ) j = e z j ∑ k = 1 n e z k (softmax) \sigma(z){j} = \frac{e^{z{j}}}{\sum_{k=1}^ne^{z_{k}}}\tag{softmax}σ(z )j =∑k =1 n e z k e z j (softmax )

l o g s o f t m a x = ln ⁡ σ ( z ) j logsoftmax = \ln{\sigma(z)_{j}}l o g so f t ma x =ln σ(z )j

n l l l o s s = − 1 N ∑ k = 1 N y k ( l o g s o f t m a x ) nllloss = – \frac{1}{N}\sum_{k=1}^Ny_{k}(logsoftmax)n lll oss =−N 1 k =1 ∑N y k (l o g so f t ma x )

使用pytorch实现focal loss源码如下：（个人觉得比较简练的一个）

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, Dataset

import torchvision
import torchvision.transforms as F

from IPython.display import display
class FocalLoss(nn.Module):

    def __init__(self, weight=None, reduction='mean', gamma=0, eps=1e-7):
        super(FocalLoss, self).__init__()
        self.gamma = gamma
        self.eps = eps
        self.ce = torch.nn.CrossEntropyLoss(weight=weight, reduction=reduction)

    def forward(self, input, target):
        logp = self.ce(input, target)
        p = torch.exp(-logp)
        loss = (1 - p) ** self.gamma * logp
        return loss.mean()

代码实现的原理如下：

pytorch中交叉熵损失函数所有表达式，类比(3)
l o s s ( x , c l a s s ) = − log ⁡ e x c l a s s ∑ j e x j = − x c l a s s + log ⁡ ∑ j e x j (3) loss(x,class) = -\log{\frac{e^{x_{class}}}{\sum_{j}e^{x_j}}}= -x_{class} + \log{\sum_{j}e^{x_j}}\tag{3}l oss (x ,c l a ss )=−lo g ∑j e x j e x c l a ss =−x c l a ss +lo g j ∑e x j (3 )
α-balanced交叉熵结合表达式
l o s s ( x , c l a s s ) = α c l a s s ∗ ( − x c l a s s + log ⁡ ∑ j e x j ) (4) loss(x,class)= \alpha_{class}*(-x_{class} + \log{\sum_{j}e^{x_j}})\tag{4}l oss (x ,c l a ss )=αc l a ss ∗(−x c l a ss +lo g j ∑e x j )(4 )
focal loss表达式：
l o s s ( x , c l a s s ) = ( 1 − e x c l a s s ∑ j e x j ) γ − log ⁡ e x c l a s s ∑ j e x j = ( 1 − e x c l a s s ∑ j e x j ) γ ( − x c l a s s + log ⁡ ∑ j e x j ) = − ( 1 − p t ) γ log ⁡ ( p t ) (5) loss(x,class) =(1 – \frac{e^{x_{class}}}{\sum_{j}e^{x_j}})^{\gamma} -\log{\frac{e^{x_{class}}}{\sum_{j}e^{x_j}}} =(1 – \frac{e^{x_{class}}}{\sum_{j}e^{x_j}})^{\gamma}(-x_{class} + \log{\sum_{j}e^{x_j}}) = -(1-p_{t})^{\gamma} \log{(p_{t})}\tag{5}l oss (x ,c l a ss )=(1 −∑j e x j e x c l a ss )γ−lo g ∑j e x j e x c l a ss =(1 −∑j e x j e x c l a ss )γ(−x c l a ss +lo g j ∑e x j )=−(1 −p t )γlo g (p t )(5 )
带有alpha平衡参数的focal loss表达式：
l o s s ( x , c l a s s ) = − α t ( 1 − p t ) γ log ⁡ ( p t ) (6) loss(x,class) = -\alpha_{t}(1-p_{t})^{\gamma} \log{(p_{t})}\tag{6}l oss (x ,c l a ss )=−αt (1 −p t )γlo g (p t )(6 )
将CrossEntropyLoss改成Focal Loss
− log ⁡ p t = n n . C r o s s E n t r o p y L o s s ( i n p u t , t a r g e t ) (7) -\log{p_{t}} = nn.CrossEntropyLoss(input, target)\tag{7}−lo g p t =nn .C ross E n t ro p y L oss (in p u t ,t a r g e t )(7 )
那么：
p t = t o r c h . e x p ( − n n . C r o s s E n t r o p y L o s s ( i n p u t , t a r g e t ) ) (8) p_{t} = torch.exp(-nn.CrossEntropyLoss(input, target))\tag{8}p t =t orc h .e x p (−nn .C ross E n t ro p y L oss (in p u t ,t a r g e t ))(8 )
所有Focal loss的最终为
f o c a l l o s s = − α t ( 1 − p t ) γ log ⁡ ( p t ) (9) focalloss = -\alpha_{t}(1-p_{t})^{\gamma} \log{(p_{t})}\tag{9}f oc a ll oss =−αt (1 −p t )γlo g (p t )(9 )
当然考虑到是mini-batch算法，因此最后一步取均值运算。

关于使用CE与BCE的实现方法可以参考以下代码：（关于γ与α的调参也有部分解答）

基于二分类交叉熵实现


class FocalLoss(nn.Module):
    def __init__(self, alpha=1, gamma=2, logits=False, reduce=True):
        super(FocalLoss, self).__init__()
        self.alpha = alpha
        self.gamma = gamma
        self.logits = logits
        self.reduce = reduce

    def forward(self, inputs, targets):
        if self.logits:
            BCE_loss = F.binary_cross_entropy_with_logits(inputs, targets, reduce=False)
        else:
            BCE_loss = F.binary_cross_entropy(inputs, targets, reduce=False)
        pt = torch.exp(-BCE_loss)
        F_loss = self.alpha * (1-pt)**self.gamma * BCE_loss

        if self.reduce:
            return torch.mean(F_loss)
        else:
            return F_loss

其他的参考资料

关于binary_cross_entropy_with_logits与binary_cross_entropy的区别可以看：

关于focal loss二分类公式的一些变形可以参考：

使用纯pytorch代码实现focal loss

辅助理解代码实现：

Original: https://blog.csdn.net/Lian_Ge_Blog/article/details/126247720
Author: Lian_Ge_Blog
Title: 关于Focal loss损失函数的代码实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/787049/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

大数据毕业设计题目50例

1、”放管服”环境下科技政务大数据平台研究 2、大数据对会计的挑战及其应对策略试析 3、新疆畜牧业进入大数据时代 4、大数据时代高校教学实效问题与路径选择 …

Python 2023年11月5日
0050
如何解决：FileNotFoundError: 以及[Errno 2]No such file or directory

——————————出错原因——&#…

Python 2023年8月2日
0043
flask_socketio踩到的坑

需求：读视频里有人像图片的帧，拿到图片帧，传递给其他同事封装好的算法，获取去隐私后坐标信息。实现方法： python服务读取摄像头，拿到摄像头有人像的图片帧，利用 flask_…

Python 2023年8月12日
0067
Conda虚拟环境创建

Conda虚拟环境创建 1. 为什么要创建虚拟环境 2. 开始搭建虚拟环境 * 第一步：创建虚拟环境第二步：切换进入虚拟环境 – 2.1 安装python的各种模块 …

Python 2023年8月1日
0059
并联四足机器人项目开源教程（五） — 四足机器人相关书籍&论文研读

这个是本人在大三期间做的项目 —- 基于MIT的Cheetah方案设计的十二自由度并联四足机器人，这个项目获得过两个国家级奖项和一个省级奖项。接下来我会将这个机器人的控…

Python 2023年9月26日
0069
AttributeError: module ‘matplotlib.cbook‘ has no attribute ‘iterable‘及同类型报错问题的一般解决思路与注意事项

1 报错内容凡是报错信息为 AttributeError: ‘xxxx’ object has no attribute ‘yyyy’的，都可以考虑一下是因为该库版本与所使用代码…

Python 2023年8月30日
0063
python数据清洗—实战案例（清洗csv文件）

我也是最近才开始这方面的学习，这篇就当作学习的笔记，记录一下学习的过程目录 * – 所以我们现在要解决的问题就是删除列名中的空格 – 接下来要解决的问题就…

Python 2023年8月6日
0073
pytest框架的基本功能使用（二）

参数化在测试用例前加上@pytest.mark.parametrize(“参数名”,列表数据)参数名，用来接收每一项数据，并作为测试用例的参数. 列表数据…

Python 2023年9月11日
0036
sentinel的四种流控规则介绍

sentinel 前方参考计算QPS-Sentinel限流算法 https://www.cnblogs.com/yizhiamumu/p/16819497.html Sentin…

Python 2023年10月18日
0034
随笔荟萃 | sincerity

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

Python 2023年9月30日
0058
2.机器学习小记录–机器学习常用的python包

目录：一、numpy 二、pandas 三、matplot 四、seaborn 一、Numpy 1、numpy的介绍 numpy是python语言的一个第三方库，其支持大量高维度…

Python 2023年8月29日
0060
Scrapy介绍

整个框架由Engine(引擎）、Item(项目）、Scheduler(调度器）、Downloader(下载器）、Spiders(蜘蛛)、Item Pipeline(项目管道）、Do…

Python 2023年10月1日
0028
基于sklearn的集成学习实战

集成学习投票法与bagging 投票法 sklearn提供了VotingRegressor和VotingClassifier两个投票方法。使用模型需要提供一个模型的列表，列表中每个…

Python 2023年10月30日
0044
科学计算基础软件包NumPy入门讲座（6）：掩码数组

在科研活动和实际工作中，我们获得的数据集往往是有缺失或被污染的，如卫星上各种载荷的传感器在某一瞬间甚至某一段时间内可能无法记录数据或记录值被干扰。上一节简单介绍了NumPy处理数据…

Python 2023年8月29日
0036
python-matplotlib库绘制饼形图专题(从一般饼状图到内嵌环形图)

python-matplotlib库绘制饼形图专题(从一般饼状图到内嵌环形图) 文章目录 1.plt.pie() 2. 饼图基本 3. 饼状图进阶 4. 环形图 5. 内嵌环形图 …

Python 2023年8月1日
0064
微服务入门二：SpringCloud（版本Hoxton SR6）

一、什么是SpringCloud 1、官方定义 1）官方定义：springcloud为开发人员提供了在分布式系统中快速构建一些通用模式的工具（例如配置管理、服务发现、断路器、智能路…

Python 2023年6月10日
0055

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

关于Focal loss损失函数的代码实现

大家都在看