关于Focal Loss【转自以学习、回忆】

2023年6月4日下午1:36 • 人工智能 • 阅读 87

是解决样本不均衡问题的一种方法，面试常问，但是自己一知半解遂寻文学习

来源：CSDN GHZhao_GIS_RS

链接：https://blog.csdn.net/u014311125/article/details/109470137

转载一篇以学习、回忆。

转载正文开始有删减

个人觉的要真正理解Focal Loss，有三个关键点需要清楚，分别对应基础公式，超参数α，超参数γ。
一、二分类(sigmoid)和多分类(softmax)的交叉熵损失表达形式是有区别的。
二、理解什么是难分类样本，什么是易分类样本？搞清难易分类样本是搞清楚Focal Loss中的超参数γ作用的关键。
三、负样本的α值到底该是0.25还是0.75呢？这个问题对应Focal Loss中的超参数α的调参。
理解上面三点应该就能搞清楚二分类Focal Loss的基本思想，然后就可以推广到多分类问题上。

理解关键点一：基础公式

二分类和多分类的交叉熵的区别具体可以参考文章《一文搞懂交叉熵损失》（https://www.cnblogs.com/wangguchangqing/p/12068084.html#autoid-0-2-0）

1.1、二分类交叉熵
在做二分类的任务时，一般是用sigmoid作为最后的激活函数，输出只有一个代表样本为正的概率值p，二分类非正即负，所以样本为负的概率值为1-p。
则以sigmoid作为激活函数的二分类任务交叉熵损失的计算公式为:

1.2、多分类交叉熵

在做多分类的时候，一般是以softmax作为最后的激活函数的，输出有多个值，对应每个分类的概率值，和为1。
则以sofmax作为激活函数的多分类任务的交叉熵损失计算公式为

其中p c p_{c}p
c

表示softmax激活函数输出结果中第c类的对应的值。
注意:论文中是基于以sigmoid为激活函数来作为二分类交叉熵损失的。我在最开始学Focal Loss的时候老是将sigmoid和softmax混着看，一会用sigmoid来套公式，一会用softmax来套公式，很容易把自己搞蒙。
文章的备注里也指出可以很容易将Focal Loss应用于多分类，为了简单起见，文章中关注的是二分类情况。

理解关键点二：

论文将交叉熵损失公式做了进一步的简化:

其中

所以：

这里pt的理解比较关键。pt的大小实际能反映出样本难易分类的程度。举个例子，当样本为正样本(y=1)时，如果模型预测的p=0.3,表示模型预测该样本为负样本，模型预测错误，

pt=0.3，如果模型预测的p=0.8，表示模型预测该样本为正样本，模型预测正确，
pt=0.8。当样本为负样本(y=0)时,如果模型预测的p=0.3，表示模型判断该样本为负样本，判断正确，=1-p=0.7。如果模型输出的p=0.8，表示模型判断该样本为正样本，模型预测错误，pt=1-p=0.2.对应下表

可以看到,不管是正样本还是负样本，模型预测时pt都很大，预测错误时pt很小，所以pt代表了模型对样本预测正确的概率。

接下来看论文中一上来就给的一张图。

横坐标是pt，可以看出作者指出pt∈（0.6，1）区间为易分类样本。针对上边的例子再啰嗦几句，对于一个正样本，如果模型得到的预测的p总是在0.5以上，则说明该样本很容易被分类正确，所以是易分类样本，此时pt=p，pt也总是在0.5以上，如果模型得到的预测的p总是在0.5以下，则说明该样本很难被正确分类，所以为难分类样本，此时pt也总是在0.5以下；同理对于一个负样本，模型预测的p很容易在0.5以下，表明模型很容易将样本正确分类，所以是易分类样本，pt=1-p，pt总是在0.5以上，如果模型得到的预测的p总是在0.5以上，则说明针对这类样本模型总是分类错误，所以是难分类样本，pt=1-p，pt总是在0.5以下。

总结一下：易分类样本的特征pt>0.5 难分类样本特征：pt

Original: https://www.cnblogs.com/nlpers/p/16286108.html
Author: nlp如此迷人
Title: 关于Focal Loss【转自以学习、回忆】

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/568122/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python热力图代码_python热力图实现简单方法

在我们想要对不同变量进行判断的时候，会分析其中的之间的联系。这种理念同样也被用在实例生活中，最常见到的是做一个地理的热力图。很多人对画热力图的方法不是很清楚，我们可以先装好相关的工…

人工智能 2023年7月8日
0065
如何对Pandas DataFrame进行自定义排序

首先观察数据内容 import pandas as pd import numpy as np import time from pandas.api.types import C…

人工智能 2023年7月9日
0063
非参数检验——Wilcoxon 检验 & Friedman 检验与 Nemenyi 后续检验

最近看论文，看到了Wilcoxon signed-rank test（符号秩检验），咱也不知道是个啥，就学习了一下，这里做一下笔记，方便以后查阅。非参数检验——Wilcoxon …

人工智能 2023年7月28日
0076
人工智能之图像识别

关于图像识别图像识别是人工智能的一个重要领域，是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对象的技术，是应用深度学习算法的一种实践应用。在计算机视觉识别…

人工智能 2023年7月28日
0038
CART决策树—-基尼指数划分

文章目录 CART决策树—-基尼指数划分 * 一.决策树算法的构建二.划分选择——基尼指数三.剪枝处理 – 1.预剪枝 2.后剪枝四.算法代码 CAR…

人工智能 2023年6月15日
0054
Python_时间序列处理及可视化_美国能源消耗数据集分析

数据集(PJME_hourly.csv，PJMW_hourly.csv),可以在Kaggle官网下载。这里列出几个基本的任务。任务：读取数据，创建以时间列为索引的时间序列，截取…

人工智能 2023年7月7日
00120
如何正确地阅读一篇文献（科研向）

为什么要做文献阅读了解背景知识把握研究方向学习课题设计思路逻辑写作能力如何做好文献阅读如何筛选所需阅读文献研究工具了解论文整体框架结构所用方法结果与讨论针对不…

人工智能 2023年6月1日
0079
CIFAR-10数据集（介绍、下载读取、可视化显示、另存为图片）

cifar10数据集（下载并读取、可视化显示、另存为图片） 2022-06-09 18:23:38 数据集简介 CIFAR-10 是由 Hinton 的学生 Alex Krizhe…

人工智能 2023年6月17日
00133
回归标准差和残差平方和的关系_章节测试一元线性回归

1具有相关关系的两个变量的特点是()A、一个变量的取值不能由另一个变量唯一确定B、一个变量的取值由另一个变量唯一确定C、一个变量的取值增大时,另一个变量的取值也一定增大D、一个变量…

人工智能 2023年6月18日
0070
中文普通话语音识别开源数据集（持续更新）

中文普通话语音识别开源数据集，截至2022.11.21 [En] Chinese Putonghua speech recognition open source data set…

人工智能 2023年5月27日
0064
〖Python接口自动化测试实战篇⑩〗- 测试框架 unittest 的小实战案例

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月4日
0067
【数据挖掘】期末复习（样卷题目+少量知识点）

目录第一章绪论 * 1、填空题 – （1）从技术层面上看，数据挖掘是（）。从商业层面看，数据挖掘是（）。（2）数据挖掘所得到的信息具有（）、有效和实用三个特…

人工智能 2023年7月16日
0081
K-Means 聚类算法 Python实现

聚类算法将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合，这些对象与同一个簇中的对象彼此相似，与其他簇中的对象相异。&#8…

人工智能 2023年7月18日
0052
【Python爬虫 • selenium】selenium4新版本使用指南

提示：本文默认你已经学会使用selenium的旧版本，因此对一些可以直接搜索到很多的内容，你应该是已经学会的文章目录前言一、设置驱动 * 1. selenium4推荐方法 2…

人工智能 2023年7月3日
0067
利用pythonEM算法和雷达图分析王者荣耀英雄聚类和可视化全代码

今天和大家分享一下我的最大爱好，可想而知一名资深的神经外科主刀医生，被转行做医疗数据，我肯定是个非常内向的人。所以我的最大爱好就是玩王者，感兴趣的可以一起开黑！我的王者号，也叫&#…

人工智能 2023年6月2日
00104
数据结构学习笔记1——导论（研究方向、应用场景、概念、分类）

目录 1.研究方向 2.基本概念和术语 3.数据结构 3.1 逻辑结构 3.2 存储结构 3.3 数据类型和抽象数据类型 1.研究方向计算机主要用于数值计算时，一般要经过如下几…

人工智能 2023年7月2日
0066

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

关于Focal Loss【转自以学习、回忆】

理解关键点一：基础公式

1.2、多分类交叉熵

理解关键点二：

大家都在看