目标检测中目标框回归损失函数（IoU, GIoU, DIoU, CIoU）总结

2023年6月17日下午5:20 • 人工智能 • 阅读 73

1. Smooth L1 Loss

这个是 Faster-RCNN 中的损失函数。具体可以参考深度学习目标检测之 R-CNN 系列：Faster R-CNN 网络详解中相应介绍。

Smooth L1 Loss 相比 L1 和 L2 的优势可以参考损失函数：L1 loss, L2 loss, smooth L1 loss。总结其优势就是：

smooth L1和L1-loss函数的区别在于，L1-loss在0点处导数不唯一，可能影响收敛。smooth L1的解决办法是在0点附近使用平方函数使得它更加平滑
相比于L2损失函数，其对离群点、异常值（outlier）不敏感，梯度变化相对更小，训练时不容易跑飞

2. IoU Loss

IoU(Intersection over Union) 是旷视在 2016 年于 UnitBox: An Advanced Object Detection Network 中提出的，随后被广泛使用。正如其名交并比，就是两个 BBox 的交集比上并集。

IoU Loss 的数学表达式为 L o s s I o U = − l n ( I o U ) Loss_{IoU} = -ln(IoU)L o s s I o U =−l n (I o U )，实际使用中很多直接简化为 L o s s I o U = 1 − I o U Loss_{IoU} = 1 – IoU L o s s I o U =1 −I o U。

IoU 相比 Smooth L1 Loss 具有如下优势：

具有尺度不变性
IoU Loss，其将 4 个点构成的 box 看成一个整体进行回归

直接看下图更直观。

IoU 的不足：

1）当预测框和目标框不相交时，IoU(A,B)=0时，不能反映A,B距离的远近，此时损失函数不可导，IoU Loss 无法优化两个框不相交的情况。

2）假设预测框和目标框的大小都确定，只要两个框的相交值是确定的，其IoU值是相同时，IoU值不能反映两个框是如何相交的。

; 3. GIoU Loss

GIoU(Generalized Intersection over Union) 是Hamid Rezatofighi 等2019年于 Generalized Intersection over Union: A Metric and A Loss for Bounding BoxRegression 中提出的一种改进的 IoU Loss。

如下图所示，三种不同相对位置的框拥有相同的IoU=0.33值，但是拥有不同的GIoU=0.33，0.24，-0.1。当框的对齐方向更好一些时GIoU的值会更高一些。

计算过程如下：

GIoU Loss 的表达式为：
L o s s G I o U = 1 − G I o U Loss_{GIoU} = 1 – GIoU L o s s G I o U =1 −G I o U
GIoU 的不足：

如下图，BBox 重合的时候 GIoU 退化为 IoU。

; 4. DIoU Loss

DIoU(Distance-IoU) 是 Zhaohui Zheng 等 2019 年在 Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression 中提出的。

基于IoU和GIoU存在的问题，作者提出了两个问题：

第一：直接最小化预测框与目标框之间的归一化距离是否可行，以达到更快的收敛速度。
第二：如何使回归在与目标框有重叠甚至包含时更准确、更快。

好的目标框回归损失应该考虑三个重要的几何因素： 重叠面积，中心点距离，长宽比。基于问题一，作者提出了DIoU Loss,相对于GIoU Loss收敛速度更快，该Loss考虑了重叠面积和中心点距离，但没有考虑到长宽比；针对问题二，作者提出了CIoU Loss， 其收敛的精度更高，以上三个因素都考虑到了。

通常基于IoU-based的loss可以定义为 L = 1 − I o U + R ( B , B g t ) L = 1 – IoU + R(B, B^{gt})L =1 −I o U +R (B ,B g t )，其中 R ( B , B g t ) R(B, B^{gt})R (B ,B g t ) 定义为预测框 B B B和目标框 B g t B^{gt}B g t 的惩罚项。

DIoU中的惩罚项表示为 R D I o U = ρ 2 ( b , b g t ) c 2 R_{DIoU} = \frac{\rho^{2}(b, b^{gt})}{c^2}R D I o U =c 2 ρ2 (b ,b g t ) ，其中 b b b 和 b g t b^{gt}b g t 分别表示 B B B 和 B g t B^{gt}B g t 的中心点，ρ \rho ρ 表示欧式距离， c c c 表示 B B B 和 B g t B^{gt}B g t 的最小外界矩形的对角线距离，如下图所示。 可以将 DIoU 替换 IoU 用于 NMS 算法当中，也即论文提出的 DIoU-NMS,实验结果表明有一定的提升。

DIoU Loss function 定义为： L D I o U = 1 − I o U + ρ 2 ( b , b g t ) c 2 L_{DIoU} = 1 – IoU + \frac{\rho^{2}(b, b^{gt})}{c^2}L D I o U =1 −I o U +c 2 ρ2 (b ,b g t )

DIoU的性质：

尺度不变性
当两个框完全重合时，L I o U = L G I o U = L D I o U = 0 L_{IoU} = L_{GIoU} = L_{DIoU} = 0 L I o U =L G I o U =L D I o U =0 ，当2个框不相交时L G I o U = L D I o U → 2 L_{GIoU} = L_{DIoU} \rightarrow 2 L G I o U =L D I o U →2
DIoU Loss 可以直接优化 2 个框直接的距离，比 GIoU Loss 收敛速度更快
对于目标框包裹预测框的这种情况，DIoU Loss 可以收敛的很快，而 GIoU Loss 此时退化为 IoU Loss 收敛速度较慢

; 5. CIoU Loss

DIoU 那拨人在 2020 年又整出了个 CIOU( Complete-IoU)。论文见Enhancing Geometric Factors in Model Learningand Inference for Object Detection and InstanceSegmentation。套路和 DIoU 差不多。

CIoU Loss 的表达式如下：
L D I o U = 1 − I o U + ρ 2 ( b , b g t ) c 2 + α υ L_{DIoU} = 1 – IoU + \frac{\rho^{2}(b, b^{gt})}{c^2} + \alpha\upsilon L D I o U =1 −I o U +c 2 ρ2 (b ,b g t )+αυ
CIoU 的惩罚项是在 DIoU 的惩罚项基础上加了一个影响因子 α υ \alpha\upsilon αυ ，这个因子把预测框长宽比拟合目标框的长宽比考虑进去。其中 α \alpha α 是用于做 trade-off 的参数， α = υ ( 1 − I o U ) + υ \alpha = \frac{\upsilon}{(1 – IoU) + \upsilon}α=(1 −I o U )+υυ，υ \upsilon υ 是用来衡量长宽比一致性的参数，定义为 υ = 4 π 2 ( a t c t a n w g t h g t − a r c t a n w h ) \upsilon = \frac{4}{\pi^{2}}(atctan{\frac{w^{gt}}{h^{gt}}} – arctan{\frac{w}{h}})υ=π2 4 (a t c t a n h g t w g t −a r c t a n h w )。

参考

目标检测回归损失函数简介：SmoothL1/IoU/GIoU/DIoU/CIoU Loss

Original: https://blog.csdn.net/kuweicai/article/details/120548988
Author: kuweicai
Title: 目标检测中目标框回归损失函数（IoU, GIoU, DIoU, CIoU）总结

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/631126/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【NLP】主题模型文本分类

自然语言处理之主题模型文本分类 LDA主题模型 1.主题模型（Topic Model）主题模型是以非监督学习的方式对文集的隐含语义结构进行聚类的统计模型。主题模型主要被用于自然语…

人工智能 2023年5月30日
0070
2021/11/13

使用cvpods对《End-to-End Object Detection with Fully Convolutional Network》复现论文简介作者提供的代码链接：h…

人工智能 2023年7月12日
0067
深度学习模型调试经验

尽量简单模型简单，数据简单，一般10个一下数据，经理保证模型过拟合。 loss设计是否合理初始loss期望值和实际值误差是否过大，多分类例子。初始loss测试. 数据不均衡的…

人工智能 2023年6月17日
0067
MySQL进阶实战4，那些年学过的索引，下篇

目录 * – 一、为什么不建议使用外键索引？ – 二、索引合并策略 – 三、选择合适的索引列顺序 – 四、聚簇索引 – …

人工智能 2023年6月27日
0078
SILK SDK + Qt 将QQ/微信的 silk/amr 音频转为 wav 格式

0.前言 SILK 编码最早在 Skype 中使用，它在编码效率和质量之间取得了很好的平衡，因此被广泛应用在互联网的音频相关产品中。SILK 的最新版本是 2012 年发布的 SD…

人工智能 2023年5月27日
00147
如何优化模型的性能和效果

如何优化模型的性能和效果介绍在机器学习和深度学习任务中，我们经常需要优化模型的性能和效果。本文将详细介绍一种常见的优化方法——梯度下降法（Gradient Descent），并…

人工智能 2024年1月4日
0062
【OpenCV-Python】：查找物体轮廓+计算轮廓面积、长度、重心

✨博客主页：米开朗琪罗~🎈✨博主爱好：羽毛球🏸✨年轻人要：Living for the moment（活在当下）！💪🏆推荐专栏：【图像处理】【千锤百炼Python】【深度学习】【排…

人工智能 2023年6月16日
00107
python写Bicubic方法，跑数据集Set5和Set14，保存PSNR和SSIM的值

作业描述：python写 Bicubic方法，跑数据集Set5和Set14，两个数据集都把放到倍数×2，×3，×4，×8跑一遍，最后把图像质量评估指标 PSNR 和 SSIM 保存…

人工智能 2023年6月19日
00120
图片隐写之LSB（Least Significant Bit）原理及其代码实现

什么是隐写？隐写术是一门关于信息隐藏的技巧与科学，所谓信息隐藏指的是不让除预期的接收者之外的任何人知晓信息的传递事件或者信息的内容。隐写术的英文叫做Steganography，来…

人工智能 2023年7月27日
0078
爬虫pandas，数据清洗——-周东海

import pandas as pd print(pd.__version__) #定义字典 mydataset = { ‘sites’ : ["Google&quot…

人工智能 2023年7月6日
0070
OpenCV C++案例实战二十二《手势识别》

OpenCV C++案例实战二十二《手势识别》前言一、手部关键点检测 * 1.1 功能源码 1.2 功能效果二、手势识别 * 2.1算法原理 2.2功能源码三、结果显示 *…

人工智能 2023年5月26日
00115
图像处理中Normalization的应用

图像处理中Normalization的应用背景：我想把肺部CT图像数据和对应的掩码标签重合显示，也就是下图这种效果，通过对应元素相乘实现，但是两张图像的数据格式和分布都不相同，因…

人工智能 2023年6月20日
0067
图像处理（十一）：轮廓检测

1 图像的轮廓轮廓可以简单认为成将连续的点（连着边界）连在一起的曲线，具有相同的颜色或者灰度。轮廓是图像目标的外部特征，这种特征对于我们进行图像分析，目标识别和理解等更深层次的处…

人工智能 2023年6月19日
0077
TensorFlow中的正则化方法有哪些

介绍在机器学习中，过拟合是一个常见的问题。为了降低过拟合的风险，可以使用正则化方法，其中包括L1范数正则化和L2范数正则化。这两种方法通过调整模型的参数，使得模型更简单，从而减少…

人工智能 2023年12月30日
0061
京东用户行为数据分析报告(python)

1. 背景与目的该重构项目对京东的运营数据集的用户购买行为进行分析，研究用户过程中的行为特点、购物偏好、以及在购物过程中的转化率和流失情况，为精准营销提供高质量的目标群体。 2….

人工智能 2023年7月15日
00293
机器学习——常用的分类模型性能评价指标

分类模型的性能评价指标，主要包含准确率，精确率、召回率、f1_score，ROC曲线，AUC等 1、分类评价指标先列出混淆矩阵其中：TP：真实值是positive，模型分为pos…

人工智能 2023年7月2日
0064

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

目标检测中目标框回归损失函数（IoU, GIoU, DIoU, CIoU）总结

1. Smooth L1 Loss

2. IoU Loss

; 3. GIoU Loss

; 4. DIoU Loss

; 5. CIoU Loss

参考

大家都在看