神经网络——常见的回归损失函数

2023年7月17日上午6:04 • 人工智能 • 阅读 50

GIoU Loss 在 IoU Loss 的基础上解决了边界框不重合的问题；

DIoU Loss 在 IoU 和 GIoU Loss 上加入了边界框中心点的信息；

CIoU Loss 在 DIoU Loss 的基础上加入了边界框宽高比的尺度信息。

L1 Loss、L2 Loss 和 Smooth L1 Loss

三个损失函数的图像公式如上，分别对其求导：

公式中的 x 都是 bounding box 四个坐标点与 ground truth 四个坐标点的差值，四个点分别计算 Loss 再相加，得到这个 bbox 的回归损失。

L1 Loss 在训练后期当 x 值较小时，梯度依然固定不变，会导致模型在最优解附近振荡。L2 Loss 在训练初期 x 较大时，梯度也过大，导致训练不稳定。smooth L1 Loss 避免了上述两个 Loss 存在的问题，x 较小时梯度依然小，x 较大时梯度固定而不至于过大。

而 VOC 和 COCO 上检测任务的评价指标都是基于 IoU 的，多个 bbox 可能有相同的 smooth L1 Loss，但 IoU 差别可能很大，于是引入了基于 IoU 的一系列 Loss。smooth L1 Loss 的缺点：对于尺度不具有不变性；同样通过4个点回归坐标框的方式是假设4个坐标点是相互独立的，没有考虑其相关性，实际4个坐标点具有一定的相关性。

IoU Loss

将两个框的 IoU 取 -ln，直接作为损失函数，将 bbox 看作一个整体进行回归。通常情况下 IoU Loss = 1-IoU。

GIoU Loss

但是 IoU Loss 的缺点是当 IoU 的值为0时，其 Loss 为无穷并且不可导（针对取 -ln 的情况）。更重要的是 IoU 无法反映两个框是如何相交的，下图中，三种不同相对位置的框拥有相同的 IoU=0.33 值，但是拥有不同的 GIoU=0.33，0.24，-0.1，当框的对齐方向更好一些时GIoU的值会更高一些。

对于 bbox 和 gt，我们要找到一个 bbox 和 gt 最小外接矩形 C，然后计算 C 中没有覆盖 bbox 和 gt 的面积占 C 总面积的比例，然后用 bbox 和 gt 的 IoU 值减去这个比值。

对于 IoU Loss 的两个缺点，由于 IoU 取值范围为0~1所以 GIoU 的取值范围为-1~1。同时由于 GIoU 引入了框 C，所以当 bbox 和 gt 不重合时也同样可以计算。最终的 GIoU Loss = 1-GIoU。

DIoU Loss 和 CIoU Loss

好的目标框回归损失应该考虑三个重要的几何因素： 重叠面积，中心点距离，长宽比。在2020 AAAI 上有文章指出了 IoU Loss 和 GIoU Loss 的两个改进方向：一是为了加快收敛速度，使损失函数为最小化 bbox 和 gt 之间的归一化距离。因此提出了 DIoU Loss，该 Loss 考虑了重叠面积和中心点距离，相对于 GIoU Loss 收敛更快；二是当 gt 完全包裹 bbox 时能更精确更快地惩罚模型，因为当 gt 完全包裹 bbox 的时候，其 IoU 和 GIoU 的值都一样，此时 GIoU 退化为 IoU，无法区分其相对位置关系，如下图。因此提出了 CIoU Loss，考虑到了所有的几何因素，相对于 GIoU Loss 精度更高。

通常基于 IoU 的 Loss 符合范式：Loss = 1-IoU+惩罚项，惩罚项定义为 bbox 和 gt 的惩罚项。DIoU Loss 中惩罚项为：

就是说 DIoU=IoU-惩罚项。其中 b 为 bbox 和 gt 的中心点，ρ 为欧式距离，c 为 bbox 和 gt 最小外接矩形对角线的长度，如下图：

可以将 DIoU 替换 NMS 算法中的 IoU，即论文提出的 DIoU-NMS，实验结果表明有一定的提升。DIoU Loss 可以直接优化2个框直接的距离，比 GIoU Loss 收敛速度更快，对于 gt 包裹 bbox 的这种情况，DIoU Loss 可以收敛的很快，而 GIoU Loss 此时退化为 IoU Loss 收敛速度较慢。

CIoU 的惩罚项是在 DIoU 的惩罚项基础上加了一个影响因子，这个因子用来拟合 bbox 和 gt 的长宽比。

α 是用来做 trade-off 的参数：

v 是衡量长宽比一致性的参数：

CIoU=IoU-（DIoU 的惩罚项+CIoU 的惩罚项）。CIoU Loss 定义为：

Original: https://blog.csdn.net/AmbitionalH/article/details/122933496
Author: 不说话装高手H
Title: 神经网络——常见的回归损失函数

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/698026/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

自然语言处理，图像相关用的较多的框架

huggingface网址：https://huggingface.co/其中包含了大多数的预训练模型以及使用方法。是我见过最全的。功能包括： mmDetection网址：http…

人工智能 2023年5月28日
00119
【一起入门NLP】中科院自然语言处理期末考试*总复习*：考前押题+考后题目回忆

明天期末考试，胡玥老师亲自出题，整理一下我觉得最最最重点的地方押押题😶😶 目录题型第三章：深度学习基础第四章：语言模型+词向量第五章：注意力机制第六章：NLP基础任务第…

人工智能 2023年5月27日
00101
【机器学习入门】(2) 朴素贝叶斯算法：原理、实例应用（文档分类预测）附python完整代码及数据集

各位同学好，今天我向大家介绍python机器学习中的朴素贝叶斯算法。内容有：算法的基本原理；案例实战–新闻文档的分类预测。案例简介：新闻数据有20个主题，有10万…

人工智能 2023年7月3日
0075
python 多分类 recall_多分类如何根据混淆矩阵求准确率、精准率、和召回率？

对于多分类问题，首先，对于每一个类的精准率(Precision)和召回率(Recall)，定义和二分类问题一致，但是计算上不再需要TP,FP,FN等量了：) 比如对A, B, C三…

人工智能 2023年7月3日
0074
第十章文本生成

10.1 文本生成简介 10.2 文本生成方法 10.2.1 传统文本生成方法 10.2.2 神经网络文本生成方法 10.2.2.1 回顾 10.2.2.1 自回归方法 10.2….

人工智能 2023年5月28日
0060
基于C++实现的A*算法（链表和二叉堆实现）

基于C++实现的A*算法 AStar算法相对于Dijkstra算法而言升级的地方在于引入了启发距离，即H（当前点到终点的预计距离），因此在每次大循环中Dijkstra算法找的最短距…

人工智能 2023年6月10日
0065
DeepLabV1网络简析

原论文名称：Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs论文下…

人工智能 2023年6月24日
0081
Yolov5 + Deepsort 重新训练自己的数据（保姆级超详细）

从下面github库中拿代码：下载好匹配的deeosort和yolov5代码很重要，题主折腾了一天，坑在版本上了！！题主用的deeosort v3.0和yolov5 5.0版本…

人工智能 2023年6月17日
0069
PyTorch是如何处理深度学习中的反向传播算法的

问题描述本文将详细解决一个问题：PyTorch是如何处理深度学习中的反向传播算法的。介绍深度学习中的反向传播算法是训练神经网络的核心算法之一。PyTorch是一个流行的深度学…

人工智能 2024年1月4日
0053
基于迁移学习的PyTorch图像分类

在这篇文章中，我们将讨论 PyTorch中的图像分类。我们将使用CalTech256数据集的一个子集对 10只动物的图像进行分类。我们将介绍 数&#x…

人工智能 2023年5月26日
0057
学习笔记：速腾聚创激光点云处理——地面分割和聚类

前言 [TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopp…

人工智能 2023年6月2日
0082
【jetson nano】学习（1）——安装并跑通 jetson-inference

文章目录 * – 📙1、所需文件下载 – 📘2、开始安装 – 📕3、inference测试 ❤️ 之前我的文章写的不够完善，没有写清楚 jets…

人工智能 2023年7月10日
00129
使用Python和OpenCV中的calcOpticalFlowFarneback函数提取稠密光流并进行映射（warp）

介绍 OpenCV中自带两个提取光流的函数：cv2.calcOpticalFlowPyrLK()cv2.calcOpticalFlowFarneback()其中calcOptica…

人工智能 2023年5月26日
00107
基于Python的热门音乐特征数据分析

目录摘要 3 引言 3 研究方法 3 3.1 数据获取 4 3.1.1 获取当下最热门的400首音乐 4 3.2 音频处理 5 3.2.1 音乐格式转换与时长处理 6 3.2.2…

人工智能 2023年7月14日
0076
Graphene图数据建模工具

Graphene图数据建模工具 Graphene图数据建模工具 * 一、Graphene是什么？二、谁可以使用它？三、为什么需要这样的工具？四、核心功能五、演示界面六、如…

人工智能 2023年6月1日
0072
Canny边缘检测

; 边缘检测发展 Canny 边缘检测是一种从不同视觉对象中提取有用结构信息并显着减少要处理的数据量的技术。它已广泛应用于各种计算机视觉系统。 Canny 发现，在不同的视觉系统上…

人工智能 2023年5月26日
0067

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

神经网络——常见的回归损失函数

GIoU Loss 在 IoU Loss 的基础上解决了边界框不重合的问题；

DIoU Loss 在 IoU 和 GIoU Loss 上加入了边界框中心点的信息；

CIoU Loss 在 DIoU Loss 的基础上加入了边界框宽高比的尺度信息。

大家都在看