目标检测–边框回归损失函数SIoU原理详解及代码实现

2023年6月23日上午3:44 • 人工智能 • 阅读 107

边框回归损失函数

1. SIoU

1.1 原理

有关IoU损失函数，如(GIoU, DIoU, CIoU)没有考虑到真实框与预测框框之间的方向，导致收敛速度较慢，对此SIoU引入真实框和预测框之间的向量角度，重新定义相关损失函数，具体包含四个部分：
（1）角度损失(Angle cost)，定义如下

Λ = 1 − 2 ∗ sin ⁡ 2 ( arcsin ⁡ ( c h σ ) − π 4 ) = cos ⁡ ( 2 ∗ ( arcsin ⁡ ( c h σ ) − π 4 ) ) \Lambda = 1-2\sin^2(\arcsin(\frac{c_h}{\sigma}) – \frac{\pi}{4})=\cos(2(\arcsin(\frac{c_h}{\sigma}) – \frac{\pi}{4}))Λ=1 −2 ∗sin 2 (arcsin (σc h )−4 π)=cos (2 ∗(arcsin (σc h )−4 π))
其中c h c_h c h 为真实框和预测框中心点的高度差，σ \sigma σ为真实框和预测框中心点的距离，事实上arcsin ⁡ ( c h σ ) \arcsin (\frac{c_h}{\sigma})arcsin (σc h )等于角度α \alpha α
c h σ = sin ⁡ ( α ) \frac{c_h}{\sigma}=\sin(\alpha)σc h =sin (α)
σ = ( b c x g t − b c x ) 2 + ( b c y g t − b c y ) 2 \sigma = \sqrt{(b_{c_x}^{gt}-b_{c_x})^2+(b_{c_y}^{gt}-b_{c_y})^2}σ=(b c x g t −b c x )2 +(b c y g t −b c y )2
c h = max ⁡ ( b c y g t , b c y ) − min ⁡ ( b c y g t , b c y ) c_h = \max(b_{c_y}^{gt}, b_{c_y}) – \min(b_{c_y}^{gt}, b_{c_y})c h =max (b c y g t ,b c y )−min (b c y g t ,b c y )

( b c x g t , b c y g t ) (b_{c_x}^{gt}, b_{c_y}^{gt})(b c x g t ,b c y g t )为真实框中心坐标( b c x , b c y ) (b_{c_x}, b_{c_y})(b c x ,b c y )为预测框中心坐标，可以注意到当α \alpha α为π 2 \frac{\pi}{2}2 π或0时，角度损失为0，在训练过程中若α < π 4 \alpha < \frac{\pi}{4}α<4 π，则最小化α \alpha α，否则最小化β \beta β

（2）距离损失(Distance cost)，定义如下：

Δ = ∑ t = x , y ( 1 − e − γ ρ t ) = 2 − e − γ ρ x − e − γ ρ y \Delta = \sum_{t=x,y}(1-e^{-\gamma\rho_t})=2-e^{-\gamma\rho_x}-e^{-\gamma\rho_y}Δ=t =x ,y ∑(1 −e −γρt )=2 −e −γρx −e −γρy
其中：
ρ x = ( b c x g t − b c x c w ) 2 , ρ y = ( b c y g t − b c y c h ) 2 γ = 2 − Λ \rho_x = (\frac{b_{c_x}^{gt} – b_{c_x}}{c_w})^2, \quad \rho_y= (\frac{b_{c_y}^{gt} – b_{c_y}}{c_h})^2 \quad \gamma = 2 – \Lambda ρx =(c w b c x g t −b c x )2 ,ρy =(c h b c y g t −b c y )2 γ=2 −Λ
注意：这里的( c w , c h ) (c_w, c_h)(c w ,c h )为真实框和预测框最小外接矩形的宽和高

（3）形状损失(Shape cost)，定义如下：
Ω = ∑ t = w , h ( 1 − e − w t ) θ = ( 1 − e − w w ) θ + ( 1 − e − w h ) θ \Omega = \sum_{t=w, h}(1-e^{-w_t})^\theta=(1-e^{-w_w})^\theta+(1-e^{-w_h})^\theta Ω=t =w ,h ∑(1 −e −w t )θ=(1 −e −w w )θ+(1 −e −w h )θ
其中：
w w = ∣ w − w g t ∣ max ⁡ ( w , w g t ) , w h = ∣ h − h g t ∣ max ⁡ ( h , h g t ) w_w=\frac{|w-w^{gt}|}{\max(w, w^{gt})}, \quad w_h=\frac{|h-h^{gt}|}{\max(h, h^{gt})}w w =max (w ,w g t )∣w −w g t ∣,w h =max (h ,h g t )∣h −h g t ∣
( w , h ) (w, h)(w ,h )和( w g t , h g t ) (w^{gt}, h^{gt})(w g t ,h g t )分别为预测框和真实框的宽和高，θ \theta θ控制对形状损失的关注程度，为了避免过于关注形状损失而降低对预测框的移动，作者使用遗传算法计算出θ \theta θ接近4，因此作者定于θ \theta θ参数范围为[2, 6]

（4）IoU损失(IoU cost)

I o U = 交集 A 并集 B IoU=\frac{交集A}{并集B}I o U =并集B 交集A

综上所诉，最终SIoU损失函数定义如下：
L o s s S I o U = 1 − I o U + Δ + Ω 2 Loss_{SIoU}=1-IoU+\frac{\Delta + \Omega}{2}L o s s S I o U =1 −I o U +2 Δ+Ω

; 1.2 代码实现

有关SIoU得代码实现如下(来源美团yolov6)：

elif self.iou_type == 'siou':

    '''
    预测框和真实框坐标形式为xyxy，即左下右上角坐标或左上右下角坐标
    '''
    s_cw = (b2_x1 + b2_x2 - b1_x1 - b1_x2) * 0.5
    s_ch = (b2_y1 + b2_y2 - b1_y1 - b1_y2) * 0.5
    sigma = torch.pow(s_cw ** 2 + s_ch ** 2, 0.5)
    sin_alpha_1 = torch.abs(s_cw) / sigma
    sin_alpha_2 = torch.abs(s_ch) / sigma
    threshold = pow(2, 0.5) / 2
    sin_alpha = torch.where(sin_alpha_1 > threshold, sin_alpha_2, sin_alpha_1)
    angle_cost = torch.cos(torch.arcsin(sin_alpha) * 2 - math.pi / 2)
    rho_x = (s_cw / cw) ** 2
    rho_y = (s_ch / ch) ** 2
    gamma = angle_cost - 2
    distance_cost = 2 - torch.exp(gamma * rho_x) - torch.exp(gamma * rho_y)
    omiga_w = torch.abs(w1 - w2) / torch.max(w1, w2)
    omiga_h = torch.abs(h1 - h2) / torch.max(h1, h2)
    shape_cost = torch.pow(1 - torch.exp(-1 * omiga_w), 4) + torch.pow(1 - torch.exp(-1 * omiga_h), 4)
    iou = iou - 0.5 * (distance_cost + shape_cost)

loss = 1.0 - iou

Original: https://blog.csdn.net/qq_56749449/article/details/125753992
Author: Gthan学算法
Title: 目标检测–边框回归损失函数SIoU原理详解及代码实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/646567/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【python第三方库】pyinstaller使用教程及spec资源文件介绍

文章目录一、pyinstaller 二、pyinstaller打包步骤 * 打包环境打包一个py脚本程序打包一个py项目程序三、spec资源文件介绍 * Analysis参…

人工智能 2023年7月4日
0087
数据分析中常见的存储方式

点击上方” 大话coding“，选择”星标”公众号重磅干货，第一时间送达大家好，我是小轩这两天整理了在数据分析中常见的5种存储…

人工智能 2023年6月11日
0070
计算机视觉 – 图像增强应用实践 (基础篇）C++ OpenCV

环境配置我之前是跟着B站的一个UP主弄的：VS2019-Opencv4.5.2安装教程（win11上安装跟win10系统安装没有任何区别）_哔哩哔哩_bilibili （但是不知道…

人工智能 2023年6月19日
0072
简单易懂的机器学习算法介绍

决策树 – – -决策树的基本原理决策树（Decision Tree）是⼀种分⽽治之的决策过程。⼀个困难的预测问题，通过树的分⽀节点，被划分成两个或多个较…

人工智能 2023年7月1日
0091
python中Pandas之DataFrame索引、选取数据

总结一下索引问题 1.1 认识索引先创建一个简单的 DataFrame。 myList = [[‘a’, 10, 1.1], [‘b’, 20, 2.2], [‘c’, 30,…

人工智能 2023年7月6日
0054
2022见证中国崛起从Python绘制中国地图开始：使用pyecharts最新版本绘制中国地图实例详解，个性化地图定制及常用参数解析

使用 pyecharts 绘制中国地图实例详解第一章：实例演示 ① pyecharts 1.9.1 版本安装与数据准备 ② 添加数据项，默认中国地图显示 ③ 完整源码，可直接运行…

人工智能 2023年7月4日
0077
机器学习(十七）：网格搜索（Grid Search）和SVM

文章目录 * – 一、什么是网格搜索？ – + 1.1 定义 + 1.2 什么是模型参数？ + 1.3 什么是模型超参数？ + 1.4 区别参数与超参数 &…

人工智能 2023年6月24日
0070
PixelShuffle原理笔记（paper，pytorch实现）

pixel shuffer是一种图像上采样的方法，参考paper 它在Pytorch中的实现为 pixel_shuffle = torch.nn.PixelShuffle(r) o…

人工智能 2023年5月26日
0098
【论文阅读】Hierarchical Multi-modal Contextual Attention Network for Fake News Detection — 虚假新闻检测，多模态

本博客系本人阅读该论文后根据自己理解所写，非逐句翻译，欲深入了解该论文，请参阅原文。论文标题：Hierarchical Multi-modal Contextual Attent…

人工智能 2023年7月3日
0063
An Attentional Recurrent Neural Networkfor Personalized Next Location Recommendation【ARNN】代码复现反思

title: ARNN复现反思 date: 2022-04-26 22:37:56 tags: NLP的一些收获因为找遍了一二三四作，都没有能得到An Attentional R…

人工智能 2023年6月4日
0057
WT588F02KD-24SS数码管时钟语音播报芯片设计方案

命令码命令码详解 FF 01 01 获取当前时钟 FF 01 01+R1 R2 R3 R4 R5 R6 R7 R8 R1:年千位和百位; R2:年十位和个位; R3:月; R…

人工智能 2023年5月23日
0083
搞水产的人都笑了，智慧水产养殖水质监测解决方案

一、行业背景随着近年来经济的飞速发展，水产行业也在飞速崛起。但随着养殖密度不断加大，养殖环境在逐渐日益恶化，养殖成本还在持续上涨，传统的养殖模式已无法满足现代水产养殖业的发展要求，…

人工智能 2023年6月28日
0061
【控制】自适应控制基本概念

目录自适应控制的一点笔记和看法1【控制】自适应控制基本概念【控制】自适应控制，对参考信号跟踪，对未知参数估计的小例子，带程序有结果图【控制】自适应控制，模型参考自适应控制，公式…

人工智能 2023年6月23日
00101
Matlab-基于短时神经网络的声音分类

这个例子展示了如何使用深度学习过程对声音进行分类。 1、数据集生成生成1000个白噪声信号、1000个棕色噪声信号和1000个粉色噪声信号。假设采样率为44.1 kHz，每个信号…

人工智能 2023年7月2日
0076
python 分类变量回归_基于分类变量的sklearn线性回归

我试图使用sk learn在Python中运行一个常见的线性回归，但是我有一些分类数据，我不知道如何处理，特别是因为我使用pandas导入了数据，而且我从以前的经验和阅读中了解到p…

人工智能 2023年6月18日
0066
基于ASRT的开源实时语音转文本

基于ASRT的开源实时语音转文本文章目录基于ASRT的开源实时语音转文本 * ASRT语音识别系统相关资料实时转写客户端识别效果 ASRT语音识别系统相关资料 ASRT是A…

人工智能 2023年5月25日
0094

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

目标检测–边框回归损失函数SIoU原理详解及代码实现

边框回归损失函数

1. SIoU

1.1 原理

; 1.2 代码实现

大家都在看