CIOU实现及可视化过程【附代码】

2023年7月9日上午6:29 • 人工智能 • 阅读 86

CIOU是IOU的改进版，本文将对CIOU原理进行代码实现，同时附上可视化过程，为的是从 代码层面更好的理解、弄懂CIOU具体实现过程，看一下是如何对张量进行操作和求loss的，而不是停留在了解的层面。【IOU的实现过程可以参考我另一篇文章：非极大值抑制(NMS)，采用IOU筛选预测框，进行可视化过程分析【附代码】_爱吃肉的鹏的博客-CSDN博客】

b站视频：CIOU实现过程_哔哩哔哩_bilibili

先附上一张大家熟悉的CIOU图

我们知道，CIOU是在IOU的基础上考虑了两个真实框和预测框的 中心点距离(图中的d)还有两个框的最小包裹框的 对角线距离(图中的c，最小包裹矩形框是图中虚线部分)。比如当两个框不重叠的时候，那么此时的IOU是等于0的，这样会导致无法进行反向传播，而CIOU可以很好的解决这一问题。

CIou具体公式如下：

其中

是一个正则项，从DIOU引进而来，其实正则化项也有防止过拟合的作用。

是一个正的trade-off参数， CIOU实现及可视化过程【附代码】

用于去 度量长宽比的一致性。

下面我们看看从代码如何实现，我们网络的输出特征层一般是这种shape 【batch_size,feature_W,featuer_H,num_anchors,4】。比如yolo，那么会得到一个[batch_size,13,13,507,4]这样的张量。13是特征层大小，然后有3种锚框，因此该特征层有13133=507个框，每个框又有4个值(center_x,center_y,w,h)表示框的中心点坐标和框的宽和高。

为了方便起见，那么我们现在假设一下，我现在 只有两个框，一个真实框(自己标注的)，一个预测框，不去管特征层尺寸，只是处理框，那么可以有以下两个张量。其中 box1是预测框， box2是真实框(这里的数值没有做归一化处理，不影响理解)。这两个矩形框如下图(绿色真实框)：

box1 = torch.tensor([[5.4555e+01, 1.7518e+01, 4.0713e+01, 3.3931e+01]])  # 预测框
box2 = torch.tensor([[7.8304e+01, 1.6306e+01, 4.9968e+01, 3.6646e+01]])  # 真实框

fig = plt.figure()
ax = fig.add_subplot(111)

rec1 = plt.Rectangle((box1[:, 0].numpy() - box1[:, 2].numpy() / 2, box1[:, 1].numpy() - box1[:, 3].numpy() / 2),
                     box1[:, 2].numpy(), box1[:, 3].numpy(), fill=False)  # 预测框
rec2 = plt.Rectangle((box2[:, 0].numpy() - box2[:, 2].numpy() / 2, box2[:, 1].numpy() - box2[:, 3].numpy() / 2),
                     box2[:, 2].numpy(), box2[:, 3].numpy(), fill=False, color='g')  # 真实框
ax.add_patch(rec1)
ax.add_patch(rec2)
plt.xlim(-10, 150)
plt.ylim(-20, 110)
plt.gca().invert_yaxis()
plt.show()

然后我们可以连接一下这两个框的对角线

plt.plot((box1[:, 0].numpy(), box2[:, 0].numpy()), (box1[:, 1], box2[:, 1]), color='blue')  # 连接中心点

因为张量给的box信息是xywh接下来是计算这两个框左上角和右下角坐标

那么我们如何计算呢？

我们可以观察box发现：

左上角x坐标=中心点x坐标-w/2；

左上角y坐标=中心点y坐标-h/2；

右下角x坐标=中心点x坐标+w/2；

右下角y坐标=中心点y坐标+h/2；

因此代码可以这样写：

b1_xy = box1[:, :2]  # 取预测框的中心点
b1_wh = box1[:, 2:]  # 取预测框的wh
b1_wh_half = b1_wh / 2.

b1_mins = b1_xy - b1_wh_half  # 求得左上角坐标
b1_maxes = b1_xy + b1_wh_half  # 求得右下角坐标

b2_xy = box2[:, :2]  # 取真实框的中心点
b2_wh = box2[:, 2:]  # 取真实框的wh
b2_wh_half = b2_wh / 2.

b2_mins = b2_xy - b2_wh_half  # 求得左上角坐标
b2_maxes = b2_xy + b2_wh_half  # 求得右下角坐标

然后接下来我们需要计算两个框相交的坐标，为计算IOU做准备。然后分析一下如何计算相交部分的左上角坐标和右下坐标，通过观察两个框的相交，可以发现：

相交左上角=max(box1左上坐标, box2左上坐标)

相交右下角=min(box1右下角坐标，box2右下角坐标)

因此代码可以这样写：

intersect_mins = torch.max(b1_mins, b2_mins)  # 相交的左上角
intersect_max = torch.min(b1_maxes, b2_maxes)  # 相交的右下角
intersect_wh = torch.max(intersect_max - intersect_mins, torch.zeros_like(intersect_max)) # 求得相交的w和h

其中上面代码中的 torch.zeros_like(intersect_max) 是防止 两个框不相交，可令wh为0【相交面积也自然为0了】

那么我们就可以得到相交的面积了：

intersect_area = intersect_wh[:, 0] * intersect_wh[:, 1]  # 相交面积

然后是计算两个框的并集面积，并集面积可以这样算：

并集面积=box1面积+box2面积-相交面积

因此代码如下：

b1_area = b1_wh[:, 0] * b1_wh[:, 1]  # 预测框面积
b2_area = b2_wh[:, 0] * b2_wh[:, 1]  # 真实框面积

union_area = b1_area + b2_area - intersect_area  # 并集面积

然后我们就计算普通的IOU了(IOU就是交集面积和并集面积之比)

iou = intersect_area / union_area  # 计算IOU

此时的iou为【大家可以在纸上计算一下】：

iou = tensor([0.2954])

然后是计算两个框的中心点的欧式距离，即公式中的

。

计算中心差距d
center_distance = torch.sum(torch.pow(b1_xy - b2_xy, 2), axis=-1)  # 先求平方再相加，得到欧氏距离axis=-1是最后一个维度操作 d(b,bgt)

然后是计算包含两个框最小矩形的左上角和右下角(为计算对角线距离做准备)，然后可以分析一下这个最小矩形怎么找，坐标怎么算。通过观察，可以发现：

最小矩形的左上角=min(box1_左上角，box2_左上角)

最小矩形的右下角=max(box1_右下角，box2_右下角)

计算包含两个框的最小框的左上角和右下角
closebox_min = torch.min(b1_mins, b2_mins)  # 左上角
closebox_max = torch.max(b1_maxes, b2_maxes)  # 右下角
closebox_wh = torch.max(closebox_max - closebox_min, torch.zeros_like(intersect_max))

然后我们就可以将其绘制一下， 最小矩形对角线是图中浅蓝色部分，图中虚线是所求最小矩矩形。(绿色是真实框)

然后可以计算一个这个对角线距离：

计算对角线的距离
closebox_distance = torch.sum(torch.pow(closebox_max - closebox_min, 2), axis=-1)

我们现在已经得到了公式中所需要的所有数据了，接下来就是把上面所求组合成CIOU的公式。

因为我们上面已经计算过IOU了，现在计算一下公式中的

【代码较长，大家对着公式看】，其中1e+6是为了防止分母出现0而已。

v = math.pow(math.atan(b2_wh[:, 0] / (b2_wh[:, 1] + 1e-6))
- math.atan(b1_wh[:, 0] / (b1_wh[:, 1] + 1e-6)), 2) * 4/math.pow(math.pi, 2)

那么

也可以得到了：

alpha = v / (1 - iou + v)

然后我们就可以得到CIOU的整体公式了(代码中的clamp是将输入限定在一个区域，限制最小为1e-8也是为了防止分母为0)：

ciou = iou - center_distance / torch.clamp(closebox_distance, min=1e-8) - alpha * v

此时的CIOU损失函数为loss_ciou = 1-ciou，所以：

loss_ciou = 1 - ciou

我们可以打印一下此刻的loss为多少：

loss_ciou = tensor([0.7970])

其实到这就已经可以了，不过我们可以在做一个小小的实验，如果我们把预测框(最开始图中的黑色框)往右边平移5个单位，即让预测框与真实框重合度增大(说明预测的又准了一点点)，然后我们看下loss会怎么变。

iou = tensor([0.3905])
ciou = tensor([0.3258])
loss_ciou = tensor([0.6742])

我们可以看到，loss确实降低了，iou比之前上升了，说明我们的预测框确实离真实框距离又进了一步，预测也更准了那么一点点。

希望大家可以更好的理解CIOU的代码实现和分析过程。

完整代码：

import math

import torch
import matplotlib.pyplot as plt

box1 = torch.tensor([[5.4555e+01, 1.7518e+01, 4.0713e+01, 3.3931e+01]])  # 预测框
box2 = torch.tensor([[7.8304e+01, 1.6306e+01, 4.9968e+01, 3.6646e+01]])  # 真实框

fig = plt.figure()
ax = fig.add_subplot(111)

rec1 = plt.Rectangle((box1[:, 0].numpy() - box1[:, 2].numpy() / 2, box1[:, 1].numpy() - box1[:, 3].numpy() / 2),
                     box1[:, 2].numpy(), box1[:, 3].numpy(), fill=False)  # 预测框
rec2 = plt.Rectangle((box2[:, 0].numpy() - box2[:, 2].numpy() / 2, box2[:, 1].numpy() - box2[:, 3].numpy() / 2),
                     box2[:, 2].numpy(), box2[:, 3].numpy(), fill=False, color='g')  # 真实框

plt.plot((box1[:, 0].numpy(), box2[:, 0].numpy()), (box1[:, 1], box2[:, 1]), color='blue')  # 连接中心点
ax.add_patch(rec1)
ax.add_patch(rec2)
plt.xlim(-10, 150)
plt.ylim(-20, 110)
plt.gca().invert_yaxis()
plt.show()

b1_xy = box1[:, :2]  # 取预测框的中心点
b1_wh = box1[:, 2:]  # 取预测框的wh
b1_wh_half = b1_wh / 2.

b1_mins = b1_xy - b1_wh_half  # 求得左上角坐标
b1_maxes = b1_xy + b1_wh_half  # 求得右下角坐标

b2_xy = box2[:, :2]  # 取真实框的中心点
b2_wh = box2[:, 2:]  # 取真实框的wh
b2_wh_half = b2_wh / 2.

b2_mins = b2_xy - b2_wh_half  # 求得左上角坐标
b2_maxes = b2_xy + b2_wh_half  # 求得右下角坐标

intersect_mins = torch.max(b1_mins, b2_mins)  # 相交的左上角
intersect_max = torch.min(b1_maxes, b2_maxes)  # 相交的右下角

intersect_wh = torch.max(intersect_max - intersect_mins, torch.zeros_like(intersect_max)) # 求得相交的w和h
intersect_area = intersect_wh[:, 0] * intersect_wh[:, 1]  # 相交面积
b1_area = b1_wh[:, 0] * b1_wh[:, 1]  # 预测框面积
b2_area = b2_wh[:, 0] * b2_wh[:, 1]  # 真实框面积

union_area = b1_area + b2_area - intersect_area  # 并集面积
iou = intersect_area / union_area  # 计算IOU
print("iou = ", iou)
CIOU = IOU - d(b,bgt)/c^2 - αv
计算中心差距d
center_distance = torch.sum(torch.pow(b1_xy - b2_xy, 2), axis=-1)  # 先求平方再相加，得到欧氏距离axis=-1是最后一个维度操作 d(b,bgt)

计算包含两个框的最小框的左上角和右下角
closebox_min = torch.min(b1_mins, b2_mins)  # 左上角
closebox_max = torch.max(b1_maxes, b2_maxes)  # 右下角
closebox_wh = torch.max(closebox_max - closebox_min, torch.zeros_like(intersect_max))

plt.plot((closebox_min[:, 0], closebox_max[:, 0]), (closebox_min[:, 1], closebox_max[:, 1]))  # 绘制对角线

计算对角线的距离
closebox_distance = torch.sum(torch.pow(closebox_max - closebox_min, 2), axis=-1)

计算ciou
v = math.pow(math.atan(b2_wh[:, 0] / (b2_wh[:, 1] + 1e-6)) - math.atan(b1_wh[:, 0] / (b1_wh[:, 1] + 1e-6)), 2) * 4/math.pow(math.pi, 2)
alpha = v / (1 - iou + v)
ciou = iou - center_distance / torch.clamp(closebox_distance, min=1e-8) - alpha * v
print("ciou = ",ciou)
loss_ciou = 1 - ciou
print("loss_ciou = ",loss_ciou)
rec3 = plt.Rectangle((closebox_min[:, 0].numpy(), closebox_min[:, 1].numpy()),  # xy
                     closebox_max[:, 0].numpy() - closebox_min[:, 0].numpy(),  # w
                     closebox_max[:, 1].numpy() - closebox_min[:, 1].numpy(), fill=False, linestyle='dotted')  # h

ax.add_patch(rec3)
plt.xlim(20, 120)
plt.ylim(-5, 40)
plt.gca().invert_yaxis()
plt.show()

Original: https://blog.csdn.net/z240626191s/article/details/125322139
Author: 爱吃肉的鹏
Title: CIOU实现及可视化过程【附代码】

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/680172/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python随机数（random）

import random import string random.randint(a,b) 在python中的random.randint(a,b)用于生成一个指定范围内的整数…

人工智能 2023年7月30日
0061
Python采集某网站小视频内容, m3u8内容下载

前言大家早好、午好、晚好吖~ 目录标题 * – 前言 – 环境使用: – 模块使用: – 模块安装问题: – + * …

人工智能 2023年6月16日
0092
OpenCV绘制图像与文字(可作为脚手架代码)(python) Open_CV系列（四）

文章目录 1. cv2.line()绘制线段 2. cv2.rectangle() 绘制矩形 3. cv2.circle() 绘制圆形 * 3.1 绘制实现圆与空心圆 3.2 …

人工智能 2023年7月6日
0094
咕泡P5人工智能CV 技术NLP项目实战

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年5月27日
0072
YOLOV5 代码复现以及搭载服务器运行

文章目录前言一、YOLO简介二、代码下载三、数据集准备四、配置文件的修改 * 1.data下的yaml 2.models下的yaml 3.训练train 五、搭载服务器训…

人工智能 2023年6月16日
0094
【R】【决策树】【随机森林】

文章目录实验思维导图 1.决策树–ctree()–iris * 1.1 数据 – 1.1.1 程序包加载 1.1.2 数据集探索 1.1.3 …

人工智能 2023年7月18日
0062
目标检测算法分类

目标检测算法分类： 1、两步走的目标检测：先找出候选的一些区域，再对区域进行调整分类代表：R-CNN、SPP-net、Fast R-CNN、Faster R-CNN 2、端到端的…

人工智能 2023年6月30日
0081
数学建模|预测方法：灰色预测模型

简介灰色系统理论是由华中理工大学邓聚龙教授于1982年提出并加以发展的。二十几年来，引起了不少国内外学者的关注，得到了长足的发展。目前，在我国已经成为社会、经济、科学技术在等诸多…

人工智能 2023年6月19日
00101
利用Python进行数据分析的学习笔记——chap9

数据聚合与分组运算 GroupBy技术 import numpy as np import pandas as pd from pandas import DataFrame,Se…

人工智能 2023年7月6日
0064
Pytorch读取照片的三种方式（包括但不限于）

1.安装方式 conda install pillow 2.举例 from PIL import Image import numpy as np path=’../dataset…

人工智能 2023年7月27日
0069
【数值预测案例】(7) CNN-LSTM 混合神经网络气温预测，附TensorFlow完整代码

大家好，今天和各位分享一下如何使用 Tensorflow 构建 CNN卷积神经网络和 LSTM 循环神经网络相结合的混合神经网络模型，完成对多特征的时间序列预测。本文预测模型的主…

人工智能 2023年5月26日
00130
GCN, GAT, GraphSAGE对比【整理】

gcn 增加深度会降低模型效果主要是因为过度平滑的问题。现在解决这个问题的方法主要就是 skip-connection 的方法，其中包括你说的残差网络。这方面推荐你几篇论文: 1…

人工智能 2023年6月15日
00121
TIDB–JMETER测试报告

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月28日
0065
常用的数据清洗方法学习笔记（全面、完整）

常用的数据清洗方法在数据处理过程中，一般都需要进行数据的处理工作，如数据集是否存在重复、是否存在缺失、数据是否具有一定的完整性和一致性、数据中是否存在异常值等，当发现数据中可能存…

人工智能 2023年7月17日
0066
AI画师技术又精进了? AI画师三维版试玩——Dreamfields和DreamFusion向文本生成3D模型领域进发

0、AI画师二维版的出圈最近AI画师的杰出表现让人惊讶无比，2022虽然不是ai绘图这项技术诞生的时间，但却是到目前为止最爆火出圈的绘图元年，现在市场上也已经有了很多成熟的AI绘…

人工智能 2023年7月26日
0067
TensorFlow、PyTorch各版本对应的CUDA、cuDNN关系

TensorFlow、PyTorch各版本对应的CUDA、cuDNN关系（截止2021年4月7日） TensorFow * Linux – CPU GPU macOS …

人工智能 2023年7月24日
00108

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

CIOU实现及可视化过程【附代码】

大家都在看