IoU、GIoU、DIoU、CIoU计算方法

2023年7月10日下午4:35 • 人工智能 • 阅读 105

IoU

IoU就是我们所说的交并比，是目标检测中最常用的指标，在anchor-based的方法中，他的作用不仅用来确定正样本和负样本，还可以用来评价输出框（predict box）和ground-truth的距离。

可以说它可以反映预测检测框与真实检测框的检测效果。
还有一个很好的特性就是尺度不变性，也就是对尺度不敏感（scale invariant），在regression任务中，判断predict box和gt的距离最直接的指标就是IoU。(满足非负性；同一性；对称性；三角不等性)
IoU的一种实现方式如下：

def intersection_over_union(box1, box2, wh=False):
"""
    &#x8BA1;&#x7B97;IoU&#xFF08;&#x4EA4;&#x5E76;&#x6BD4;&#xFF09;
    :param box1: bounding box1
    :param box2: bounding box2
    :param wh: &#x5750;&#x6807;&#x7684;&#x683C;&#x5F0F;&#x662F;&#x5426;&#x4E3A;&#xFF08;x,y,w,h&#xFF09;
    :return:&#x8BA1;&#x7B97;&#x7ED3;&#x679C;
"""
    if not wh:
        xmin1, ymin1, xmax1, ymax1 = box1
        xmin2, ymin2, xmax2, ymax2 = box2
    else:
        xmin1, ymin1 = int(box1[0] - box1[2] / 2.0), int(box1[1] - box1[3] / 2.0)
        xmax1, ymax1 = int(box1[0] + box1[2] / 2.0), int(box1[1] + box1[3] / 2.0)
        xmin2, ymin2 = int(box2[0] - box2[2] / 2.0), int(box2[1] - box2[3] / 2.0)
        xmax2, ymax2 = int(box2[0] + box2[2] / 2.0), int(box2[1] + box2[3] / 2.0)
    # &#x83B7;&#x53D6;&#x77E9;&#x5F62;&#x6846;&#x4EA4;&#x96C6;&#x5BF9;&#x5E94;&#x7684;&#x5DE6;&#x4E0A;&#x89D2;&#x548C;&#x53F3;&#x4E0B;&#x89D2;&#x7684;&#x5750;&#x6807;&#xFF08;intersection&#xFF09;
    xx1 = max([xmin1, xmin2])
    yy1 = max([ymin1, ymin2])
    xx2 = min([xmax1, xmax2])
    yy2 = min([ymax1, ymax2])
    # &#x8BA1;&#x7B97;&#x4E24;&#x4E2A;&#x77E9;&#x5F62;&#x6846;&#x9762;&#x79EF;
    area1 = (xmax1 - xmin1) * (ymax1 - ymin1)
    area2 = (xmax2 - xmin2) * (ymax2 - ymin2)
    inter_area = (max([0, xx2 - xx1])) * (max([0, yy2 - yy1]))  # &#x8BA1;&#x7B97;&#x4EA4;&#x96C6;&#x9762;&#x79EF;
    iou = inter_area / (area1 + area2 - inter_area + 1e-6)  # &#x8BA1;&#x7B97;&#x4EA4;&#x5E76;&#x6BD4;
    return iou

GIoU

在CVPR2019中，论文《Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression》
提出了GIoU的思想。由于IoU是比值的概念，对目标物体的scale是不敏感的。然而检测任务中的BBox的回归损失(MSE loss, l1-smooth loss等）优化和IoU优化不是完全等价的，而且 Ln 范数对物体的scale也比较敏感，IoU无法直接优化没有重叠的部分。

这篇论文提出可以直接把IoU设为回归的loss。

上面公式的意思是：先计算两个框的最小闭包区域面积A c A_c A c (通俗理解：同时包含了预测框和真实框的最小框的面积)，再计算出IoU，再计算闭包区域中不属于两个框的区域占闭包区域的比重，最后用IoU减去这个比重得到GIoU。
GIoU的一种实现方式如下：

def g_iou(rec1, rec2):
"""
    &#x8BA1;&#x7B97;GIoU
    :param rec1: bounding box1&#xFF08;xmin, ymin, xmax, ymax&#xFF09;&#x683C;&#x5F0F;
    :param rec2: bounding box2&#xFF08;xmin, ymin, xmax, ymax&#xFF09;&#x683C;&#x5F0F;
    :return: &#x8BA1;&#x7B97;&#x7ED3;&#x679C;
"""
    # xmin, ymin, xmax, ymax&#x683C;&#x5F0F;
    xmin1, ymin1, xmax1, ymax1 = rec1
    xmin2, ymin2, xmax2, ymax2 = rec2
    iou = intersection_over_union(rec1, rec2)
    area_closure = (max(xmin1, xmax1, xmin2, xmax2) - min(xmin1, xmax1, xmin2, xmax2)) * (
            max(ymin1, ymax1, ymin2, ymax2) - min(ymin1, ymax1, ymin2, ymax2))
    area_1 = (xmax1 - xmin1) * (ymax1 - ymin1)
    area_2 = (xmax2 - xmin2) * (ymax2 - ymin2)
    sum_area = area_1 + area_2

    w1 = xmax1 - xmin1  # &#x7B2C;&#x4E00;&#x4E2A;&#x77E9;&#x5F62;&#x7684;&#x5BBD;
    w2 = xmax2 - xmin2  # &#x7B2C;&#x4E8C;&#x4E2A;&#x77E9;&#x5F62;&#x7684;&#x5BBD;
    h1 = ymax1 - ymin1
    h2 = ymax2 - ymin2
    w = min(xmin1, xmax1, xmin2, xmax2) + w1 + w2 - max(xmin1, xmax1, xmin2, xmax2)  # &#x4EA4;&#x53C9;&#x90E8;&#x5206;&#x7684;&#x5BBD;
    h = min(ymin1, ymax1, ymin2, ymax2) + h1 + h2 - max(ymin1, ymax1, ymin2, ymax2)  # &#x4EA4;&#x53C9;&#x90E8;&#x5206;&#x7684;&#x9AD8;
    intersection_area = w * h  # &#x4EA4;&#x53C9;&#x7684;&#x9762;&#x79EF;
    add_area = sum_area - intersection_area  # &#x4E24;&#x77E9;&#x5F62;&#x5E76;&#x96C6;&#x7684;&#x9762;&#x79EF;
    end_area = (area_closure - add_area) / area_closure  # &#x95ED;&#x5305;&#x533A;&#x57DF;&#x4E2D;&#x4E0D;&#x5C5E;&#x4E8E;&#x4E24;&#x4E2A;&#x6846;&#x7684;&#x533A;&#x57DF;&#x5360;&#x95ED;&#x5305;&#x533A;&#x57DF;&#x7684;&#x6BD4;&#x91CD;
    giou = iou - end_area
    return giou

DIoU

DIoU要比GIou更加符合目标框回归的机制，将目标与anchor之间的距离，重叠率以及尺度都考虑进去，使得目标框回归变得更加稳定，不会像IoU和GIoU一样出现训练过程中发散等问题。

其中，b b b ，b g t b^{gt}b g t 分别代表了预测框和真实框的中心点，且 ρ \rho ρ代表的是计算两个中心点间的欧式距离。 c c c 代表的是能够同时包含预测框和真实框的最小闭包区域的对角线距离。
一种DIoU的实现方式：


def d_iou(rec1, rec2):
"""
    &#x8BA1;&#x7B97;DIoU
    :param rec1: bounding box1&#xFF08;xmin, ymin, xmax, ymax&#xFF09;&#x683C;&#x5F0F;
    :param rec2: bounding box2&#xFF08;xmin, ymin, xmax, ymax&#xFF09;&#x683C;&#x5F0F;
    :return: &#x8BA1;&#x7B97;&#x7ED3;&#x679C;
"""
    # xmin, ymin, xmax, ymax&#x683C;&#x5F0F;
    xmin1, ymin1, xmax1, ymax1 = rec1
    xmin2, ymin2, xmax2, ymax2 = rec2
    iou = intersection_over_union(rec1, rec2)
    # &#x4E2D;&#x5FC3;&#x70B9;&#x8DDD;&#x79BB;&#x5E73;&#x65B9;
    center1 = ((xmin1 + xmax1) / 2, (ymin1 + ymax1) / 2)
    center2 = ((xmin2 + xmax2) / 2, (ymin2 + ymax2) / 2)
    d_center2 = (center1[0] - center2[0]) ** 2 + (center1[1] - center2[1]) ** 2
    # &#x6700;&#x5C0F;&#x95ED;&#x5305;&#x77E9;&#x5F62;&#x5BF9;&#x89D2;&#x7EBF;&#x957F;&#x5EA6;&#x5E73;&#x65B9;
    corner1 = (min(xmin1, xmax1, xmin2, xmax2), min(ymin1, ymax1, ymin2, ymax2))
    corner2 = (max(xmin1, xmax1, xmin2, xmax2), max(ymin1, ymax1, ymin2, ymax2))
    d_corner2 = (corner1[0] - corner2[0]) ** 2 + (corner1[1] + corner2[1]) ** 2
    diou = iou - d_center2 / d_corner2
    return diou

CIoU

考虑到bbox回归三要素中的长宽比还没被考虑到计算中，因此，进一步在DIoU的基础上提出了CIoU。其惩罚项如下面公式：

其中α \alpha α是权重函数
而v v v用来度量长宽比的相似性，定义为:

完整的 CIoU 损失函数定义：
IoU、GIoU、DIoU、CIoU计算方法

一种CIoU的实现方式如下：

import numpy

def c_iou(rec1, rec2):
"""
    &#x8BA1;&#x7B97;CIoU
    :param rec1: bounding box1&#xFF08;xmin, ymin, xmax, ymax&#xFF09;&#x683C;&#x5F0F;
    :param rec2: bounding box2&#xFF08;xmin, ymin, xmax, ymax&#xFF09;&#x683C;&#x5F0F;
    :return: &#x8BA1;&#x7B97;&#x7ED3;&#x679C;
"""
    # xmin, ymin, xmax, ymax&#x683C;&#x5F0F;
    xmin1, ymin1, xmax1, ymax1 = rec1
    xmin2, ymin2, xmax2, ymax2 = rec2
    iou = intersection_over_union(rec1, rec2)
    # &#x4E2D;&#x5FC3;&#x70B9;&#x8DDD;&#x79BB;&#x5E73;&#x65B9;
    center1 = ((xmin1 + xmax1) / 2, (ymin1 + ymax1) / 2)
    center2 = ((xmin2 + xmax2) / 2, (ymin2 + ymax2) / 2)
    d_center2 = (center1[0] - center2[0]) ** 2 + (center1[1] - center2[1]) ** 2
    # &#x6700;&#x5C0F;&#x95ED;&#x5305;&#x77E9;&#x5F62;&#x5BF9;&#x89D2;&#x7EBF;&#x957F;&#x5EA6;&#x5E73;&#x65B9;
    corner1 = (min(xmin1, xmax1, xmin2, xmax2), min(ymin1, ymax1, ymin2, ymax2))
    corner2 = (max(xmin1, xmax1, xmin2, xmax2), max(ymin1, ymax1, ymin2, ymax2))
    d_corner2 = (corner1[0] - corner2[0]) ** 2 + (corner1[1] + corner2[1]) ** 2
    w1, h1 = xmax1 - xmin1, ymax1 - ymin1
    w2, h2 = xmax2 - xmin2, ymax2 - ymin2
    # &#x5EA6;&#x91CF;&#x957F;&#x5BBD;&#x6BD4;&#x7684;&#x53C2;&#x6570;
    v = 4 * (np.arctan(w1 / h1) - np.arctan(w2 / h2)) ** 2 / (np.pi ** 2)
    alpha = v / (1 - iou + v)
    ciou = iou - d_center2 / d_corner2 - alpha * v
    return ciou

Original: https://blog.csdn.net/Ray_awakepure/article/details/121594033
Author: Ray_awakepure
Title: IoU、GIoU、DIoU、CIoU计算方法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/683166/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【目标检测】yoloV5算法详解

一、与yoloV4相比，yoloV5的改进输入端：在模型训练阶段，使用了Mosaic数据增强、自适应锚框计算、自适应图片缩放基准网络：使用了FOCUS结构和CSP结构 Neck…

人工智能 2023年6月17日
00118
深度学习之多分类损失函数用法

均方误差（MSE）的含义是求一个batch中n个样本的n个输出与期望输出的差的平方的平均值。比如对于一个神经元（单输入单输出，sigmoid函数）,定义其代价函数为（其中y是我们期…

人工智能 2023年7月13日
0092
Python机器视觉–OpenCV进阶(核心)–图像二值化

1.图像二值化 1.1 图像全局二值化二值化: 将图像的每个像素变成两种值, 比如0, 255. threshold(src, thresh, maxval, type[, ds…

人工智能 2023年7月20日
0063
记录若干`tf.py_function`的使用的方式，便于查阅

啊哦~你想找的内容离你而去了哦内容不存在，可能是由于以下原因造成的： [En] The content does not exist and may be caused by t…

人工智能 2023年5月23日
0072
python 合并csv文件的问题：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xba in position 0、csv中文乱码

python 合并csv文件遇到的问题问题一：UnicodeDecodeError: ‘utf-8’ codec can’t decode b…

人工智能 2023年7月8日
0082
软件智能:aaas系统AI众生世界之24 主体间性和主体性

本篇回到哲学的一些基本问题上。关键词是：主体间性和主体性。前者是现象的诠释学范畴，后者是它的对立面–标志sign的符号学。可以将后者（标志符号学）视为象征手法，…

人工智能 2023年6月1日
0075
图像修复（Image Inpainting）任务中常用的掩码数据集

文章目录前言 mask数据集分类及介绍总结前言在 Image Inpainting（图像修复）任务中，需要使用掩码数据集在图像上人为添加缺陷区域，以便在设计的深度学习上进…

人工智能 2023年7月28日
0073
安装mmdet,mmcv-full

前言由于最近可能要参加关于目标检测和跟踪的比赛,所以先提前装好环境. 我的环境以及各种配置版本: 系统: Ubuntu 18.04.6 CUDA : 11.04 Python 3…

人工智能 2023年6月16日
0091
python深度学习机器学习必备的学习网站集合！

文章目录目录文章目录前言一、Papers With Code 推荐理由适合人群二、DLab教学与实训平台推荐理由适合人群优质教程(可选) 基于PyTorch搭建C…

人工智能 2023年6月26日
0067
RuntimeError: DefaultCPUAllocator: not enough memory: you tried to allocate 1105920 bytes.

问题 RuntimeError: [enforce fail at ..\c10\core\CPUAllocator.cpp:76] data. DefaultCPUAllocat…

人工智能 2023年6月23日
0082
【全流程】从头在树莓派4B上部署自己训练的yolov5模型（配合NCS2加速）

目录 0.前言 1.我的环境 2.整个流程 3.具体过程 * 3.1 训练自己的yolov5模型 3.2 将.pt模型转换为.onnx模型 3.3 在本地将.onnx转换成IR模型…

人工智能 2023年6月16日
00102
习题解答chapter08

题目仿照例15.4，编写完整的基于Socket的多客户/服务器通信程序仿照例15.5，编写完整的基于数据报的多客户/服务器通信程序 1. 仿照例15.4，编写完整的基于Sock…

人工智能 2023年6月4日
0090
Stata重复与去重

我们在处理数据的时候，经常会遇到观测值（数据中，每一行叫一个观测值）有重复的情况；有些时候这些观测值是有差别的，而这些差别有可能要关注，也有可能不关注。下面我们来看一下下图的数据…

人工智能 2023年7月15日
00122
Neo4j清空数据库

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月1日
0098
GPU版本PyTorch详细安装教程

目录一、安装显卡驱动 1、查看显卡驱动型号 2、下载显卡驱动 3、查看GPU状态二、安装Visual Studio 2019 三、安装CUDA 1、下载对应版本的CUDA 2、…

人工智能 2023年7月20日
0070
凸和非凸的理解

目录一句话概括一、凸和非凸的区别二、凸函数和非凸函数三、凸优化和非凸优化 * 凸优化：常见的凸优化方法：凸优化的一般求解过程非凸优化：一句话概括凸（Convex）…

人工智能 2023年6月15日
00150

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

IoU、GIoU、DIoU、CIoU计算方法

IoU

GIoU

DIoU

CIoU

大家都在看