目标检测—CIOU原理及代码实现

2023年7月10日上午7:37 • 人工智能 • 阅读 64

目标检测—CIOU原理及代码实现

最近刚写完一篇YOLO V4-tiny的blog，其中Tensorflow2.0—YOLO V4-tiny网络原理及代码解析（三）- 损失函数的构建涉及到了CIOU。所以特地单独领出来写一篇blog记录一下。

在YOLO V3中，对于位置的损失函数，使用的还是普通的smooth-l1损失函数，但是到了YOLO V4中，关于位置的损失函数已经变成CIOU了。

一、原理，公式

关于它的原理，在YOLOV4与YOLOV3的区别中已经有了大致的介绍。

; 二、优点

相比于IOU的优点：
1.IOU没有考虑到两个框之间的位置信息，如果两个框没有重叠，它的IOU=0，没法进行反向传播。
2.还有一点，就是为什么之前的所有目标检测的网络中没有用iou直接作为损失函数。就是因为对于大小不同的框，iou值相同，但是其重叠程度却不同（说白了，就是对尺度不敏感）。在ciou中，由于有v这个概念，所以就使这种情况不可能再出现（个人理解，不对还请指正）。

三、代码实现

先来看下输入参数：

def box_ciou(b1, b2):
'''输入为：
    b1: tensor, shape=(batch, feat_w, feat_h, anchor_num, 4), xywh
    b2: tensor, shape=(batch, feat_w, feat_h, anchor_num, 4), xywh
'''

这里，我就用yolo系列的一个yolo head为例：b1和b2的shape=（2,13,13,3,4），其中4表示的是xywh。
第一步：先将输入的进行转换，转化为xyxy格式，其中b1_mins，b1_maxes ，b2_mins ，b2_maxes 的shape=（2,13,13,3,2）


    b1_xy = b1[..., :2]
    b1_wh = b1[..., 2:4]
    b1_wh_half = b1_wh/2.

    b1_mins = b1_xy - b1_wh_half
    b1_maxes = b1_xy + b1_wh_half

    b2_xy = b2[..., :2]
    b2_wh = b2[..., 2:4]
    b2_wh_half = b2_wh/2.

    b2_mins = b2_xy - b2_wh_half
    b2_maxes = b2_xy + b2_wh_half

第二步：计算真实与预测的iou值

    intersect_mins = K.maximum(b1_mins, b2_mins)
    intersect_maxes = K.minimum(b1_maxes, b2_maxes)
    intersect_wh = K.maximum(intersect_maxes - intersect_mins, 0.)
    intersect_area = intersect_wh[..., 0] * intersect_wh[..., 1]
    b1_area = b1_wh[..., 0] * b1_wh[..., 1]
    b2_area = b2_wh[..., 0] * b2_wh[..., 1]
    union_area = b1_area + b2_area - intersect_area
    iou = intersect_area / K.maximum(union_area,K.epsilon())

第三步：计算两个框的中心点的距离（ρ）

    center_distance = K.sum(K.square(b1_xy - b2_xy), axis=-1)

第四步：计算两个框的最小闭包区域的对角线大小（c）

    enclose_mins = K.minimum(b1_mins, b2_mins)
    enclose_maxes = K.maximum(b1_maxes, b2_maxes)
    enclose_wh = K.maximum(enclose_maxes - enclose_mins, 0.0)
    enclose_diagonal = K.sum(K.square(enclose_wh), axis=-1)

第五步：计算α

    ciou = iou - 1.0 * (center_distance) / K.maximum(enclose_diagonal ,K.epsilon())
    v = 4*K.square(tf.math.atan2(b1_wh[..., 0], K.maximum(b1_wh[..., 1],K.epsilon())) - tf.math.atan2(b2_wh[..., 0], K.maximum(b2_wh[..., 1],K.epsilon()))) / (math.pi * math.pi)
    alpha = v /  K.maximum((1.0 - iou + v), K.epsilon())

值得注意的是，v和alpha的shape都是为（2,13,13,3）

第六步：计算最终的ciou，并在最后一维增加一个维度

    ciou = ciou - alpha * v
    ciou = K.expand_dims(ciou, -1)

最终，输出的ciou的shape为（2,13,13,3,1）。

完整代码如下：

import math

import tensorflow as tf
from tensorflow.keras import backend as K
from tensorflow.keras import Input

def box_ciou(b1, b2):
"""
    输入为：
    ----------
    b1: tensor, shape=(batch, feat_w, feat_h, anchor_num, 4), xywh
    b2: tensor, shape=(batch, feat_w, feat_h, anchor_num, 4), xywh
    返回为：
    -------
    ciou: tensor, shape=(batch, feat_w, feat_h, anchor_num, 1)
"""

    b1_xy = b1[..., :2]
    b1_wh = b1[..., 2:4]
    b1_wh_half = b1_wh/2.

    b1_mins = b1_xy - b1_wh_half
    b1_maxes = b1_xy + b1_wh_half

    b2_xy = b2[..., :2]
    b2_wh = b2[..., 2:4]
    b2_wh_half = b2_wh/2.

    b2_mins = b2_xy - b2_wh_half
    b2_maxes = b2_xy + b2_wh_half

    intersect_mins = K.maximum(b1_mins, b2_mins)
    intersect_maxes = K.minimum(b1_maxes, b2_maxes)
    intersect_wh = K.maximum(intersect_maxes - intersect_mins, 0.)
    intersect_area = intersect_wh[..., 0] * intersect_wh[..., 1]
    b1_area = b1_wh[..., 0] * b1_wh[..., 1]
    b2_area = b2_wh[..., 0] * b2_wh[..., 1]
    union_area = b1_area + b2_area - intersect_area
    iou = intersect_area / K.maximum(union_area,K.epsilon())

    center_distance = K.sum(K.square(b1_xy - b2_xy), axis=-1)
    enclose_mins = K.minimum(b1_mins, b2_mins)
    enclose_maxes = K.maximum(b1_maxes, b2_maxes)
    enclose_wh = K.maximum(enclose_maxes - enclose_mins, 0.0)

    enclose_diagonal = K.sum(K.square(enclose_wh), axis=-1)
    ciou = iou - 1.0 * (center_distance) / K.maximum(enclose_diagonal ,K.epsilon())

    v = 4*K.square(tf.math.atan2(b1_wh[..., 0], K.maximum(b1_wh[..., 1],K.epsilon())) - tf.math.atan2(b2_wh[..., 0], K.maximum(b2_wh[..., 1],K.epsilon()))) / (math.pi * math.pi)
    alpha = v /  K.maximum((1.0 - iou + v), K.epsilon())
    ciou = ciou - alpha * v

    ciou = K.expand_dims(ciou, -1)
    return ciou

if __name__ == '__main__':
    b1 = Input(shape=(13,13,3,4))
    b2 = Input(shape=(13,13,3,4))
    ciou = box_ciou(b1,b2)

代码转载于： https://blog.csdn.net/weixin_44791964/article/details/107302710?spm=1001.2014.3001.5501

Original: https://blog.csdn.net/weixin_42206075/article/details/114310041
Author: 进我的收藏吃灰吧~~
Title: 目标检测—CIOU原理及代码实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/682360/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

无人机辅助移动边缘计算的计算卸载优化:一种深度确定性策略梯度方法（6）——代码实现

无人机辅助移动边缘计算的计算卸载优化:一种深度确定性策略梯度方法（6）——代码实现参考连接：[1] Wang Y , Fang W , Ding Y , et al. Compu…

人工智能 2023年6月25日
0061
推荐算法（一）电影推荐系统

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月15日
0075
AI超清修复出黄家驹眼里的光、LeCun大佬《深度学习》课程生还报告、绝美画作只需一行代码、AI最新论文 | ShowMeAI资讯日报

ShowMeAI 日报系列全新升级！覆盖AI人工智能工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文等方向。点…

人工智能 2023年5月28日
0077
VMware虚拟机安装Ubuntu 2022最新版详细图文安装教程(VMware虚拟机安装+Ubuntu下载+VMware虚拟机配置运行)

名人说：君子生非异也，善假于物也。——荀子(CSDN)o(‐＾▽＾‐)o很高兴你打开了这篇博客，跟着步骤一步步尝试安装吧。 ; 目录 * – 一、简单介绍 &#8211…

人工智能 2023年6月19日
0057
容器Ubuntu 18.04.5 跑通CNdeepdive教程

系统：Ubuntu 18.04.5，是安装在k8s上的一个容器。 0. 环境准备说明1：如果报错”gzip: stdin: not in gzip format&…

人工智能 2023年6月1日
0091
从0到1构建一个基于知识图谱的智能问答系统

目录一、前言二、知识图谱 * 2.1 数据入库 – 2.1.1 Nebula Graph搭建 2.1.2数据导入三、后端 * 3.1 搭建Flask框架，处理ht…

人工智能 2023年7月27日
0052
字节跳动基于ClickHouse优化实践之“多表关联查询”

更多技术交流、求职机会，欢迎关注字节跳动数据平台微信公众号，回复【1】进入官方交流群相信大家都对大名鼎鼎的ClickHouse有一定的了解了，它强大的数据分析性能让人印象深刻。…

人工智能 2023年6月19日
00210
超分之一文读懂SRGAN

这篇文章介绍SRResNet网络，以及将SRResNet作为生成网络的GAN模型用于超分，即SRGAN模型。这是首篇在人类感知视觉上进行超分的文章，而以往的文章以PSNR为导向，但…

人工智能 2023年6月16日
0069
合并CSV文件后并插入到指定excel表某行某列

import os import pandas as pd from openpyxl.styles import Border, Side, Alignment, Font fr…

人工智能 2023年7月8日
0099
cbow word2vec 损失_DL4NLP——词表示模型（二）基于神经网络的模型：NPLM；word2vec（CBOW/Skip-gram）…

本文简述了以下内容：神经概率语言模型NPLM，训练语言模型并同时得到词表示 word2vec：CBOW / Skip-gram，直接以得到词表示为目标的模型 (一)原始CBOW(…

人工智能 2023年6月10日
0082
Java 日历的小程序

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月27日
0083
实例项目中运用机器学习解决回归预测问题的基础步骤

本文旨在给初学者在面对实例项目中的机器学习回归预测问题时一些建议和引导。 1 构建数据表 1.1 数据介绍（关键字：机器学习回归预测、机器学习预测问题、python机器学习预测实…

人工智能 2023年6月18日
0085
数据分析（一）- 数据分析基础及matplotlib

目录为什么要学习数据分析什么是数据分析环境安装认识jupyter notebook matplotlib * matplotlib绘制折线图 plt.plot maplot…

人工智能 2023年6月11日
0052
一个Springboot配置顺序问题，让我直接回滚代码了

问题回顾前天，日常上线了个小迭代。内容是：将接口A切换成了接口B，需求很小，QA也没想着测，就让我自测后走免测上线了。开发完成后，赶紧部署到测试环境验证了下，没啥问题，per…

人工智能 2023年6月28日
0086
Python 集合set详解（超详细）

集合（set）是一个无序的不重复元素序列。 1、构造集合可以使用大括号 { } 或者 set() 函数创建集合，注意：创建一个空集合必须用 set() 而不是 { }，因为 …

人工智能 2023年7月3日
0058
均值滤波opencv-python

均值滤波的思想和多次测量求取平均值是一致的。均值滤波是线性滤波中的一种。图像的线性滤波操作与图像的卷积操作过程类似，不同之处在于图像的滤波不需要将滤波模板旋转180°。卷积操作中…

人工智能 2023年7月20日
0035

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

目标检测—CIOU原理及代码实现

一、原理，公式

; 二、优点

三、代码实现

大家都在看