一种非极大值抑制（non_max_suppression, nms）的代码实现方式

2023年8月29日下午1:31 • Python • 阅读 53

1. 简介
2. 代码
*
2.1 坐标形式转换
2.2 iou计算
2.3 nms
简介
非极大值抑制，non_max_suppression，简称nms，常用于目标检测的后处理，去除多余的检测框。
流程大致是：根据某个类别，按照检测框的置信度从大到小排序，选择置信度最高的检测框记为A，计算A与剩余的检测框（B1、B2、… BN）的iou值，若iou值大于设置的阈值，则将B1、B2、… BN中对应的检测框去掉，如此重复操作。
代码
结合yolov5模型输出，实现nms的代码。
在yolov5中，模型的输出记为pred，（这里pred是模型的直接输出，还没有经过后处理），pred的shape为：(batch_size, num_bbox, 4 + 1 + num_classes)，其中batch_size表示输入的图片数量，num_bbox表示检测到的矩形框数量，4表示4个坐标，1表示检测框的置信度，num_classes表示每个类别的分数。
pred的检测框坐标格式为：xywh，即检测框的中心坐标以及它的宽高

2.1 坐标形式转换


import numpy as np

def xywh2xyxy(x):
    y = np.copy(x)
    y[..., 0] = x[..., 0] - x[..., 2] / 2
    y[..., 1] = x[..., 1] - x[..., 3] / 2
    y[..., 2] = x[..., 0] + x[..., 2] / 2
    y[..., 3] = x[..., 1] + x[..., 3] / 2
    return y

2.2 iou计算

def cal_iou(det1, det2):
    det1_x1, det1_y1 = det1[..., 0], det1[..., 1]
    det1_x2, det1_y2 = det1[..., 2], det1[..., 3]

    det2_x1, det2_y1 = det2[..., 0], det2[..., 1]
    det2_x2, det2_y2 = det2[..., 2], det2[..., 3]

    x1 = np.maximum(det1_x1, det2_x1)
    y1 = np.maximum(det1_y1, det2_y1)
    x2 = np.minimum(det1_x2, det2_x2)
    y2 = np.minimum(det1_y2, det2_y2)

    area_det1 = (det1_y2 - det1_y1 + 1) * (det1_x2 - det1_x1 + 1)
    area_det2 = (det2_y2 - det2_y1 + 1) * (det2_x2 - det2_x1 + 1)
    inter = np.maximum(0, (y2 - y1 + 1)) * np.maximum(0, (x2 - x1 + 1))

    ious = inter / (area_det1 + area_det2 - inter)
    return ious

2.3 nms

def nms(detections, conf_thres=0.4, nms_thres=0.5):
    outputs = []
    detections = xywh2xyxy(detections)
    detections[..., 5:] *= detections[..., 4:5]
    num_classes = detections.shape[2] - 5
    candidates = detections[..., 4] > conf_thres
    for img_idx, dets in enumerate(detections):
        output = []
        dets = dets[candidates[img_idx]]
        indexes = dets[..., 4].argsort()[::-1]
        dets = dets[indexes]
        classes_dets = dets[..., 5:].argmax(axis=1)
        for cls in range(num_classes):
            dets_cls = dets[classes_dets == cls]
            while len(dets_cls):
                det_select = dets_cls[0]

                det_select = np.concatenate((det_select[..., :4], [det_select[..., 5:].max(), cls]))
                output.append(det_select)
                dets_cls = dets_cls[1:]
                if len(dets_cls):
                    ious = cal_iou(det_select, dets_cls)
                    indexes = np.where(ious  nms_thres)[0]
                    dets_cls = dets_cls[indexes]
        outputs.append(output)
    return np.array(outputs)

这里得到的outputs还需要映射回原图像，以下图为例：

一种非极大值抑制（non_max_suppression, nms）的代码实现方式

如图所示，原始图像经过resize之后得到红色框，红色框经过padding得到黑色框，绿色框表示检测框在黑色框中的位置（即以黑色框左上角为原点的位置）。
将检测结果映射回原始图像时，要先去除padding的影响，再去除resize的影响，这样就得到检测框在原图中的位置。具体步骤如下：
检测框先向上移动t个像素，再向左移动p个像素，其中t、p表示在上方向、左方向padding的像素个数，具体操作将x1 = x1 – p, x2 = x2 – p, y1 = y1 – t, y2 = y2 – t; 这样就得到检测框在没有padding操作下的位置（即以红色框左上角为原点的位置）；
去除resize的影响。只要将坐标除以图像resize后与原图像的的比例gain即可，假设原始图像高、宽为ori_h, ori_w，resize之后的宽高为new_h, new_w，则ratio = min(new_h/ori_h, new_w/ori_w), 然后让x1 = x1/ratio, y1 = y1/ratio, x2 = x2/ratio, y2 = y2/ratio，即得到原始图像的位置。
代码如下:

def scale_coords(output, ori_shape, ratio=1.0, top_pad=0, left_pad=0):
    ori_h, ori_w = ori_shape
    output[:, [0, 2]] -= left_pad
    output[:, [1, 3]] -= top_pad
    output[:, :4] /= ratio
    output[:, [0, 2]] = output[:, [0, 2]].clip(0, ori_w)
    output[:, [1, 3]] = output[:, [1, 3]].clip(0, ori_h)

完成。

Original: https://blog.csdn.net/weixin_43508499/article/details/125884082
Author: lokvke
Title: 一种非极大值抑制（non_max_suppression, nms）的代码实现方式

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/762934/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python

python学习：Python爬虫编程基础5天速成（2021全新合集）Python入门+数据分析_哔哩哔哩_bilibili 目录 pycharm最新版如何设置自动换行时间戳： …

Python 2023年8月12日
0088
人口分析案例

文章目录需求一、数据预处理二、数据处理总结需求源数据获取–密码:6qpt 导入文件，查看原始数据将人口数据和各州简称数据进行合并将合并的数据中重复的abbrevia…

Python 2023年8月18日
0056
【目标跟踪】卡尔曼滤波器(Kalman Filter) 含源码

目录系列文章效果展示卡尔曼滤波器的简单介绍一、公式解释二、卡尔曼增益的推导三、第一个例子四、第二个例子系列文章【目标跟踪】卡尔曼滤波器(Kalman Filter…

Python 2023年10月26日
0040
bugku CTF练习：Flask_FileUpload思路

https://ctf.bugku.com/challenges/detail/id/204.html 打开页面是这个样子。右键查看源代码。它提示我说会用Python去执行。太棒…

Python 2023年8月13日
0049
Python Pandas操作Excel 03

3.1 Pandas操作Excel 03 3.1.1 连接查询 Merge ① inner join（取交集，数据交叉的部分，取出来。） ② left join (以左表为主，合并…

Python 2023年8月8日
0040
pandas数据分析工具

pandas : python data analysis lib基于numpy 的数据分析工具，可以高效的操作大型结构化结构化结构化的数据数据结构：数据在计算机中的存储、…

Python 2023年8月21日
0043
【Spring专题】「开发指南」夯实实战基础功底之解读logback-spring.xml文件的详解实现

logback的maven配置 org.slf4j slf4j-api 2.0.3 ch.qos.logback logback-core 1.4.4 ch.qos.logback…

Python 2023年10月11日
0032
MySQL InnoDB缓存

1. 背景对于各种用户数据、索引数据等各种数据都是需要持久化存储到磁盘，然后以”页”为单位进行读写。相对于直接读写缓存，磁盘IO的成本相当高昂。对于读…

Python 2023年10月22日
0055
Python实现坦克大战(TankWar)游戏

; Features 双人模式 动画&#…

Python 2023年8月2日
0067
不要删venv文件！Pycharm 报错： Environment location directory is not empty 解决

问题：当初遇到这个问题，网上大部分的方法是删除venv（环境管理器）文件但是这样的方法虽然简单粗暴，但是删除这个环境之后，之前的项目也就不能用了呀解决方法：所以我们需要 …

Python 2023年8月4日
00127
基于Python的高校请假管理信息系统开发(Django框架)

摘要伴随着信息技术的发展与成熟，使用计算机进行人员的科学高效管理模式代替效率低下的人工管理模式已经发展为当下时代的潮流，同时也是当下社会发展的需求。当下，许多高校仍然没有开发出相应…

Python 2023年8月5日
0059
2014年个人总结

离2015年元旦只剩最后1天了，2014年总体过得不是很顺利，但也有小许的收获！下面就来做一个简单的总结：一.遗憾与不足1.14年初考双证的MBA，虽说这次没有全力准备，但相对于…

Python 2023年6月6日
0078
从零开始数据分析Kaggle项目——泰坦尼克号（五）

从零开始数据分析Kaggle项目—泰坦尼克号2—2.1 import pandas as pd import numpy as np df = pd.read_csv("…

Python 2023年8月21日
0070
Python软件编程等级考试三级——20220618

Python软件编程等级考试三级——20220618 理论 * 单选题判断题实操 * 第一题第二题第三题理论单选题 1、如下所示的2行代码，最后print()函数打印…

Python 2023年8月26日
0084
时间序列的数据分析(四):STL分解

之前已经完成了三篇关于时间序列的博客，还没有阅读过的读者请先阅读：时间序列的数据分析(一):主要成分时间序列的数据分析(二):数据趋势的计算时间序列的数据分析(三):经典时间…

Python 2023年8月23日
0058
即刻掌握python格式化输出的三种方式 (o゜▽゜)o☆

目录 1. f 转化的格式化输出方式 2. % 格式化输出的方法 3. format 格式化输出的方法 f 转化的格式化输出方式只需要在我们要格式化输出的内容开头引号的前面加上 …

Python 2023年8月1日
0064

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

一种非极大值抑制（non_max_suppression, nms）的代码实现方式

目录

2.1 坐标形式转换

2.2 iou计算

2.3 nms

大家都在看