非极大值抑制Non-Maximum Suppression（NMS）

2023年7月14日下午5:04 • 人工智能 • 阅读 76

; 1. 目的

使用NMS目的：提高召回率，但是召回率是”宁肯错杀一千，绝不放过一个”。因此在目标检测中，模型往往会提出远高于实际数量的区域提议（Region Proposal，SSD等one-stage的Anchor也可以看作一种区域提议）。

这就导致最后输出的边界框数量往往远大于实际数量，而这些模型的 输出边界框往往是堆叠在一起的。因此，我们需要NMS从堆叠的边框中挑出最好的那个。

2. 何时使用NMS？

回顾我在Cascade-RCNN中提到的流程：

提议区域
提取特征
目标分类
回归边框

NMS使用在4. 回归边框之后，即所有的框已经被分类且精修了位置。且所有区域提议的预测结果已经由置信度与阈值初步筛选之后。

3. 算法流程

算法输入

算法对一幅图产生的所有的候选框，每个框有坐标与对应的打分（置信度）。

如一组5维数组：

每个组表明一个边框，组数是待处理边框数
4个数表示框的坐标：X_max，X_min，Y_max，Y_min
1个数表示对应分类下的置信度

注意：每次输入的不是一张图所有的边框，而是一张图中属于某个类的所有边框（因此极端情况下，若所有框的都被判断为背景类，则NMS不执行；反之若存在物体类边框，那么有多少类物体则分别执行多少次NMS）。除此之外还有一个自行设置的参数：阈值 TH。

算法输出

输入的一个子集，同样是一组5维数组，表示筛选后的边界框。

算法流程

将所有的框按类别划分，并剔除背景类，因为无需NMS。
对每个物体类中的边界框(B_BOX)，按照分类置信度降序排列。
在某一类中，选择置信度最高的边界框B_BOX1，将B_BOX1从输入列表中去除，并加入输出列表。
逐个计算B_BOX1与其余B_BOX2的交并比IoU，若IoU(B_BOX1,B_BOX2) > 阈值TH，则在输入去除B_BOX2，否则保留。
重复步骤3~4，直到输入列表为空，完成一个物体类的遍历。
重复2~5，直到所有物体类的NMS处理完成。
输出列表，算法结束

tips: IoU=两个框的交集/两个框的并集

4. 算法实现（pytorch）

import torch
import cv2

def nms(bboxes, scores, threshold=0.5):
    x1 = bboxes[:,0]
    y1 = bboxes[:,1]
    x2 = bboxes[:,2]
    y2 = bboxes[:,3]
    areas = (x2-x1)*(y2-y1)
    _, order = scores.sort(0, descending=True)
    picked_boxes = []
    picked_score = []
    keep = []
    while order.numel() > 0:
        if order.numel() == 1:
            i = order.item()
            keep.append(i)
            picked_boxes.append(bboxes[i])
            picked_score.append(scores[i])
            break
        else:
            i = order[0].item()
            keep.append(i)
            picked_boxes.append(bboxes[i])
            picked_score.append(scores[i])

        xx1 = x1[order[1:]].clamp(min=x1[i])
        yy1 = y1[order[1:]].clamp(min=y1[i])
        xx2 = x2[order[1:]].clamp(max=x2[i])
        yy2 = y2[order[1:]].clamp(max=y2[i])
        inter = (xx2-xx1).clamp(min=0) * (yy2-yy1).clamp(min=0)
        iou = inter / (areas[i]+areas[order[1:]]-inter)
        idx = (iou  threshold).nonzero().squeeze()
        if idx.numel() == 0:
            break
        order = order[idx+1]
    return torch.LongTensor(keep), torch.stack(picked_boxes), torch.stack(picked_score)

image_name = 'nms.jpg'

bounding_boxes = [[187, 82, 337, 317], [150, 67, 305, 282], [246, 121, 368, 304]]
confidence_score = [0.9, 0.75, 0.8]

image = cv2.imread(image_name)

org = image.copy()

font = cv2.FONT_HERSHEY_SIMPLEX
font_scale = 1
thickness = 2

threshold = 0.4

for (start_x, start_y, end_x, end_y), confidence in zip(bounding_boxes, confidence_score):
    (w, h), baseline = cv2.getTextSize(str(confidence), font, font_scale, thickness)
    cv2.rectangle(org, (start_x, start_y - (2 * baseline + 5)), (start_x + w, start_y), (0, 255, 255), -1)
    cv2.rectangle(org, (start_x, start_y), (end_x, end_y), (0, 255, 255), 2)
    cv2.putText(org, str(confidence), (start_x, start_y), font, font_scale, (0, 0, 0), thickness)

keep, picked_boxes, picked_score = nms(torch.tensor(bounding_boxes), torch.tensor(confidence_score), threshold)
picked_boxes = picked_boxes.numpy().tolist()
picked_score = picked_score.numpy().tolist()

for (start_x, start_y, end_x, end_y), confidence in zip(picked_boxes, picked_score):
    (w, h), baseline = cv2.getTextSize(str(confidence), font, font_scale, thickness)
    cv2.rectangle(image, (start_x, start_y - (2 * baseline + 5)), (start_x + w, start_y), (0, 255, 255), -1)
    cv2.rectangle(image, (start_x, start_y), (end_x, end_y), (0, 255, 255), 2)
    cv2.putText(image, str(confidence), (start_x, start_y), font, font_scale, (0, 0, 0), thickness)

cv2.imshow('Original', org)
cv2.imshow('NMS', image)
cv2.waitKey(0)

下面是样例图片

我使用tolist之后0.9就变成0.8999…，不知道为什么，有知道的欢迎评论指出；
还有我使用的IoU是0.4，可以自己设置0.5 0.6试试

Original: https://blog.csdn.net/qq_41542989/article/details/123829986
Author: 小Aer
Title: 非极大值抑制Non-Maximum Suppression（NMS）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/692491/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

R语言移除列表中的空元素（列表数据中包含NULL，移除NULL元素）、使用purrr包的compact函数删除NULL元素

### 回答1：可以使用_JavaScript _中_的trim()方法来 _移除_每个 _元素_的 _空_格。具体实现可以 _使用_querySelectorAll()方法来…

人工智能 2023年7月18日
0071
Python中unique()用法及代码示例

在处理数据中，如果希望查看列中的去重之后的不同值或者唯一值，这可以使用 Pandas unique()函数来完成。Python的Pandas库Series.unique方法会返回S…

人工智能 2023年7月5日
0057
opencv C++ onnx 模型如何得到多个输出

有时候咱的模型会输出多个值，怎么拿到呢？如果只输出一个值，我看很多博客都写了，这篇水文给个例子来看怎么拿到多个返回值下边是 onnx 模型前向传播的一个demo std::str…

人工智能 2023年7月18日
0051
Pandas怎样实现groupby分组统计

一、如何实现分组统计 groupby：先对数据分…

人工智能 2023年7月7日
0072
目标检测算法——YOLOv5/YOLOv7改进之结合ConvNeXt结构

>>>深度学习Tricks，第一时间送达<<< 论文题目：A ConvNet for the 2020s 纯卷积主干网络！可与大火的分层视觉Tr…

人工智能 2023年7月9日
00180
2022-12-15 工作记录–React-用swiper实现多行交错、同速、跑马灯效果的弹幕式轮播（坑）

React -用 swiper 实现多行交错、同速、跑马灯效果的弹幕式轮播（坑）激动的心呀呀呀！٩(๑>◡ 【 React-用 swiper实现多行交错、同速、跑马灯效果的…

人工智能 2023年7月30日
0070
R语言使用factor函数将字符串向量转化为因子向量、使用levels函数查看因子的水平

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月11日
0084
Matlab彩色图像卷积的数学原理及纯手工实现

一、引言在图像处理中，不论是提取图像边缘特征，还是尺度空间变换，亦或者目前大火的深度学习，图像卷积都是非常重要的基础工作。卷积从整体上说是卷积，从局部上说其实就是内积。卷积不论在…

人工智能 2023年6月18日
0068
深度学习基础-经典模型总结

深度学习经典模型总结卷积神经网络 * 介绍下转置卷积循环神经网络 * 介绍下RNN 介绍下LSTM 一个LSTM cell的时间复杂度是多少介绍下GRU RNN和LSTM的区…

人工智能 2023年5月28日
00107
头歌平台-人工智能技术应用-实践学习与答案2（补充实训部分）

第1关 LDA算法 import jieba import jieba.analyse as analyse import gensim from gensim import co…

人工智能 2023年6月25日
00122
Flink 流处理在中信建投证券的实践与应用

▼ 关注「 Apache Flink」，获取更多技术干货 ▼ 摘要：本篇内容整理自中信建投证券金融实时数仓项目负责人刘成龙、金融资讯数据研发工程师蔡跃在 Flink Forwar…

人工智能 2023年6月11日
00194
TensorFlow 从入门到精通（11）—— DeepDream(上)

这节课，我翘了两天，原因是最近压力比较大。大家可能对卷积云里雾里，这节课我们就可视化一下卷积层。通过噪声图像起点单层网络单通道/单层网络多通道/多层网络全通道来生成几幅图像，让大…

人工智能 2023年5月26日
0073
我的Vue之旅、04 CSS媒体查询完全指南（Media Quires）

什么是SCSS Sass: Sass Basics (sass-lang.com) SCSS 是 CSS 的预处理器，它比常规 CSS 更强大。可以嵌套选择器，更好维护、管理代码…

人工智能 2023年6月4日
0088
Stacked Hourglass学习笔记

论文链接：https://arxiv.org/pdf/1603.06937.pdf 概述这篇文章发表于2016ECCV，作者提出了一种新的人体姿态估计结构Stacked Hour…

人工智能 2023年7月14日
0096
PyTorch深度学习实践——处理多维特征的输入

处理多维特征的输入课程来源：PyTorch深度学习实践——河北工业大学《PyTorch深度学习实践》完结合集_哔哩哔哩_bilibili 这一讲介绍输入为多维数据时的分类。一…

人工智能 2023年6月4日
00115
Coordinate Attention和BiFPN

文章目录 * – + 1 坐标注意力机制(Coordinate Attention) + * 原理： * 结构： * 代码： * 优缺点： + 2 加权双向特征金字塔(…

人工智能 2023年6月25日
0057

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

非极大值抑制Non-Maximum Suppression（NMS）

; 1. 目的

2. 何时使用NMS？

3. 算法流程

4. 算法实现（pytorch）

大家都在看