目标检测中先验框 anchor的作用

2023年7月10日上午1:22 • 人工智能 • 阅读 68

背景

在目标检测中，不论是一阶段还是二阶段检测器，似乎都绕不开一个东西就是anchor。所谓anchor就是预设一组或几组不同尺度不同长宽比的固定参考框，每个参考框负责检测与其交并比大于阈值（预设值0.5或0.7）的目标。在anchor之前，一般是采用 金字塔多尺度+遍历滑窗的机制，耗费时间效果也差强人意。如2016ECCV提出的yolo，或者说是yolov1就采用的是这种全局回归的方法，难以解决目标的类别不确定、数量不确定、位置不确定、尺度不确定等问题。在yolov2中采用了anchor机制，网络的召回率得到了很好的提升，后续的yolo系列都延续了这一做法。

什么是先验anchor？

YOLO2已经开始采用K-means聚类得到先验框的尺寸，YOLO3延续了这种方法，为每种下采样尺度设定3种先验框，总共聚类出9种尺寸的先验框。在COCO数据集这9个先验框是：
(10×13)，(16×30)，(33×23)，(30×61)，(62×45)，(59×119)，(116×90)，(156×198)，(373×326)。
在最小的13 * 13特征图上（有最大的感受野）应用较大的先验框(116×90)，(156×198)，(373×326)，适合检测较大的对象。
中等的26 * 26特征图上（中等感受野）应用中等的先验框(30×61)，(62×45)，(59×119)，适合检测中等大小的对象。
较大的52 * 52特征图上（较小的感受野）应用较小的先验框(10×13)，(16×30)，(33×23)，适合检测较小的对象。
下图为先验框的直观展示，下图中蓝色框为聚类得到的先验框。黄色框式ground truth，红框是对象中心点所在的网格。实际中特征图中的每个点都会对应3个先验框。

; 先验anchor如何起作用？

先验框anchor将目标检测转换为这个固定参考框中有没有认识的目标，目标框偏离参考框多远的问题。我们先要给出这些先验框的类别信息，才能让模型学着去预测每个先验框是否对应着一个目标物体。这些先验框中有很多是和图片中我们要检测的目标完全没有交集或者有很小的交集，做法是，设定一个IoU阈值，例如iou=0.5，与图片中目标的iou

我们的模型要预测anchor与目标框的偏移，并且这个偏移会进行某种形式的归一化，这个过程我们称为边界框的编码。
这里我们使用的是与SSD完全一致的编码方法，具体公示表达如下：

模型预测并输出的是这个编码后的偏移量(gcx,gcy,gw,gh)，最终只要再依照公式反向进行解码，就可以得到预测的目标框的信息。

在测试时可能会一个目标多个框的现象，这时采用NMS非极大值抑制。

Original: https://blog.csdn.net/weixin_42762234/article/details/122116018
Author: Sweet Creature
Title: 目标检测中先验框 anchor的作用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/681827/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

图像处理入门一

图形处理入门一 * – + 1.图像处理的基本知识 + 2.OpenCV入门详解本文学习书籍为华为云的《从零到壹•Python图像处理及识别》，写博客的目的是为了记录…

人工智能 2023年6月17日
0069
遍历Dataframe的每个元素及loc与iloc函数与iterrows与iteritems函数用法

首先，这四个函数都是遍历df的方法。loc与iloc不使用循环，使用方法均为 df.loc[index,:]【】前后用逗号隔开，前边表示行的索引，后边表示列的索引，loc可使用列名…

人工智能 2023年7月6日
0088
RestoreDet：低分辨率图像中目标检测

关注并星标从此不迷路计算机视觉研究院公众号ID｜ ComputerVisionGzq 学习群｜扫码在主页获取加入方式论文地址： https://arxiv.org/pdf…

人工智能 2023年7月10日
0092
牛客刷题总结——Python入门06：元组、字典

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月4日
0074
SIR模型和Python实现

一、SIR模型介绍 SIR模型时传染病中最基础最核心的模型，研究的是某个封闭地区的疫情传播规律。 SIR模型的动力学关系如下图：健康人数S的变化与健康人数S和正感人数I的乘积（…

人工智能 2023年7月14日
0097
C++ 和 Qt 的opencv库和eigen库的导入

首先说说库的下载下载链接为opencv官网Eigen官网下载自己想要的版本即可或者百度网盘自取链接：https://pan.baidu.com/s/1RUCydoRQXU1…

人工智能 2023年7月19日
0056
VUE 学习

VUE 是什么一套用于构建用户界面的渐进式 JavaScript 框架构建用户界面：数据变成界面渐进式：Vue 可以自底向上逐层的应用简单应用：只需一个轻量小巧的核心库复…

人工智能 2023年6月28日
0077
神经网络——Python实现BP神经网络算法（理论+例子+程序）

采用BP算法的多层感知器是至今为止应用最广泛的神经网络，在多层感知器的应用中，以图3-15所示的单隐层网络的应用最为普遍。一般习惯将单隐层前馈网称为三层感知器，所谓三层包括了输入层…

人工智能 2023年7月3日
0078
js运动雏形及其相关问题和运动框架

js运动雏形 Document #box{ width: 100px; height: 100px; background: #f00; position: absolute; l…

人工智能 2023年6月27日
00117
[机器学习入门] tensor 是什么以及 torch.reshape()的使用

在 torch.reshape() 函数是对数据类型张量tensor 进行形状shape 的改变，因此我们首先得了解机器学习里最基本的数据结构 tensor（即张量）。 ten…

人工智能 2023年6月15日
0083
LeetCode第7题：整数反转

生命无罪，健康&#…

人工智能 2023年6月27日
0052
Python实训day08am【网络爬虫selenium、图像处理入门】

1、网络爬虫-selenium（歌曲与歌词） 2、图像处理 2.1、安装库 2.2、图片处理 2.3、马赛克 2.4、副本-缩略图-粘贴-创建新图 2.5、代码汇总 Python …

人工智能 2023年6月22日
0070
思考：2021年还可以入门深度学习吗？

前言过年时闲来无事，瞎翻自己的博客，偶然看到之前写的一篇文章：一篇文章解决机器学习，深度学习入门疑惑这篇文章原先发布于2018年中旬，那会正是深度学习、神经网络无脑火热的时…

人工智能 2023年6月4日
00107
WeNet语音识别实战

WeNet简介 WeNet是出门问问语音团队联合西工大语音实验室开源的一款面向工业落地应用的语音识别工具包，该工具用一套简洁的方案提供了语音识别从训练到部署的一条龙服务，其主要特点…

人工智能 2023年5月25日
0079
yolov5训练自己的水印数据进行水印目标检测

yolov5训练自己的数据进行水印检测文章目录 * – yolov5训练自己的数据进行水印检测* 前言* 一、下载yolov5源码* 二、修改自己的yolov5的配置…

人工智能 2023年7月12日
0073
数字图像处理：实验三图像增强

实验三图像增强图像增强是数字图像处理过程中常采用的一种方法。为了改善视觉效果或便于人和机器对图像的理解和分析，根据图像的特点或存在的问题采取的改善方法或加强特征的措施称为图像增…

人工智能 2023年6月17日
0090

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

目标检测中先验框 anchor的作用

背景

什么是先验anchor？

; 先验anchor如何起作用？

大家都在看