目标检测方法总结

2023年7月10日上午1:44 • 人工智能 • 阅读 110

目标检测

*
– 1发展历程
– 2 RCNN系列
–
+
* 2.1 RCNN 开山之作
* 2.2 Fast rcnn
* 2.3 Faster Rcnn
– 3 Yolo系列
– 4 Centernet
– 5DETR

1发展历程

如下图所示，来自李沐-论文精度link

1 先有RCNN系列，对输入的图片提取出很多候选框，然后对候选框进行分类以及微调。
2 yolo系列，不需要提取候选框，而是将原图分成一个grid，每个grid进行一个预测，可以理解为多任务的拟合问题，端到端。
3 Centernet，创新性工作！anchor-free的，基于热力图检测工作！
4 DETR, 讲transformer引入

检测任务的难点，在于样本如何制作，loss如何计算，知道了这两点，算法大体框架就懂了。
如果让我们从头开始做，我要怎么做检测的任务呢？
需要考虑类别，考虑检测框个数。
不同的图片检测框数量不一致？如何固定网络输出的尺度？
我一个图片可能有多个物体，怎么办？
基于anchor的思想本质上是遍历，生成数量非常庞大的框，然后根据自身置信度以及iou删除一些框，计算这些框的结果。
yolo的思想，是把图片分割成小网格，每个网格生成一定数量的检测框，实现了固定输出尺度。
centernet：类别个数是可以固定的，每个类别的数量让热力图的中心自适应。
detr：类别个数固定，匈牙利匹配！

; 2 RCNN系列

2.1 RCNN 开山之作

说到rcnn，常见的是下面一张图

测试过程：
1 对输入图片使用SS方法（一种聚类方法）提取出2000个候选框
2 对候选框进行wrap，尺寸变为一致
3 输入到cnn中提出特征，每个框对应一个特征向量
4 将特征向量输入svm（20个），得到一个分类，根据分类的分数，剔除一部分。
5 分别用20个回归器对上述20个类别中剩余的建议框进行回归操作，最终得到每个类别的修正后的得分最高的bounding box。
训练过程：
1 训练过程在于标签如何制作！将SS选出的候选框与gt进行iou计算，大于指定阈值的是正样本，小于指定阈值的是负样本。
2 分类的loss，使用交叉熵。
3 回归的loss如何计算？移动不会超过一个框的位置
a n c h o r : [ x , y , w , h ] g t : [ x ∗ , y ∗ , w ∗ , h ∗ ] p r e d i c t e d : x 1 = x + d x ∗ w 移动量不超过一个 w （ 1 ） y 1 = y + d y ∗ h 移动量不超过一个 h （ 2 ） w 1 = w ∗ e x p ( d w ) 指数扩大， h 类似。（ 3 , 4 ） [ d x , d y , d w , d h ] 是需要学习的参数根据（ 1 ， 2 ， 3 ， 4 ）计算出 [ d x , d y , d w , d h ] 的目标值，使用 s m o o t h − L 1 l o s s ！ anchor:[x,y,w,h]\ gt:[x^,y^,w^,h^]\ predicted:\ x_1=x+d_xw 移动量不超过一个w（1）\ y_1=y+d_yh 移动量不超过一个h （2）\ w_1=w*exp(d_w) 指数扩大，h类似。（3,4）\ [d_x,d_y,d_w,d_h]是需要学习的参数\ 根据（1，2，3，4）计算出[d_x,d_y,d_w,d_h]的目标值，使用smooth-L1 loss！a n c h o r :[x ,y ,w ,h ]g t :[x ∗,y ∗,w ∗,h ∗]p r e d i c t e d :x 1 =x +d x ∗w 移动量不超过一个w （1 ）y 1 =y +d y ∗h 移动量不超过一个h （2 ）w 1 =w ∗e x p (d w )指数扩大，h 类似。（3 ,4 ）[d x ,d y ,d w ,d h ]是需要学习的参数根据（1 ，2 ，3 ，4 ）计算出[d x ,d y ,d w ,d h ]的目标值，使用s m o o t h −L 1 l o s s ！

; 2.2 Fast rcnn

1 根据SS方法选出一定数量的候选框，根据iou设定阈值！多目标选择iou最大的作为类别。这里直接是多分类，不是二分类。
2 将整个图片输入CNN进行特征提取。
3 使用投影的方法，将提取出的候选框映射到特征图上，抠出特征图，resize
4 传入fc层，进行分类以为框位置的微调。

2.3 Faster Rcnn

从此开始不再使用SS方法提取候选框。
0 预先设定anchor的scale以及ratio
1 将图片输入CNN，得到特征图。
2 特征图每一个像素对应k个anchor！以该像素为中心，长宽根据scale以及ratio设置。即每个特征图上的像素点根据其自身位置以及长和宽对应一些特征图。标签根据iou计算标签。需要判断该位置对应的框的类别以及偏移量。
3 proposal 根据anchor的位置找到特征图的对应位置，为了尺寸一致进行pooling，输入到后面的网络中得到结果

; 3 Yolo系列

1 认为设置一些对应关系，讲图片分成7 _7的网格，每个网格size不确定。
2 每个网格负责自己的任务。

YOLOv2:取消了fc层使用全卷积，多分辨率输入
YOLOv3:FPN
YOLOv4:FPN+PAN
YOLOv5:GIOULOSS

4 Centernet

先降采样，然后上采样，输出三个值。

1 输入 N _3_M _N,输出入N_C _M/R_N/R （每个像素代表一个分类，一共C类），以及 N _2_M/R _N/R（每个像素代表偏置值）， N_2 _M/R_N/R（每个像素代表长宽值）。
2 Loss计算：热力图标签制作。知乎

二维的误差！为了平衡loss

2 偏置误差

3 长宽误差

; 5DETR

Original: https://blog.csdn.net/qq_42153494/article/details/123538376
Author: deeeeeeplearning
Title: 目标检测方法总结

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/681859/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【计算机视觉40例】案例22：目标检测（YOLO方法、SSD方法）

【导读】本文是专栏《计算机视觉40 例简介》的第22 个案例《目标检测（YOLO 方法、SSD 方法）》。该专栏简要介绍李立宗主编《计算机视觉40 例——从入门到深度学习（Ope…

人工智能 2023年7月9日
0057
如何使用Keras构建一个全连接神经网络

介绍本文将详细解决如何使用Keras构建一个全连接神经网络的问题。全连接神经网络是一种最基本的神经网络模型，其每个神经元与上一层的所有神经元相连。我们将首先介绍全连接神经网络的算…

人工智能 2024年1月4日
0036
半监督学习是否适用于大规模数据集

问题：半监督学习是否适用于大规模数据集？详细介绍：半监督学习是一种机器学习方法，结合有标签数据和无标签数据来进行模型训练。在许多实际应用中，有限的标记数据可能难以获得，但可以获…

人工智能 2024年1月1日
0036
(二)元学习算法MAML简介及代码分析

欢迎访问个人网络日志🌹🌹知行空间🌹🌹 元学习算法MAML简介 * – 1.元学习(meta learning) – 2.模型无关元学习 – + …

人工智能 2023年5月26日
0074
实体消歧综述整理

阅读文献：[1] 段宗涛,李菲,陈柘.实体消歧综述[J].控制与决策,2021,36(05):1025-1039.DOI:10.13195/j.kzyjc.2020.0388. 实…

人工智能 2023年5月30日
0082
PointPillars论文解析和OpenPCDet代码解析

PointPillars是一个来自工业界的模型，整体思想基于图片的处理框架，直接将点云从俯视图的视角划分为一个个的Pillar（立方柱体），从而构成了类似图片的数据，然后在使用2…

人工智能 2023年6月17日
0086
论文导读 | 利用GPU的基于图的近似近邻搜索加速研究

引言近邻搜索（Nearest Neighbor Search, NNS）是指在一个数据集中寻找与用户查询距离最小的K个数据点。在大多数情况下，数据点被表示为稠密或稀疏向量的形式。…

人工智能 2023年7月16日
0068
AI遮天传 DL-深度学习在计算机视觉中的应用

本文只做一些在计算机视觉中应用的简单介绍，童叟无欺。一、图像分类 a. 通用图像分类将不同图片按照内容进行分类 b. 特定图像分类特定识别人脸、某种动物、汽车等 1.1 人脸…

人工智能 2023年5月26日
0072
CVPR2021|| Coordinate Attention注意力机制

Paper：https://arxiv.org/pdf/2103.02907.pdfGitHub：https://github.com/Andrew-Qibin/CoordAtte…

人工智能 2023年6月15日
0085
使用 Docker部署 Tensorflow Serving 模型服务

准备工作拉取 tensorflow servering 的 docker 镜像： sudo docker pull tensorflow/serving，一般是已经有的进入到一…

人工智能 2023年5月24日
0087
一文解决VS Code安装、C++环境配置、OpenCV配置

前言本文包括 VScode安装、 C++环境配置以及 OpenCV配置全过程。VS Studio配置OpenCV比较简单，可以直接使用OpenCV官网已有的用VS Studio编…

人工智能 2023年7月19日
00113
Jetson Xavier安装使用多个摄像头

效果展示： 单目全向视觉感…

人工智能 2023年7月19日
0062
训练好的YoloV5模型进行目标检测

接上一篇博客，本篇记录第一次训练的检测效果训练得到的最优模型在…\runs\train\exp6\weights\best.pt位置激活yolov5py38环境，进入…

人工智能 2023年7月9日
0060
ubuntu 20.04+ORB_SLAM3 安装并行全记录（无坑版）（一）

目录 1. 系统配置 2. 准备工作 * 2.1 安装git，g++，python 2.2 安装cmake 3. 安装库 * 3.1 安装EIGEN库 3.2 安装opencv 3…

人工智能 2023年6月18日
0092
java计算机毕业设计ssm基于C程序课程的题库在线平台

项目介绍 本题库在线平台是针对目前学校的实际需求,从实际工作出发,对过去的题库在线平台系统存…

人工智能 2023年6月28日
0067
Keras中用验证集进行模型验证的方法_(validation_data,validation_split,model.evaluate)

目标在用训练数据训练完网络模型后，我们想要知道模型对其他数据的真实准确度，而训练数据则存在信息泄露的问题，所以我们现在需要一个独立的数据验证集来对模型泛化能力进行验证。 Kera…

人工智能 2023年6月15日
0097

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31