目标检测YOLO系列总结

2023年7月9日上午10:59 • 人工智能 • 阅读 99

目标检测

目标检测
一、YOLO系列
*
YOLOv1:
YOLOV2
–
+
YOLOV3
–
+
- 正负样本的匹配
YOLOV4
–
+
IOU总结

一、YOLO系列

YOLOv1:

将图片划分为7*7网格，每个网格预测2个bbox(no_anchor) ，损失包含三部分：bounding box损失、confidence损失和classes损失。

对于一个预测20个类别的网络，每个网格预测2个bounding box，每个bounding box预测包括位置（x,y,w,h)和一个置信度confidence，加上20个类别的分数。网络最后输出7×7、深度为30的特征矩阵。

; YOLOV2

YOLOv2 在YOLOv1的基础上做了许多改进：

*Darknet-19

Backbone使用Darknet-19，包含19个卷积层，6个池化和一个Softmax。

*; Batch Normalization

Batch Normalization有助于解决反向传播过程中的梯度消失和梯度爆炸问题，降低对一些超参数（比如学习率、网络参数的大小范围、激活函数的选择）的敏感性，并且每个batch分别进行归一化的时候，起到了一定的正则化效果（YOLOv2不再使用dropout），从而能够获得更好的收敛速度和收敛效果

*Anchor

在YOLOv1中时直接预测边界框的中心坐标、宽度和高度的方式定位效果比较差，所以在YOLOv2中作者采用anchor进行目标框的预测，采用anchor也可以使网络更容易的去学习和收敛。

*Dimension Clusters

使用K-means算法聚类得到先验框。

*Direct location prediction

直接是使用anchor进行预测时发现，在训练模型的时候训练不稳定，通过观察发现大部分不稳定因素来自中心坐标的预测部分导致，所以采用如下anchor预测方式。

; YOLOV3

YOLOv3在YOLOv2的基础上改进了Backbone.采用Darknet53作为Backbone.

使用步长为2 的卷积层代替池化层
正负样本的匹配

针对每一个bounding box 都会分配一个bounding box prior，即针对每一个ground truth 都会分配一个正样本，一张图像中有几个ground truth就有几个正样本，分配原则其实也很简单，就是将与ground truth重合程度最大的bounding box prior作为正样本，如果与ground truth重合程度不是最大的但是又超过了某个阈值的bounding box prior，就直接丢弃，将最后剩下的样本作为负样本。

YOLOV4

Bag of Freebies：指的是不增加模型复杂度，也不增加推理的计算量的用来提高模型的准确度训练的方法技巧。
Bag-of-Specials：指的是增加少许模型复杂度或计算量，但可以显著提高模型准确度的训练技巧。
BoF指的是

 1&#xFF09;&#x6570;&#x636E;&#x589E;&#x5F3A;&#xFF1A;&#x56FE;&#x50CF;&#x51E0;&#x4F55;&#x53D8;&#x6362;&#xFF08;&#x968F;&#x673A;&#x7F29;&#x653E;&#xFF0C;&#x88C1;&#x526A;&#xFF0C;&#x65CB;&#x8F6C;&#xFF09;&#xFF0C;Cutmix&#xFF0C;Mosaic&#x7B49;

 2&#xFF09;&#x7F51;&#x7EDC;&#x6B63;&#x5219;&#x5316;&#xFF1A;Dropout,Dropblock&#x7B49;

 3&#xFF09;&#x635F;&#x5931;&#x51FD;&#x6570;&#x7684;&#x8BBE;&#x8BA1;&#xFF1A;&#x8FB9;&#x754C;&#x6846;&#x56DE;&#x5F52;&#x7684;&#x635F;&#x5931;&#x51FD;&#x6570;&#x7684;&#x6539;&#x8FDB; CIOU

BoS指的是

 1&#xFF09;&#x589E;&#x5927;&#x6A21;&#x578B;&#x611F;&#x53D7;&#x91CE;&#xFF1A;SPP&#x3001;ASPP&#x7B49;

 2&#xFF09;&#x5F15;&#x5165;&#x6CE8;&#x610F;&#x529B;&#x673A;&#x5236;&#xFF1A;SE&#x3001;SAM

 3&#xFF09;&#x7279;&#x5F81;&#x96C6;&#x6210;&#xFF1A;PAN&#xFF0C;BiFPN

 4&#xFF09;&#x6FC0;&#x6D3B;&#x51FD;&#x6570;&#x6539;&#x8FDB;&#xFF1A;Swish&#x3001;Mish

 5&#xFF09;&#x540E;&#x5904;&#x7406;&#x65B9;&#x6CD5;&#x6539;&#x8FDB;&#xFF1A;soft NMS&#x3001;DIoU NMS

Backbone

采用的主干网络为 CSPDarknet53，CSPDarknet53是在Yolov3主干网络Darknet53的基础上，借鉴2019年CSPNet的经验，产生的Backbone结构，其中包含了5个CSP（跨阶段部分连接）模块。
FPN+PAN

FPN层自顶向下，将高层的特征信息通过上采样的方式进行传递融合，传达强语义特征，而PAN则自底向上传达强定位特征，提高特征提取的能力。两者从不同的主干层对不同的检测层进行参数聚合，加速了不同尺度特征的融合，进一步提高特征提取的能力。
SPP模块

采用1×1，5×5，9×9，13×13的最大池化的方式，进行多尺度融合。

IOU总结

IOU -> GIOU->DIOU->CIOU
IOU_Loss：主要考虑检测框和目标框重叠面积。
GIOU_Loss：在IOU的基础上，解决边界框不重合时的问题。
DIOU_Loss：在IOU和GIOU的基础上，考虑边界框中心点距离的信息。
CIOU_Loss：在DIOU的基础上，考虑边界框宽高比的尺度信息。
YOLOv4中采用了CIOU_Loss的回归方式，使得预测框回归的速度和精度更高一些。

Original: https://blog.csdn.net/weixin_43978588/article/details/127154912
Author: yq02
Title: 目标检测YOLO系列总结

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/680544/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

斯坦福大学吴恩达教授最新来信：AI, GPU和芯片的未来

全球人工智能教育及研究领导者吴恩达教授最新来信：AI, GPU和芯片的未来亲爱的朋友们：近十年来，人工智能的兴起得益于GPU及其他加速器芯片速度的提高和成本的降低。这个趋势会持续…

人工智能 2023年6月25日
00114
国开现代汉语专题,形考答案形考任务

形考任务二一、判断正误（（30 道，每小题2 分）） 1.颁行语言文字法的主要目的是推广普通话。 A.错误 2.充当普通话音节韵尾的音素一共有四个，即i、u、n、ng。 B.正…

人工智能 2023年6月28日
00166
[论文解读]Fast-Tracker 2.0：通过主动视觉和人类位置回归提高空中跟踪的自主性

标题：Fast-Tracker2.0: Improving Autonomy of Aerial Tracking with Active Vision and Human Loc…

人工智能 2023年6月17日
00163
深度学习入门-误差反向传播法

深度学习入门-误差反向传播法反向传播法在神经网络中是用于计算权重参数针对于损失函数的梯度的方法，该方法比数值微分法求梯度更加的高校。反向传播法的思想如上图所示，未加粗…

人工智能 2023年7月13日
0073
SAR目标检测开源数据集汇总，及时更新，欢迎补充

MSTAR（1996）网上已经有很多介绍了。 MSTAR数据库作为SAR图像自动目标识别（SAR ATR）研究的一个通用库，被很多学者广泛采用。该实验数据采用美国国防高等研究计划…

人工智能 2023年6月17日
0098
R作图配色—颜色提取及色彩搭配

看SCI文章，发现一个规律，越是高分的文章作图越是”花里胡哨”，出各种新奇的图，色彩上也很鲜艳，而大多数人就喜欢看那种花里胡哨的。其实很多时候，我们里高分文…

人工智能 2023年7月16日
0083
使用MATLAB进行图像处理——显示图像的灰度直方图并进行对比度增强

目的： 1、读出rice.png文件，观察图像数据，并尝试修改图像数据矩阵的值，再将图像显示出来，观察图像颜色变换； 2、显示rice.png图像的灰度直方图，对其做对比度增强…

人工智能 2023年6月17日
00110
批处理生成带有时间戳或递增编号的临时文件名

批处理文件可以自动化编译程序、以及输出文件。但是在某些场景下，可能需要保留历史编译文件记录，那么就需要每次输出产生一个唯一的文件名。生成带有时间戳的文件名新建文本文档，输入…

人工智能 2023年6月26日
0090
vivada平台创建项目

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月29日
0083
vue-cli的安装

1、先安装node.jsnode.js的安装_西瓜君的代码的博客-CSDN博客node.js的安装https://blog.csdn.net/m0_56195330/article…

人工智能 2023年6月27日
0099
np.expand_dims 小白详解

np.expand_dims 目录 np.expand_dims * 前言第一层理解：这个axis会插在形状的哪里（知道形状会怎么改变）第二层理解：这个数组的内在会怎么改变（知…

人工智能 2023年6月15日
0094
深度学习番外——Yolov5服务器环境搭建

文章目录 * – 1 服务器搭建yolov5环境 – + 1.1 创建环境 + 1.2 跟随官方指引 – 2 下载预训练权重 – 3…

人工智能 2023年7月9日
00105
[模型可视化]更好的理解Logistic回归模型输出结果

本文主要内容：生成Logistic 回归模型结果绘制Logistic回归曲线绘制带有数据分布的Logistic回归曲线当你拟合逻辑回归模型时，有很多方法可以显示结果。最为传…

人工智能 2023年6月17日
0080
学1个月爬虫就月赚6000？别被骗了，老师傅告诉你爬虫的真实情况！

这是我前几天看到的一个真实事件，也是我写这篇文章的缘由：前几天有粉丝跟我反馈说，某机构的人跟他说学爬虫1个月就能接单，让这小伙子去报名那个机构的爬虫课程，学完之后1个月就能把60…

人工智能 2023年7月4日
00115
聚类(一)——K-Means算法

聚类是一种无监督学习。与分类不同的是，分类的数据集都是有标签的已经指明了该样本是哪一类，而对于聚类其数据集样本是没有标签的，需要我们根据特征对这些数据进行聚类。K-Means算法是…

人工智能 2023年5月31日
00119
LESSON 10.1&10.2&10.3 SSE与二分类交叉熵损失函数&二分类交叉熵损失函数的pytorch实现&多分类交叉熵损失函数

在之前的课程中，我们已经完成了从0建立深层神经网络，并完成正向传播的全过程。本节课开始，我们将以分类深层神经网络为例，为大家展示神经网络的学习和训练过程。在介绍PyTorch的基本…

人工智能 2023年7月1日
00100

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

目标检测YOLO系列总结

YOLOv1:

; YOLOV2

; YOLOV3

YOLOV4

大家都在看