YOLOv5简析

2023年5月26日下午3:12 • 人工智能 • 阅读 80

先说些题外话，YOLOv5没有论文，其作者是Mosaic Augmentation 的创造者，YOLO V5 在性能上稍弱于YOLO V4，但是在灵活性与速度上远强于YOLO V4，在模型的快速部署上具有极强优势。相对于YOLOv4，分别从以下三个方面简析YOLOv5的改进：

输入端：Data Augmentation、自适应锚框计算、自适应图片缩放
Backbone：Focus结构，CSP结构
Neck：FPN+PAN结构

1. 输入端

1.1 Data Augmentation主要采用的是Mosaic数据增强
其做法就是对图片使用随机缩放、随机裁剪、随机排布的方式进行拼接。优点是丰富了检测物体的背景和小目标，并且在计算Batch Normalization的时候一次会计算四张图片的数据，使得mini-batch大小不需要很大，一个GPU就可以达到比较好的效果。
1.2 自适应锚框计算
在YOLOv3和YOLOv4中，都需要提前通过K-means聚类的方法计算出anchor，此anchor是固定的。但是在YOLOv5中，虽然也提前设置了anchor，但是在训练时可以自适应的计算不同训练集中的最佳anchor，从而更新anchor值。此功能也可以手动关闭，在train.py中更改，设置为False即可。

1.3 自适应图片缩放
在常用的目标检测算法中，不同的图片长宽都不相同，因此常用的方式是将原始图片统一缩放到一个标准尺寸，再送入检测网络中。比如Yolo算法中常用416×416，608×608等尺寸，比如对下面800*600的图像进行变换。
YOLOv5简析

但Yolov5代码中对此进行了改进，也是Yolov5推理速度能够很快的一个不错的trick。作者认为,在项目实际使用时，很多图片的长宽比不同。因此缩放填充后，两端的黑边大小都不同，而如果填充的比较多，则存在信息冗余，影响推理速度。因此在Yolov5代码中datasets.py的letterbox函数中进行了修改，对原始图像自适应的添加最少的黑边。

2. Backbone
2.1 Focus结构

2.2 CSP结构
Yolov4网络结构中，借鉴了CSPNet的设计思路，在主干网络中设计了CSP结构。

Yolov5与Yolov4不同点在于， Yolov4中只有主干网络使用了CSP结构，而 Yolov5中设计了两种CSP结构，以Yolov5s网络为例，以CSP1_X结构应用于Backbone主干网络，另一种CSP2_X结构则应用于Neck中。

3. Neck
Yolov5现在的Neck和Yolov4中一样，都采用FPN+PAN的结构，但在Yolov5刚出来时，只使用了FPN结构，后面才增加了PAN结构，此外网络中其他部分也进行了调整。
YOLOv5简析

但如上面CSPNet中讲到， Yolov5和Yolov4的不同点在于，Yolov4的Neck中，采用的都是普通的卷积操作。而Yolov5的Neck结构中，采用借鉴CSPNet设计的CSP2结构，加强网络特征融合的能力。
4. prediction
4.1 Bounding box 损失函数
YOLOv5中Bounding box的损失函数提供了IOU、GIOU、DIOU、CIOU，目前效果最好的是CIOU，如果有兴趣的可以试试去年新出的alpha-IOU，这是在CIOU的基础上进行改进的。
4.2 NMS
YOLOv5提供了多种NMS，例如weight-nms，diou-nms，soft-nms等，这些在一定程度上都可以解决遮挡问题，但是可能会带来一些推理时延。YOLOX也是使用了NMS，一开始YOLOX的作者使用的是end2end方式（即无nms），最后发现会掉点。
5. Yolov5四种网络结构的不同点
Yolov5代码中的四种网络，和之前的Yolov3，Yolov4中的cfg文件不同，都是以yaml的形式来呈现。
而且四个文件的内容基本上都是一样的，只有最上方的depth_multiple和width_multiple两个参数不同。

Original: https://blog.csdn.net/weixin_43850171/article/details/123053641
Author: 折磨王
Title: YOLOv5简析

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/520146/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python-OpenCV对图像的遍历操作示例代码

Python-OpenCV对图像像素的遍历操作示例如果您想了解OpenCV-C++是如何遍历图像像图的，那么可以参看下面这个页面：https://www.hhai.cc/thre…

人工智能 2023年7月18日
0045
【论文解读】Dual Contrastive Learning：Text Classification via Label-Aware Data Augmentation

🍥关键词：对比学习、有监督学习、文本多分类、数据增强🍥发表期刊：arXiv 2022🍥原始论文：[2201.08702] Dual Contrastive Learning🍥代码链…

人工智能 2023年5月28日
0091
最新深度学习环境搭建：win10+Anaconda+PyCharm+python3.7+tensorflow-gpu1.15+keras2.3.1+CUDA10.0+CUDNN7.6.5

一、硬软件信息硬件软件Intel（R） HD Graphics 520，NVIDIA GeForce 920MXwin10，PyCharm，Anaconda，Python3.7….

人工智能 2023年5月24日
0054
智慧工厂数字孪生建设方案

数字化转型是我国经济社会未来发展的必由之路，数字孪生技术作为推动实现企业数字化转型、促进数字经济发展的重要抓手，并在产品设计制造、生产监管、工艺优化、仿真验证起到重要作用。通过多…

人工智能 2023年6月25日
0050
亮相智源大会，字节跳动自研同传系统的技术实现

背景 6月1日至6月3日，由北京智源人工智能研究院主办的2021北京智源大会在北京中关村国家自主创新示范区会议中心成功召开，来自近80个国家数万名人工智能领域专业人士参会。本次大…

人工智能 2023年5月25日
0060
The following packages are causing the inconsistency

在Ubuntu下安装PyTorch遇到了下面的错误: The following packages are causing the inconsistency 下面是一长串的包名,…

人工智能 2023年6月4日
0080
【微信小程序入门到精通】— AppID和个性配置你学会了么？

目录前言一、AppID 的获取二、初始化配置 * 2.1 新建项目并初始化 2.2 代码初始化 – 2.2.1 app.json 2.2.2 project.co…

人工智能 2023年5月31日
00109
Mixup for Node and Graph Classification阅读

一篇来自WWW21的论文，看完觉得颇为有趣，特地记录一下： mixup是一种CV中常用的数据处理手段，可以从现存的有标签样本中生成新的样本，其思想也非常简单，假设有两个样本( x …

人工智能 2023年7月3日
0070
推荐两款桌面OCR识别神器~

前言今天分享的是两款OCR识别软件 PandaOCR：OCR文字识别翻译、游戏机翻懒人视频字幕提取：字幕提取、语音识别转字幕一般OCR识别工具都用的是大厂识别引擎，如百度、搜狗…

人工智能 2023年5月25日
0078
[医学图像分割综述] Medical Image Segmentation Using Deep Learning: A Survey

使用深度学习的医学图像分割:一项调查论文地址本综述有两个独创之处，首先，与传统的调查方法直接将医学图像分割的文献划分为多个组，并对每个组详细介绍文献的方法相比，我们将目前流行的…

人工智能 2023年6月17日
0061
信息化知识中的重点：商业智能（BI）详解

今天小编整理的主要内容是：商业智能（BI）什么是商业智能商业智能（Business Intelligence, BI）通常被理解为将组织中现有的数据转化为知识，帮组组织做出明智…

人工智能 2023年7月16日
0062
完整卸载java

https://blog.csdn.net/hhhhh11123/article/details/120174276 Original: https://www.cnblogs.c…

人工智能 2023年6月4日
0070
文档级关系抽取介绍

0、数据集介绍文档级关系抽取的数据集有DocRED、SCIREX、CDR、GDR。 GDA是生物医学领域的一个大规模数据集，它包含29192篇文档以供训练，其任务是预测基因和疾病…

人工智能 2023年6月1日
00257
联邦学习代码解读，超详细

参考文献：[1]Brendan McMahan, H., Moore, E., Ramage, D., Hampson, S., and Agüera y Arcas, B., &…

人工智能 2023年7月20日
0049
pandas.fillna（）函数

DataFrame.fillna函数参数说明 DataFrame.fillna(value=None, method=None, axis=None, inplace=False,…

人工智能 2023年7月15日
0064
OpenCV图像处理—-图像的二值化

图像二值化（ Image Binarizatio…

人工智能 2023年5月26日
0078

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

YOLOv5简析

1. 输入端

大家都在看