Yolov5 v6.1网络结构

2023年6月17日上午12:26 • 人工智能 • 阅读 59

Yolov5 已经更新到v6.1版本了，与之前的版本有了不少区别，网络结构有了进一步优化。来整理一下。

本文主要参考 https://blog.csdn.net/qq_37541097/article/details/123594351，大佬真了不起。

借用大佬的模型图

; 删除Focus层

之前看的资料，网络的第一层都是Focus层，v6.0之后换成了一个 kernel=6,stride=2,padding=2大小的卷积层，有人认为两者在理论上是等价的，可能是觉得两者的输出大小相同。

但是我个人认为从细节的角度Focus确实比卷积或者池化要精致一些，可以减少下采样带来的信息损失。作者改回使用卷积可能是出于工程上的考量，牺牲一点点精度带来速度上的提升，毕竟大多数芯片厂商不一定提供Focus层的优化或者自定义接口。

激活函数改用SiLU

几乎所有的激活函数都使用了SiLU，等同于Swish激活函数(β = 1 \beta=1 β=1)，具有无上界有下界、平滑、非单调的特性。可以看做是介于线性函数与ReLU函数之间的平滑函数。

; SPPF

yolov5之前的版本的Neck结构采用了SPP模块。

在SPP模块中，使用k = 1 ∗ 1 , 5 ∗ 5 , 9 ∗ 9 , 13 ∗ 13 k={11, 55, 99, 1313}k =1 ∗1 ,5 ∗5 ,9 ∗9 ,1 3 ∗1 3的最大池化的方式，再将不同尺度的特征图进行Concat操作

而SPPF结构是将输入串行通过多个5×5大小的MaxPool层，简单的说，就是用2个 5*5的卷积操作代替一个 9*9的卷积操作，3个 5*5的卷积操作代替一个 13*13的卷积操作。感受野是一样的，但是计算时间快了很多。也是常规操作了。

class SPP(nn.Module):

    def __init__(self, c1, c2, k=(5, 9, 13)):
        super().__init__()
        c_ = c1 // 2
        self.cv1 = Conv(c1, c_, 1, 1)
        self.cv2 = Conv(c_ * (len(k) + 1), c2, 1, 1)
        self.m = nn.ModuleList([nn.MaxPool2d(kernel_size=x, stride=1, padding=x // 2) for x in k])

    def forward(self, x):
        x = self.cv1(x)
        with warnings.catch_warnings():
            warnings.simplefilter('ignore')
            return self.cv2(torch.cat([x] + [m(x) for m in self.m], 1))

class SPPF(nn.Module):

    def __init__(self, c1, c2, k=5):
        super().__init__()
        c_ = c1 // 2
        self.cv1 = Conv(c1, c_, 1, 1)
        self.cv2 = Conv(c_ * 4, c2, 1, 1)
        self.m = nn.MaxPool2d(kernel_size=k, stride=1, padding=k // 2)

    def forward(self, x):
        x = self.cv1(x)
        with warnings.catch_warnings():
            warnings.simplefilter('ignore')
            y1 = self.m(x)
            y2 = self.m(y1)
            return self.cv2(torch.cat([x, y1, y2, self.m(y2)], 1))

网络输出

yolov5 经过5次下采样，最大会放缩32倍，原图的长宽都要求是32的倍数。v6.0版本将图片的输入默认改为640，也就是说输出的结果是 20*20*(5+n)、 40*40*(5+n)、 80*80*(5+n)。n为分类的总数。

参考

https://blog.csdn.net/qq_37541097/article/details/123594351

Original: https://blog.csdn.net/windowsyun/article/details/123636551
Author: 钟鸣_
Title: Yolov5 v6.1网络结构

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/627545/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pandas库之DataFrame滑动窗口（rolling window）(官网介绍）

提供滑动窗口计算，可用于时间序列（时间和日期）数据 DataFrame.rolling(window, min_periods=None, center=False, win_ty…

人工智能 2023年7月7日
0083
3D视觉——2.人体姿态估计(Pose Estimation)入门——OpenPose含安装、编译、使用（单帧、实时视频）

上一话 3D视觉——1.人体姿态估计(Pose Estimation)入门——使用MediaPipe含单帧(Signel Frame)与实时视频(Real-Time Video)h…

人工智能 2023年6月24日
00118
NumPy学习笔记（四）—— argmax()函数

目录一、前言二、函数讲解 * 1、argmax（）函数 2、参数 – 1）a 2）axis（可选） 3）out（可选） 3、返回值 4、注意一、前言在数组里查找…

人工智能 2023年7月5日
0094
✨使用Python进行线性规划求解，高端操作亮瞎你的双眼（文末技术彩蛋）

各位童鞋们大家好，我是小小明，前几天我给大家分享了一个SMT求解器z3，链接地址见： https://xxmdmst.blog.csdn.net/article/details/1…

人工智能 2023年7月4日
00106
python 决策树分类泰坦尼克生存预测

决策树二分类之泰坦尼号克生存预测一、项目简介 * 1.1 项目背景 1.2 目标问题 1.3 字段描述二、训练集（train）建模 * 2.1 导入相关库 2.2 自定义函数 …

人工智能 2023年7月2日
0092
Matlab实现季节性时间序列ARIMA模型预测

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月13日
0087
Python-混合高斯分布(GMM)的应用及K-S检验

内容简介：对几种经典的单分布模型与混合高斯分布模型进行简单介绍，随后用于交通数据分析，并进行K-S检验，讨论模型拟合情况。其中，单分布模型有：正态分布、Gamma分布、Weibu…

人工智能 2023年7月15日
0074
Anaconda默认Python3.8版本创建Python3.6版本环境并安装opencv3.4.1.15，使用pycharm作为IDE

前提：本文旨在帮助新手安装opencv。所遇问题：由于3.4.2版本往后有的算法存在专利问题无法使用，到目前为止建议安装3.4.1.15版本的opencv。如今python最新…

人工智能 2023年7月20日
0066
各国GDP动态图-Pyecharts实现

各国GDP动态图-Pyecharts实现强国史诗！1960-2021年各个国家GDP变化：一同见证中国崛起！中国——可能是最具传奇色彩的国家。持久的鼎盛、百年屈辱史、或是近现代的…

人工智能 2023年7月8日
0090
自然语言处理基础技术工具篇之TextBlob

安装：pip install textblob In [2]: !pip install textblob Requirement already satisfied: textb…

人工智能 2023年5月28日
0080
经验小波变换（EWT）理论基础

项目说明在信号分解领域，经验模态分解（EMD）十分经典，它基于信号特征自动地将信号分解为一组有限数目的 IMF 分量，在处理非线性和非平稳信号方面表现尤为出色，得到了广大学者的青…

人工智能 2023年6月15日
00121
MXNe

问题：MXNet中的MXNe函数详解 1. 介绍 MXNe是MXNet深度学习框架中的一个重要函数，用于执行按元素操作。MXNet是一个基于图计算的深度学习框架，提供了高性能的数值…

人工智能 2023年12月31日
0044
Redis安装部署（Windows/Linux）

Redis安装部署（Windows/Linux）一、Windows安装 * 1、安装前准备 2、启动服务端服务 3、启动客户端连接服务器 4、部署Redis服务 5、测试服务 6…

人工智能 2023年7月29日
0057
Rust权威指南之面向对象编程特性

一. 简述面向对象编程简称OOP，是一种程序建模的方法。面向对象编程又很多相互矛盾的定义，其中一部分定义能够把Rust归类为面向对象语言，而另一部分定义则并不这样认为。本章我们将…

人工智能 2023年7月30日
0047
torch.cuda

该包增加了对 CUDA张量类型的支持，实现了与 CPU张量相同的功能，但使用 GPU进行计算。它是延迟的初始化，所以你可以随时导入它，并使用 is_available()来确定系…

人工智能 2023年7月21日
0062
[PyTorch]利用torch.nn实现前馈神经网络

文章目录前馈神经网络实验要求一、利用torch.nn实现前馈神经网络二、对比三种不同的激活函数的实验结果三、使用不同的隐藏层层数和隐藏单元个数，对比实验结果 * 3.1 …

人工智能 2023年7月22日
0066

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Yolov5 v6.1网络结构

; 删除Focus层

激活函数改用SiLU

; SPPF

网络输出

参考

大家都在看