Yolov7：最新最快的实时检测框架，最详细分析解释（附源代码）

2023年6月12日下午11:05 • 人工智能 • 阅读 90

关注并星标

从此不迷路

计算机视觉研究院

公众号ID｜ ComputerVisionGzq

学习群｜ 扫码在主页获取加入方式

论文地址：https://arxiv.org/pdf/2207.02696.pdf

代码地址：https://github.com/WongKinYiu/yolov7

计算机视觉研究院专栏

作者：Edison_G

YOLOv7相同体量下比YOLOv5精度更高，速度快120%(FPS)，比YOLOX快180%(FPS)，比Dual-Swin-T快1200%(FPS)，比ConvNext快550%(FPS)，比SWIN-L快500%(FPS)。

概述

前段时间才给大家分享了美团出品的Yolov6：

具体的链接如下：

链接🔗：
7月份又出来一个 Yolov7，在5 FPS到160 FPS范围内的速度和精度达到了新的高度，并在GPU V100上具有30 FPS或更高的所有已知实时目标检测器中具有最高的精度56.8%AP。 YOLOv7-E6目标检测器（56 FPS V100，55.9% AP）比基于Transform的检测器SWINL Cascade-Mask R-CNN（9.2 FPS A100，53.9% AP）的速度和准确度分别高出509%和2%，以及基于卷积的检测器ConvNeXt-XL Cascade-Mask R-CNN (8.6 FPS A100, 55.2% AP) 速度提高551%，准确率提高0.7%。

以及YOLOv7的表现优于：YOLOR、YOLOX、Scaled-YOLOv4、YOLOv5、DETR、Deformable DETR , DINO-5scale-R50, ViT-Adapter-B和许多其他目标检测器在速度和准确度上。

此外，研究者只在MS COCO数据集上从头开始训练YOLOv7，而不使用任何其他数据集或预训练的权重。

背景

最近，模型重参数化（model re-parameterization）和动态标签分配（dynamic label assignment）已成为网络训练和目标检测的重要课题。主要是在上述新概念提出之后，目标检测器的训练演变出了很多新的问题。

在今天分享中，研究者将介绍其发现的一些新问题，并设计解决这些问题的有效方法。对于模型重参数化，研究者用梯度传播路径的概念分析了适用于不同网络层的模型重参数化策略，并提出了有计划的重参数化模型。

此外，当发现使用动态标签分配技术时，具有多个输出层的模型的训练会产生新的问题。即：”如何为不同分支的输出分配动态目标？” 针对这个问题，研究者提出了一种新的标签分配方法，称为从粗到细的引导式标签分配。

新框架详细分析

扩展的高效层聚合网络

扩展的高效层聚合网络。提出的扩展ELAN（E-ELAN）完全没有改变原有架构的梯度传输路径，而是使用组卷积来增加添加特征的基数，并以shuffle和merge cardinality的方式组合不同组的特征 . 这种操作方式可以增强不同特征图学习到的特征，提高参数的使用和计算。

在大多数关于设计高效架构的文献中，主要考虑因素不超过参数的数量、计算量和计算密度。有人从内存访问成本的特点出发，分析了输入/输出通道比、架构的分支数量以及element-wise操作对网络推理速度的影响。有些人在执行模型缩放时还考虑了激活，即更多地考虑卷积层输出张量中的元素数量。

基于concatenate模型的模型缩放

模型缩放的主要目的是调整模型的一些属性，生成不同尺度的模型，以满足不同推理速度的需求。

例如EfficientNet的缩放模型考虑了宽度、深度和分辨率。对于Scale-yolov4，其缩放模型是调整阶段数。有些研究者分析了卷积和群卷积对参数量和计算量的影响，并据此设计了相应的模型缩放方法。

基于串联模型的模型缩放。从(a)到(b)，我们观察到当在基于串联的模型上执行深度缩放时，计算块的输出宽度也会增加。这种现象会导致后续传输层的输入宽度增加。因此，研究者提出(c)，即在对基于concatenation的模型进行模型缩放时，只需要对计算块中的深度进行缩放，其余传输层进行相应的宽度缩放。

Planned re-parameterized convolution

尽管RepConv在VGG基础上取得了优异的性能，但当将它直接应用于ResNet、DenseNet和其他架构时，它的精度将显著降低。作者使用梯度流传播路径来分析重参数化的卷积应该如何与不同的网络相结合。作者还相应地设计了计划中的重参数化的卷积。

RepConv实际上结合了3×3卷积，1×1卷积，和在一个卷积层中的id连接。通过分析RepConv与不同架构的组合及其性能，作者发现RepConv中的id连接破坏了ResNet中的残差和DenseNet中的连接，为不同的特征图提供了更多的梯度多样性。

提出的重参数化模型。在提出的计划重参数化模型中，我们发现一个带有残差或串联连接的层，其RepConv不应该有恒等连接。在这些情况下，它可以被不包含身份连接的 RepConvN 替换。

Coarse for auxiliary and fine for lead loss

Coarse for auxiliary and fine for lead head label assigner

与正常模型（a）相比，（b）中的模式具有辅助中心。与通常的独立标签分配器 (c) 不同，研究者提出 (d) 引导头引导标签分配器和 (e) 粗到细引导头引导标签分配器。所提出的标签分配器通过前导头预测和GT实况进行优化，以同时获得训练前导头和辅助头的标签。详细的从粗到细的实现方法和约束设计细节将在附录中详述。

实验及可视化

如上表所述：

与YOLOv4相比，YOLOv7的参数减少了75%，计算量减少了36%，AP提高了1.5%
与最先进的YOLOR-CSP相比，YOLOv7的参数少了43% ，计算量少了15%，AP高了0.4%
在小模型的性能中，与YOLOv4-tiny相比，YOLOv7-Tiny减少了39%的参数量和49%的计算量，但保持相同的AP
在云GPU模型上，YOLOv7模型仍然具有更高的AP，同时减少了19%的参数量和33%的计算量

将所提出的方法与通用GPU上或边缘GPU上最先进的的目标检测器进行了比较，结果如下表所示：

© THE END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入！

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域，主要致力于人脸检测、人脸识别，多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架，我们这次改革不同点就是，我们要着重”研究”。之后我们会针对相应领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！

VX：2311123606

往期推荐

🔗

*

*

*

*

*
*
*
*
*
*

Original: https://blog.csdn.net/gzq0723/article/details/125700987
Author: 计算机视觉研究院
Title: Yolov7：最新最快的实时检测框架，最详细分析解释（附源代码）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/605639/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【OpenCV 例程200篇】36. 直角坐标与极坐标转换（cv2.polarToCart）

『youcans 的 OpenCV 例程200篇 – 总目录』【youcans 的 OpenCV 例程200篇】36. 直角坐标与极坐标的转换函数 cv2.cart…

人工智能 2023年7月20日
0058
Jupyter Notebook中将ipynb文件转为py文件

Python：3.7.1Jupyter Notebook：6.3.0 Jupyter Notebook中将ipynb文件转为py文件前言一、将.ipynb文件转为.py文件 *…

人工智能 2023年7月8日
0084
stm32图像识别分类技术，陈老师简单为你阐述一下

STM32图像分类前言可能有的同学会有疑问，STM32 能做图像分类这么复杂的事情吗？嵌入式系统中视觉技术的迅速普及，推动了用于汽车安全、机器视觉和运动分析的超高速成像攻克方…

人工智能 2023年7月1日
0065
【目标检测】边界框回归与variances参数的作用

本文主要讨论在目标检测中，对于边界框Bbox的回归，以及variances参数的作用。 1、边界框回归针对目标检测问题，由于存在Anchor（固定的参考框），网络模型需要做到&#…

人工智能 2023年7月11日
0058
边缘计算：客户端 + 人工智能

有人说人工智能会是继互联网之后的下一次工业革命，不可否认，大到汽车、小到手表，AI技术已经广泛应用在我们周围，随便一个APP都试图跟AI发生点关系以证明自己的与时俱进。 AI的普及…

人工智能 2023年5月26日
0077
【机器学习】聚类算法详细介绍（理论+图解）

🌠 『精品学习专栏导航帖』 🐳最适合入门的100个深度学习实战项目 🐳 🐙【PyTorch深度学习项目实战100例目录】项目详解 + 数据集 + 完整源码 🐙 🐶【机器学习入门项目…

人工智能 2023年6月2日
0076
Tensor Flow PB文件量化到TFLITE

一般在Slim上进行完迁移训练之后我们想将它量化到TFLITE需要先将CKPT量化到PB，在将PB量化到TFLITE，这个原因是因为格式的原因，CKPT是使用多个文件存储模型不同的…

人工智能 2023年5月25日
0084
R语言计算回归模型的SST、SSR以及SSE指标实战

R语言计算回归模型的SST、SSR以及SSE指标实战目录 R语言计算回归模型的SST、SSR以及SSE指标实战 #仿真数据 Original: https://blog.csdn…

人工智能 2023年7月17日
0061
LeetCode第7题：整数反转

生命无罪，健康&#…

人工智能 2023年6月27日
0059
10.绘制统计图形——箱线图

文章目录 1.应用场景——多组定量数据的分布比较 2.绘制原理 3.延伸——箱体、箱须、离群值的含义和计算方法 4.水平方向的箱线图 5.不绘制离群值的水平放置的箱线图箱线图是由…

人工智能 2023年7月15日
0087
注意力机制（含pytorch代码及各函数详解）

目录 * – 注意力机制 – + * 非参注意力汇聚概述（不需要学习参数） * 参数化注意力机制概述 * 正式系统学习 * – 1.平均汇聚（池…

人工智能 2023年7月21日
0058
如何在Android上使用OpenCV进行摄像头标定

如何在Android上使用OpenCV进行摄像头标定，我们这里使用官方一个例程，其实并不难，只是网上的资料少了而已。相机标定是计算机视觉工作的前提，为了确定相机矩阵和畸变参数。标…

人工智能 2023年5月28日
00142
【MySQL数据库】最全安装过程及配置详解

🧛‍♂️iecne个人主页：：iecne的学习日志;💡每天关注iecne的作品，一起进步💪一起学习，必看iecne🐳希望大家多多支持🥰一起进步呀！文章目录一.官网安装 * 1…

人工智能 2023年7月30日
0076
Python按字段名分组、排名、排序，根据条件筛选数据

Python按字段名分组、排名、排序，根据条件筛选数据下图是我的原始数据：主要包括下图中的几个字段(日期是月度数据)：店铺信息日期交易金额计算按日期分类下的交易金额的排名 …

人工智能 2023年7月6日
0078
windows下NEO4J安装教程

安装neo4j之前需要安装JDK，本文提供的是JDK1.8.0和neo4j 社区版3.5.8网盘链接：JDK和neo4j下载，提取码：idzh 1.JDK的安装及配置下载JDK安…

人工智能 2023年6月1日
00116
新的优化器 Adan

论文题目：Adan: Adaptive Nesterov Momentum Algorithm forFaster Optimizing Deep Models作者单位：Sea A…

人工智能 2023年7月28日
0071

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Yolov7：最新最快的实时检测框架，最详细分析解释（附源代码）

扩展的高效层聚合网络

基于concatenate模型的模型缩放

Planned re-parameterized convolution

大家都在看