简单粗暴提升yolov5小目标检测能力

2023年7月26日上午9:19 • 人工智能 • 阅读 90

论文地址：https://arxiv.org/abs/2208.03641
代码地址：GitHub – LabSAINT/SPD-Conv: Code for ECML PKDD 2022 paper. No More Strided Convolutions or Pooling: A Novel CNN Architecture for Low-Resolution Images and Small Objects.

作者提出一种SPD组件，提升了yolov5各个模型在小目标上的检测能力，先看一下结论：

该组件作者给出了数学上的解释：

其实解释起来很简单，结合下图：

和yolov5最开始做的focus是类似的，对于输入的特征图（长宽为S），从左到右以及从上到下每scale个像素采样一次，假设scale=2，采样方式就和上图一样，经过这样采样的输出长宽就是S/2，最后将采样后的输出进行concatenate，通道数就是scale的平方，即4。

具体的应用，首先对比下网络架构的配置文件

左侧是yolov5原始模型的网络架构，右图则是增加SPD结构的yolov5网络架构，其中红框部分就是两网络的区别之处。

代码的实现也比较简单：

class space_to_depth(nn.Module):
    # Changing the dimension of the Tensor
    def __init__(self, dimension=1):
        super().__init__()
        self.d = dimension

    def forward(self, x):
         return torch.cat([x[..., ::2, ::2], x[..., 1::2, ::2], x[..., ::2, 1::2], x[..., 1::2, 1::2]], 1)
        size_tensor = x.size()
        return torch.cat([x[...,0:size_tensor[2]//2,0:size_tensor[3]//2],
                         x[...,0:size_tensor[2]//2,size_tensor[3]//2:],
                         x[...,size_tensor[2]//2:,0:size_tensor[3]//2],
                         x[...,size_tensor[2]//2:,size_tensor[3]//2:]  ],1)

在coco val2017上的效果：

其中红色箭头就是两者的区别。

在原文中作者还将该结构应用在分类模型上，分类性能上也有一定的提升，感兴趣的可以看看原文。

Original: https://blog.csdn.net/athrunsunny/article/details/126585191
Author: athrunsunny
Title: 简单粗暴提升yolov5小目标检测能力

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/716649/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python中的时序分析工具包推荐（2）

导读在前期推文中介绍了时序分析的三个工具包，分别侧重于时序特征工程、基于sklearn的时序建模和更为高级的时序建模工具。今天，本篇再来介绍4个时序分析好用的工具包：Prophe…

人工智能 2023年7月16日
00109
GlobeLand30影像下载、去除黑边、镶嵌、裁剪、重分类

1 GlobeLand30影像数据分幅命名规则：南北纬缩写（1位）+6度带号（2位）+””+起始纬度（2位）+””+产品年代（4位…

人工智能 2023年7月3日
00127
小目标检测常用解决方法

小目标检测常用解决方法 1 定义通用的定义来自 COCO 数据集，定义小于 32×32 pix 的为小目标。 2 小目标检测的难点可利用特征少现有数据集中小目标占比…

人工智能 2023年6月16日
00112
如何像使用pytorch一样使用tensorflow

深度学习的快速崛起，很快在各个AI应用领域（计算机视觉，语音识别，自然语言处理等）取得了最先进的性能。用于训练神经网络模型的框架，tensorflow和pytorch之争也愈演愈烈…

人工智能 2023年7月14日
0087
Python实现九九乘法表

九九乘法表有四种展现形式 1.左下三角形：方法1：for…for循环实现 for i in range(1, 10): for j in range(1, i + 1…

人工智能 2023年7月5日
00120
知识图谱自动构建技术

先附上部分参考链接：其它的我暂时没找到，有看到的小伙伴可以留言，感谢~~ 这块内容比较零散，不做系统介绍。技术细节介绍想要整理一下相关技术方案设计的技术将训练集划分成多个具…

人工智能 2023年6月1日
0082
R语言可视化包ggplot2绘制平滑曲线、回归线实战：geom_smooth() 函数

R语言可视化包ggplot2绘制平滑曲线、回归线实战：geom_smooth() 函数目录 R语言可视化包ggplot2绘制平滑曲线、回归线实战：geom_smooth() 函数…

人工智能 2023年7月18日
0086
Python实现照片卡通化，一拳打破次元壁 | 机器学习

目录前言项目结构核心代码总结前言接着我上一篇开源机器学习的使用：如何将照片变成卡通图，animegan2-pytorch机器学习项目使用 | 机器学习_阿良的博客-CS…

人工智能 2023年7月5日
0085
Attention注意力机制——ECANet以及加入到1DCNN网络方法

原文：https://arxiv.org/abs/1910.03151代码：https://github.com/BangguWu/ECANet论文题目：ECA-Net: Effi…

人工智能 2023年7月12日
0088
SpringBoot+Vue实现excel导入带格式化的时间参数(moment格式化明天日期并设置el-date-picker默认值)

场景若依管理系统前后端分离版基于ElementUI和SpringBoot怎样实现Excel导入和导出：若依管理系统前后端分离版基于ElementUI和SpringBoot怎样实…

人工智能 2023年6月29日
0080
聚类dbi指数_Clustering metrics 聚类评价指标

Clustering metrics See the Clustering performance evaluation section of the user guide for…

人工智能 2023年6月2日
0097
colmap的使用简介

colmap的三维重建使用简介，首先colmap的安装传送门在我另一篇中有记录。本篇记录一下使用方法。 1.数据集获取首先是数据集问题，可以下载自己想试着重建的数据集保存。通过 …

人工智能 2023年5月26日
00145
[附源码]java毕业设计大学毕业生离校管理系统

项目运行环境配置： Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX（Webstorm也行）+ Eclispe（IntelliJ IDEA,Eclis…

人工智能 2023年6月27日
00111
YOLO系列论文精读

YOLO系列论文精读 YOLOV1 * 1 ）实现 2）详细解读总结 YOLOV2/9000 * 1）Better： 2）Faster： 3）Stronger：总结 YOL…

人工智能 2023年7月9日
00106
粒子群算法（PSO）——总体概述

粒子群算法（Particle swarm optimization ，PSO） PSO 是1995年由 Kennedy 和 Eberhart提出的一种算法。PSO和GA的相似之处在…

人工智能 2023年6月15日
00120
Pr 入门教程如何为多个剪辑设置音频电平？

欢迎观看 Premiere Pro 教程，小编带大家学习 Pr 的基本编辑技巧，了解如何为多个剪辑设置音频电平。有两种方法可以同时更改多个剪辑的音量。这两个选项都工作得很好：音频…

人工智能 2023年5月25日
00179

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

简单粗暴提升yolov5小目标检测能力

大家都在看