再读HorNet论文

2023年6月25日上午2:10 • 人工智能 • 阅读 79

gnconv

vision transformer是利用多头自注意力机制动态生成权重来混合空间标记（mix spatial tokens），但是自注意输入量的 quadratic complexity极大的阻碍了vision transformer的应用。为此hornet并不向此前方法一样降低自注意力的复杂度，而是通过卷积核全连接层等简单操作实现空间相互作用。
看下gnconv的代码段：

class gnconv(nn.Module):
    def __init__(self, dim, order=5, gflayer=None, h=14, w=8, s=1.0):
        super().__init__()
        self.order = order
        self.dims = [dim // 2 ** i for i in range(order)]
        self.dims.reverse()
        self.proj_in = nn.Conv2d(dim, 2*dim, 1)

        if gflayer is None:
            self.dwconv = get_dwconv(sum(self.dims), 7, True)
        else:
            self.dwconv = gflayer(sum(self.dims), h=h, w=w)

        self.proj_out = nn.Conv2d(dim, dim, 1)

        self.pws = nn.ModuleList(
            [nn.Conv2d(self.dims[i], self.dims[i+1], 1) for i in range(order-1)]
        )

        self.scale = s
        print('[gnconv]', order, 'order with dims=', self.dims, 'scale=%.4f'%self.scale)

    def forward(self, x, mask=None, dummy=False):
        B, C, H, W = x.shape

        fused_x = self.proj_in(x)
        pwa, abc = torch.split(fused_x, (self.dims[0], sum(self.dims)), dim=1)

        dw_abc = self.dwconv(abc) * self.scale

        dw_list = torch.split(dw_abc, self.dims, dim=1)
        x = pwa * dw_list[0]

        for i in range(self.order -1):
            x = self.pws[i](x) * dw_list[i+1]

        x = self.proj_out(x)

        return x

hornet的结构在最左边，其中gnconv的作用是通过门控卷积和递归设计高效实现任意阶空间相互作用。
再读HorNet论文

我们展示了执行不同交互顺序的代表性空间建模操作。本文重点研究特征(红色)与其邻近区域(浅灰色)之间的显式空间相互作用。(a)标准卷积运算没有明确考虑空间相互作用。(b)动态卷积[26,4]和SE[24]引入动态权值来提高带有额外空间相互作用的卷积的建模能力。©[51]自注意操作通过两个连续的矩阵乘法执行二阶空间相互作用。(d) gnConv通过门控卷积和递归设计高效实现任意阶空间相互作用。
普通卷积是（a），就是普通的CNN形式，可以看到没有空间作用关联；（b）是诸如SENet这种动态调整权值方法实现空间相互作用的结构；
再读HorNet论文

（c）就是普通transformer的自注意力结构，（d）是本文提出方法。

卷积大小

不同于CNN卷积多采用3×3的小卷积，transformer采用更大的卷积如7×7的结构，这样更容易捕获长期依赖关系。
HorNet：采用7×7卷积；
global filter（GF）：GF层[43] 将频域特征与可学习的全局滤波器相乘，相当于 一个具有全局核大小和圆形填充的空间域卷积。我们使用了GF层的改进版本，其中 一半的通道使用全局过滤器处理， 另一半使用3×3深度卷积处理，并且 只在后期使用GF层来保留更多的局部细节。

高阶空间相互作用

提出的gnConv可以实现具有有界复杂度的任意阶交互。同样值得注意的是，与宽度[63]和深度[22]等深度模型中的其他缩放因子类似，单纯增加空间相互作用的阶数而不考虑模型的总体容量并不会得到很好的权衡[48]。本文在分析设计良好的模型的空间交互顺序的基础上，重点研究了一种更强的可视化建模体系结构。我们相信对高阶空间相互作用进行更全面、更正式的讨论将是未来的一个重要方向。

Original: https://blog.csdn.net/dear_queen/article/details/126418844
Author: dear_queen
Title: 再读HorNet论文

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/650121/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

一个半小时完成一个目标检测任务——基于CooVally的热轧钢带表面缺陷检测

目前，中国正在大力发展新型工业，推动工业信息化、智能化建设。在钢铁制造的工艺流程，对于生产的钢带也提出了较高的质量管控需求，因此，对钢板表面进行缺陷检测是一项重要的任务。通常，钢…

人工智能 2023年7月10日
0065
windows10+pytorch+cuda11.3+cudnn8.2.1环境搭配

本人用的联想拯救者R7000p，系统是win10 64位显卡是3050Ti laptop 本文为从零开始搭建pytorch环境的详细步骤因为文章有点久远，或许细节问题描述不清，…

人工智能 2023年7月23日
0063
ATK-ESP8266使用说明（STM32-F4）

前期准备（无路由器的情况下）：开一个WiFi热点（后期开发板和电脑都要连接到这同一个热点）（一）修改源代码的WiFiIP地址和密码（使用STA模式） //WIFI STA模式,设…

人工智能 2023年6月30日
0082
获爱分析认定，Stratifyd入选《2022营销科技厂商全景报告》

近日，国内知名数字化市场研究咨询机构爱分析发布了，并遴选出在营销科技市场中具备成熟解决方案和落地能力的代表厂商。Stratifyd凭借其在营销科技领域的领先技术实力以及扎实的商业实…

人工智能 2023年6月11日
0087
PyTorch入门使用

张量 Tensor 张量是一个统称，其中包括很多类型：0 阶张量：标量、常数，0-D Tensor1 阶张量：向量，1-D Tensor2 阶张量：矩阵，2-D Tensor3 阶…

人工智能 2023年5月26日
0067
自动驾驶系统进阶与项目实战（十）基于PointPillars的点云三维目标检测和TensorRT实战（1）

; 自动驾驶系统进阶与项目实战（十）基于PointPillars的点云三维目标检测和TensorRT实战（1）发表于CVPR2019的PointPillars是目前比较受业内认可…

人工智能 2023年7月10日
0071
Ubuntu21.10下安装TensorFlow及配置GPU支持（cuda11.1+cudnn8.1.0）

文章目录一、前言二、安装NVIDIAdriver * 1. 添加PPA源 2. 查看显卡硬件型号 3. 安装NVIDIA驱动三、安装cuda * 1. 下载相关依赖 2. 下…

人工智能 2023年5月23日
00129
一元线性回归实例和梯度下降应用及近期学习知识点总结一月16日学习笔记

目录线性回归一元线性回归损失函数梯度下降利用梯度下降求线性回归函数：几个重要的概念（关于数据处理的）几个常用的库：线性回归线性回归是利用数理统计中回归分析，来确定…

人工智能 2023年6月17日
0092
Automatically Labeled Data Generation for Large Scale Event Extraction论文笔记

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、当年现状二、数据集三、方法 * 小结总结前言例如：本周阅读了这篇论文，特此记录笔记 …

人工智能 2023年6月1日
0087
openPCdet 实现自定义点云数据集训练

openPCdet自定义数据集训练 * – openPCdet 代码框架 – 实现自定义数据集导入的流程 – 自定义数据集类的编写 openPC…

人工智能 2023年7月5日
00150
Jena基于OWL的默认推理查询

目录一些背景数据导入普通查询推理查询一些背景通过Jena的API，我们可以将RDF的.nt文件导入到对应TDB存储中，然后使用相关API进行三元组的查询，但是这时候的查…

人工智能 2023年6月10日
00103
【Spikingjelly】SNN框架教程的代码解读_3

Spikingjelly 时间驱动：神经元 * LIF神经元 – a. 单个神经元 b. 多个神经元时间驱动：编码器 * 泊松编码器 – a. 单独的时间…

人工智能 2023年7月13日
0059
数学建模——基于最小二乘法的回归分析 →预测问题(工具：matlab，线性回归和非线性回归通用)【全文9000字】

文章目录一、最小二乘法是什么？二、非线性回归是什么？三、最小二乘法和回归分析之间有什么关系？三、样例及做题过程 * 第一步：问题的分析第二步：模型的建立第三步：模…

人工智能 2023年6月16日
0087
【pytorch学习实战】第四篇：MNIST数据集的读取、显示以及全连接实现数字识别

往期相关文章列表：【pytorch学习实战】第一篇：线性回归【pytorch学习实战】第二篇：多项式回归【pytorch学习实战】第三篇：逻辑回归【pytorch学习实战】…

人工智能 2023年7月21日
00183
【每日一读】On Interpretation of Network Embedding via Taxonomy Induction

目录简介论文简介 ABSTRACT 1 INTRODUCTION 2 PROBLEM FORMULATION * 2.1 Notations 2.2 Objectives of…

人工智能 2023年6月29日
0099
图神经网络：GAT学习、理解、入坑

介绍论文地址-GRAPH ATTENTION NETWORKS-Published as a conference paper at ICLR 2018tensorflow代码版…

人工智能 2023年6月17日
0096

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

再读HorNet论文

大家都在看