SE(Squeeze and Excitation)模块的理解以及代码实现

2023年7月26日上午11:04 • 人工智能 • 阅读 64

文章目录

1. 简介

SE Block并非一个完整的网络，而且一个子结构， 可以嵌在其他分类或检测模型中。SE Block的核心思想是通过 网络根据loss去学习特征权重，使得有效的feature map权重更大，无效或效果小的feature map权重更小的方式去训练模型已达到更好的结果。

当然，SE block嵌在原有的一些分类网络中不可避免地增加了一些参数和计算量，但是在效果面前还是可以接受的。

2. 运算讲解

SE block示意图：

Step1： 卷积操作(即图中的F t r F_{tr}F t r 操作)
严格来讲这一步是转换操作，并不是SE block的一部分，就是一个标准的卷积操作。输入输出定义如下：
F t r ： X → U , X ∈ R W ′ ∗ H ′ ∗ C ′ , U ∈ R W ∗ H ∗ W F_{tr}： X \rightarrow U, X \in R^{W’ * H’ * C’}, U \in R^{W * H * W}F t r ：X →U ,X ∈R W ′∗H ′∗C ′,U ∈R W ∗H ∗W
计算公式就是常规的卷积操作，计算公式如下：
u c = v c ∗ X = ∑ s = 1 C ′ v c s ∗ x s u_c = v_c * X = \sum ^{C’} _{s=1} v_c^{s} * x^s u c =v c ∗X =s =1 ∑C ′v c s ∗x s
其中，v c v_c v c 表示第c个卷积核， x s x^s x s 表示当前卷积核覆盖下的第s个输入， C ′ C’C ′ 表示卷积核个数。

该操作得到了上图中左起第2个矩阵，其维度 = [H ,W, C]

Step2: F s q F_{sq}F s q 操作（即Squeenze操作）
该操作就是一个： global average pooling操作，公式如下：
z c = F s q ( u c ) = 1 W ∗ H ∑ i = 1 W ∑ j = 1 H u c ( i , j ) z_c = F_{sq}(u_c) = {1 \over W*H} \sum ^{W}{i=1} \sum ^H{j=1} u_c(i, j)z c =F s q (u c )=W ∗H 1 i =1 ∑W j =1 ∑H u c (i ,j )

这里使用代码进行一定的解释：
代码如下：

x = torch.ones(size=(1, 2, 2, 3))
x[0][0][0][0] = 7
print("x = ", x)

avg_pool = torch.nn.AdaptiveAvgPool2d(1)    # &#x5168;&#x5C40;&#x5E73;&#x5747;&#x6C60;&#x5316;
x_pool = avg_pool(x)
print("x_pool.shape = ", x_pool.shape)
print("x_pool = ", x_pool)

输出结果：

计算的是每个通道的平均值，输出的shape=[1, 2, 1, 1]

这一步的结果相当于表明该层C个通道的数值分布情况，或者叫全局信息。

Step3: F e x F_{ex}F e x 操作（即Excitation操作）
计算公式如下：
s = s i g m o i d ( W 2 ∗ R e l u ( W 1 z ) ) s = sigmoid(W_2 * Relu(W_1 z))s =s i g m o i d (W 2 ∗R e l u (W 1 z ))
其中的z z z表示上一步的z z z, W 1 , W 2 W_1, W_2 W 1 ,W 2 表示的是线性层。这里计算出来的s s s 就是该模块的核心，用来表示各个channel的权重，而且这个权重是通过前面这些全连接层和非线性层学习得到的，因此可以end-to-end训练。这两个全连接层的作用就是融合各通道的feature map信息，因为前面的squeeze都是在某个channel的feature map里面操作。

这里结合代码容易理解（即Pytorch实现SE模块）：

class SELayer_2d(nn.Module):
    def __init__(self, channel, reduction=16):
        super(SELayer_2d, self).__init__()
        self.avg_pool = torch.nn.AdaptiveAvgPool2d(1)
        self.linear1 = nn.Sequential(
            nn.Linear(channel, channel // reduction, bias=False),
            nn.ReLU(inplace=True)
        )
        self.linear2 = nn.Sequential(
            nn.Linear(channel // reduction, channel, bias=False),
            nn.Sigmoid()
        )

    def forward(self, X_input):
        b, c, _, _ = X_input.size()     # shape = [32, 64, 2000, 80]

        y = self.avg_pool(X_input)      # shape = [32, 64, 1, 1]
        y = y.view(b, c)                # shape = [32,64]

        # &#x7B2C;1&#x4E2A;&#x7EBF;&#x6027;&#x5C42;&#xFF08;&#x542B;&#x6FC0;&#x6D3B;&#x51FD;&#x6570;&#xFF09;&#xFF0C;&#x5373;&#x516C;&#x5F0F;&#x4E2D;&#x7684;W1&#xFF0C;&#x5176;&#x7EF4;&#x5EA6;&#x662F;[channel, channer/16], &#x5176;&#x4E2D;16&#x662F;&#x9ED8;&#x8BA4;&#x7684;
        y = self.linear1(y)             # shape = [32, 64] * [64, 4] = [32, 4]

        # &#x7B2C;2&#x4E2A;&#x7EBF;&#x6027;&#x5C42;&#xFF08;&#x542B;&#x6FC0;&#x6D3B;&#x51FD;&#x6570;&#xFF09;&#xFF0C;&#x5373;&#x516C;&#x5F0F;&#x4E2D;&#x7684;W2&#xFF0C;&#x5176;&#x7EF4;&#x5EA6;&#x662F;[channel/16, channer], &#x5176;&#x4E2D;16&#x662F;&#x9ED8;&#x8BA4;&#x7684;
        y = self.linear2(y)             # shape = [32, 4] * [4, 64] = [32, 64]
        y = y.view(b, c, 1, 1)          # shape = [32, 64, 1, 1]&#xFF0C; &#x8FD9;&#x4E2A;&#x5C31;&#x8868;&#x793A;&#x4E0A;&#x9762;&#x516C;&#x5F0F;&#x7684;s, &#x5373;&#x6BCF;&#x4E2A;&#x901A;&#x9053;&#x7684;&#x6743;&#x91CD;

        return X_input*y.expand_as(X_input)

测试代码：

    data = torch.ones((32, 64, 2000, 80))
    se_2d = SELayer_2d(64)
    data_out = se_2d.forward(data)
    print("data_out = ", data_out.shape)

Step4: F s c a l e F_{scale}F sc a l e 操作
计算公式如下：
x ~ = F s c a l e ( u c , s c ) = s c ⋅ u c \widetilde {x} = F_{scale}(u_c, s_c) = s_c ·u_c x =F sc a l e (u c ,s c )=s c ⋅u c

其中，u c u_c u c 表示u u u中的一个通道，s c s_c s c 表示通道的权重。因此，相当于把每个通道的值乘以其权重。

代码即上述代码中的最后一行：

y.expand_as(X_input)&#x8868;&#x793A;&#x5C06;y&#x6269;&#x5F20;&#x5230;&#x548C;X_input&#x4E00;&#x6837;&#x7684;&#x7EF4;&#x5EA6;
X_input*y.expand_as(X_input)        # &#x6BCF;&#x4E2A;&#x901A;&#x9053;&#x7684;&#x503C;&#xFF0C;&#x4E58;&#x4EE5;&#x5BF9;&#x5E94;&#x7684;&#x6743;&#x91CD;

附录：
论文：Squeeze-and-Excitation Networks
论文链接：https://arxiv.org/abs/1709.01507
代码地址：https://github.com/hujie-frank/SENet
PyTorch代码地址：https://github.com/miraclewkf/SENet-PyTorch

引用：
有参考添加链接描述，在此文章的理解上，增加了一些代码注释。

Original: https://blog.csdn.net/qq_41915623/article/details/125997507
Author: 陈壮实的搬砖生活
Title: SE(Squeeze and Excitation)模块的理解以及代码实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/716784/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

跨模态检索

本文是我阅读跨模态检索综述后结合自己的学习总结的文章，阅读的综述如下：【1】刘颖，郭莹莹，房杰，范九伦，郝羽，刘继明．深度学习跨模态图文检索研究综述[J/OL]．计算机科学与探索…

人工智能 2023年7月27日
0069
红外图像和可见光图像异源图像配准问题研究

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、配准的基本原理 * 1.1 常用的配准方法 1.2 配准流程 1.3 图像预处理 &#8211…

人工智能 2023年7月27日
0073
利用deepstream python将analytics产生的统计数据发送到kafka

利用deepstream python将analytics产生的统计数据发送到kafka 概述运行环境如何运行 * 构建docker镜像并运行运行deepstream pyt…

人工智能 2023年7月9日
00109
知识图谱之多轮智能问答

简介本文主要讲述具体项目实现细节，关于原理部分没有过多介绍，小伙伴可以自行查询学习。一.环境搭建 1.1开发环境pycharm 语言python3.6 JDK15.01 neo…

人工智能 2023年6月1日
0082
Python交通流仿真【含源码】

虽然交通并不总是畅通无阻，但汽车无缝穿越交叉路口，在交通信号灯处转弯和停车看起来相当壮观。这种沉思让我思考交通流对人类文明的重要性。在此之后，内心的书呆子特质让我忍不住思考一种模…

人工智能 2023年6月15日
0080
最通俗易懂的LSTM讲解，一个例子理解通透！！

大家好啊，我是董董灿。刚开始做程序开发时，提交代码前需要让大佬review，大佬们看完，总会在评论区打出一串” LGTM“。作为小白的我，天真的以为大佬觉…

人工智能 2023年6月24日
0076
【论文笔记】CycleGAN（基于PyTorch框架）

CycleGAN（基于PyTorch框架） 0.论文简介 * 0.1本文主要的工作 0.2引言 0.3方法 1.代码结构 * 1.1根目录中的文件 – 1.1.1 tr…

人工智能 2023年6月26日
0077
EfficientDet训练自己的数据集

https://github.com/toandaominh1997/EfficientDet.Pytorch https://github.com/toandaominh1997…

人工智能 2023年7月10日
0061
开源虚拟形象驱动测试(npm,Tensorflow.js)

1.安装nodejs 下面链接里下载exe安装下node Download | Node.js Node.js® is a JavaScript runtime built on …

人工智能 2023年5月24日
00115
【云原生】k8s声明式资源管理

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0063
差分相关检测技术

差分相关检测技术 1 差分相关检测原理 * 1.1 简介 1.2 原理 2 差分相关检测性能 * 2.1 性能 2.2 扩展 1 差分相关检测原理 1.1 简介根据VDES初步建…

人工智能 2023年7月9日
0061
《数据挖掘》学堂在线【第一章：概述】习题答案参考与解析

《数据挖掘》系列文章目录第一章概述第二章数据第三章数据预处理第四章数据仓库和OLAP第五章回归分析第六章频繁模式第七章分类第八章聚类第九章离群点检测本章目录 …

人工智能 2023年7月16日
0087
Andrej Karpathy | 详解神经网络和反向传播（基于 micrograd）

只要你懂 Python，大概记得高中学过的求导知识，看完这个视频你还不理解反向传播和神经网络核心要点的话，那我就吃鞋:D Andrej Karpathy，前特斯拉 AI 高级总监、…

人工智能 2023年6月4日
00102
路径规划-Hybrid A*算法

一、算法简介： Hybrid A算法仍然是一种图搜索算法。在A算法中通常把实际物体当作一个点，不考虑物体的运动方向和物理结构的实际运动。Hybrid A是2010年由斯坦福大学基于…

人工智能 2023年6月2日
0080
小度智能音箱维修点_进击的小钢炮！体验小度智能音箱大金刚

【引言】市场上有很多智能音箱，与传统的蓝牙音箱相比，智能音箱搭载了先进的语音识别技术，因此在操作的便利性上具有独特的优势。并不是所有能移动嘴巴的东西都需要做！所以，如果你只是要在…

人工智能 2023年5月27日
00114
mmdetection2.24.1修改backbone（使用mmcls和timm已有模型）

mmdetection版本：2.24.1 pytorch版本：1.11.0 官方文档Tutorial 11: How to xxx — MMDetection 2.24.1 doc…

人工智能 2023年7月21日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

SE(Squeeze and Excitation)模块的理解以及代码实现

文章目录

1. 简介

2. 运算讲解

大家都在看