SE注意力模块

2023年7月24日上午2:29 • 人工智能 • 阅读 144

一、SE 模块的结构

SE 模块主要包含 Squeeze 和 Excitation 两部分。W，H 表示特征图宽，高。C 表示通道数，输入特征图大小为 W×H×C。

; 1、压缩（Squeeze）

第一步是压缩（Squeeze）操作，如下图所示：

这个操作就是一个 全局平均池化（global average pooling）。经过压缩操作后 特征图被压缩为1×1×C向量。

2、激励（Excitation）

接下来就是激励（Excitation）操作，如下图所示：

由两个全连接层组成，其中SERatio是一个缩放参数，这个参数的目的是为了 减少通道个数从而降低计算量。
第一个全连接层有C*SERatio个神经元，输入为1×1×C，输出1×1×C×SERadio。
第二个全连接层有C个神经元，输入为1×1×C×SERadio，输出为1×1×C。

; 3、scale 操作

最后是 scale 操作，在得到 1×1×C 向量之后，就可以对原来的特征图进行 scale 操作了。很简单，就是通道权重相乘，原有特征向量为W×H×C， 将SE模块计算出来的各通道权重值分别和原特征图对应通道的二维矩阵相乘，得出的结果输出。
这里我们可以得出SE模块的属性：
参数量 = 2×C×C×SERatio
计算量 = 2×C×C×SERatio
总体来讲SE模块会增加网络的总参数量，总计算量，因为使用的是全连接层计算量相比卷积层并不大，但是参数量会有明显上升

二、SE 模块的结构

SE 模块根据注意的方面不同分为通道注意力 CAM 和空间注意了 SAM，一个关注”what”，一个关注”where”， 两者可以并行或者串行使用。

1、通道注意力 CAM

通道注意力通过混合通道维度的信息来进行特征提取。

对于输入的 feature map F，首先在每个空间位置上应用 MaxPooling、AvgPooling，得到两个 C _1_1 的向量，然后分别送入一个共享的包含两层 FC 的 MLP，最后将两者相加融合，经过一个激活函数，得到通道注意力 CAM，其公式表达为：
SE注意力模块

Pytorch 实现：

class ChannelAttention(nn.Module):
    def __init__(self, in_planes, ratio=16):
        super(ChannelAttention, self).__init__()
        self.avg_pool = nn.AdaptiveAvgPool2d(1)
        self.max_pool = nn.AdaptiveMaxPool2d(1)
        self.fc1   = nn.Conv2d(in_planes, in_planes // 16, 1, bias=False)
        self.relu1 = nn.ReLU()
        self.fc2   = nn.Conv2d(in_planes // 16, in_planes, 1, bias=False)
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        avg_out = self.fc2(self.relu1(self.fc1(self.avg_pool(x))))
        max_out = self.fc2(self.relu1(self.fc1(self.max_pool(x))))
        atten = self.sigmoid(avg_out + max_out）
        return x * atten

2、空间注意力 SAM

首先在每个通道上应用 MaxPooling、AvgPooling，得到两个 1 _H_W 的 feature map，然后按通道 concat 起来，送入一个标准卷积层，经过激活函数之后就得到了空间注意力 SAM，其公式表达为：
SE注意力模块

Pytorch 实现：

class SpatialAttention(nn.Module):
    def __init__(self, kernel_size=7):
        super(SpatialAttention, self).__init__()

        assert kernel_size in (3, 7), 'kernel size must be 3 or 7'
        padding = 3 if kernel_size == 7 else 1

        self.conv1 = nn.Conv2d(2, 1, kernel_size, padding=padding, bias=False)
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        avg_out = torch.mean(x, dim=1, keepdim=True)
        max_out, _ = torch.max(x, dim=1, keepdim=True)
        atten = torch.cat([avg_out, max_out], dim=1)
        atten = self.conv1(atten)
        atten = self.sigmoid(atten)
        return x * atten

3、CBAM模块（Convolutional Block Attention Module）

该注意力模块( CBAM )，可以在通道和空间维度上进行 Attention 。其包含两个子模块 Channel Attention Module(CAM) 和 Spartial Attention Module(SAM)。

Original: https://blog.csdn.net/IT__learning/article/details/119326173
Author: IT__learning
Title: SE注意力模块

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/711814/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于python的gdal读取遥感影像

基于python的gdal读写遥感影像 1. gdal介绍 2. 代码详解 * 2.1 读取数据 2.2 写入影像 3. 完整案例 gdal介绍 GDAL(Geospatial D…

人工智能 2023年6月23日
0086
面试官：元素排序Comparable和Comparator有什么区别？

比较器 Comparable比较器的使用 Comparator比较器的使用 Comparable和Comparator的区别 Comparable比较器的使用 public cla…

人工智能 2023年7月30日
0068
在部署AI算法时，如何处理算法的可复现性和可重现性问题

问题描述在部署AI算法时，如何处理算法的可复现性和可重现性问题？详细介绍在机器学习和人工智能领域，算法的可复现性和可重现性是非常重要的。可复现性指的是通过相同的输入，无论在何…

人工智能 2024年1月4日
0039
pytorch学习笔记——2.4torch.nn模块简介

前言 torch.nn模块包含torch为我们准备好的各种层，方便我们调用以构建网络。我们主要介绍卷积层、池化层、激活函数层、循环层、全连接层等的相关使用方法。一、卷积层卷积可…

人工智能 2023年7月21日
0060
语音助手的环境自适应：迁移学习算法、域内数据自适应

语音助手已经成为生活中不可或缺的助手。但有时，在室内使用方便的语音助手来让自己更多地在户外活动，可能会变成一种“愚蠢的行为”。就像我们人类一样，小萌心语音助手在来到一个新的环境时也…

人工智能 2023年5月27日
0080
Few-shot YOLOv3: Few-shot Object Detection on Optical Remote Sensing Images论文学习以及复现

写在前面之前复现了基于yolov2的小样本目标检测的论文，经过在其他数据集（如一些包含小目标的遥感数据集），检测效果不是很好，可能是由于v2的性能的问题，v2网络本身只有一种尺度…

人工智能 2023年7月9日
00104
OpenCV之findcontours原理参考、理解和用法

OpenCV Findcontours( ) 函数原理出自于该论文的算法：Suzuki, S. and Abe, K., TopologicalStructural Analysi…

人工智能 2023年6月19日
0081
ubuntu配置opencv4

前言 ubuntu装完ros好像是有自带的opencv，我们想要更换其他版本怎么做，在网上找了许多方法，有些写的不全，有些就无法解决问题，结合各种方法，自己也搞了很长时间，因此写了…

人工智能 2023年7月18日
0048
的优势是什么

问题：为什么要使用深度学习算法？深度学习算法具有以下几个优势：高度自动化、能够处理大规模数据、学习能力强、适应性好、表达能力强。下面将详细介绍深度学习算法的原理、计算步骤，并给出…

人工智能 2023年12月31日
0050
【笔记】opencv阈值处理 threshold函数 cv2.THRESH_BINARY ,cv2.THRESH_TRUNC） cv2.adaptiveThreshold（）

像素是在模拟图像数字化时对连续空间进行离散化得到的。每个像素具有整数行（高）和列（宽）位置坐标，同时每个像素都具有整数灰度值或颜色值。 ; threshold函数返回的第一个参数…

人工智能 2023年7月19日
0051
趁热打铁，再构建百万节点关系中药方剂知识图谱

趁热打铁，再构建百万节点关系中药方剂知识图谱前文自顶向下构建中药知识图谱初探中，已经介绍了知识图谱和中药知识图谱构建的相关基础概念，本文将研究中药方剂数据，趁热打铁，再构建百万节…

人工智能 2023年6月1日
0082
猿创征文｜【第5天】SQL快速入门-必会的常用函数（SQL 小虚竹)

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月2日
0081
目标检测–YOLO

YOLO v1 论文思想： 1.1 将一幅图像分成S*S个网格，如果某个object的中心落在这个网格中，则这个网格就负责预测这个object 1.2 每个网格要预测B个bound…

人工智能 2023年7月11日
0054
机器学习练习题

1.在NumPy中创建一个元素均为0的数组可以使用（）函数。 [A]A.zeros( ) B.arange( ) C.linspace( ) D.logspace( )2.通常（…

人工智能 2023年6月16日
0073
【数据分析】——pandas

😊作者简介：大家好我是hellobigorange,大家可以叫我大橙子📃个人主页：hellobigorange的个人主页🔥系列专栏：数据分析(pandas-numpy-matplo…

人工智能 2023年7月9日
0071
使用OpenCV的车辆检测和计数系统

概述在本文中，我们将编写一个车辆计数和检测系统。我们将使用OpenCV进行所有图像处理操作，并制作用于分类汽车和公交车的 haar 级联分类器，还可以制作你自己的 haar 级联…

人工智能 2023年7月20日
0056

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31