SE注意力机制

2023年7月30日上午7:39 • 人工智能 • 阅读 61

SENet-通道注意力笔记

*
– 简介
–
+
*
– 意义
– 目的：
– 主要操作
– 算法流程图
–
+ 过程
+
*
–
+ 第一步、
+ 第二步、
+ 第三步、
+ 第四步、
– SE模块的结构图
– 实现代码
– 最后

简介

SENet是2017年ImageNet比赛的冠军，2018年CVPR引用量第一。论文链接:SENet

意义

较早的将attention引入到CNN中，模块化化设计。

目的：

SE模块的目的是想通过一个权重矩阵，从通道域的角度赋予图像不同位置不同的权重，得到更重要的特征信息。

主要操作

SE模块的主要操作：挤压（Squeeze)、激励（Excitation）

算法流程图

通过一系列操作得到一个1 ∗ 1 ∗ C 11C 1 ∗1 ∗C的权重矩阵，对原特征进行重构（不同颜色表示不同的数值，用来衡量通道的重要性）

; 过程

第一步、

Transformation ( F t r ) (F{_t}{_r})(F t r ):给定一个input特征图X X X，让其经过F t r F{_t}{_r}F t r 操作生成特征图U U U。
注意：在常用的卷积神经网络中Transformation操作一般为一个卷积操作。我们通常在聊SE注意力时通常不包含这一步。

第二步、

Squeeze ( F s q ( ⋅ ) ) (F{_s}{_q}(·))(F s q (⋅))::这一步将特征图进行全局平均池化,生成一个1 ∗ 1 ∗ C 11C 1 ∗1 ∗C的向量，这样每个通道让一个数值表示。
注释：对U U U实现全局低维嵌入，相当于一个数值拥有该通道的全局感受野。

此外：论文中给出了使用平均池化与最大池化的实验对比。

; 第三步、

Excitation ( F e x ) (F{_e}{_x})(F e x ):这一步通过两层全连接层完成，通过权重W生成我们我所要的权重信息，其中W是通过学习得到的，用来显示的建模我们我需要的特征相关性。

通过两个全连接层W 1 W{_1}W 1 ,W 2 W{_2}W 2 对上一步得到的向量z z z进行处理，得到我们想要的通道权重值s s s,经过两层全连接层后，s中不同的数值表示不同通道的权重信息，赋予通道不同的权重。
注意：两层全连接层之间存在一个超参数R R R, 向量z z z ( 1 ∗ 1 ∗ C ) (11C)(1 ∗1 ∗C )经过第一层全连接层后维度由
( 1 ∗ 1 ∗ C ) (11C)(1 ∗1 ∗C )变为( 1 ∗ 1 ∗ C / R ) (11C/R)(1 ∗1 ∗C /R ),再经过第二层全连接层为度由( 1 ∗ 1 ∗ C / R ) (11C/R)(1 ∗1 ∗C /R )变为( 1 ∗ 1 ∗ C ) (11C)(1 ∗1 ∗C )。第一层全连接层的激活函数为ReLU，第二层全连接层的激活函数为Sigmoid。

第四步、

Scale ( F s c a l e ) (F{_{scale}})(F sc a l e ):由算法流程图可以看出，第四步的操作是将第三步生成权重向量s s s对特征图U U U进行权重赋值,得到我们想要的特征图X ~ \tilde X X ~，其尺寸大小与特征图U U U完全一样，SE模块不改变特征图的小大。

通过生成的特征向量s s s（1 ∗ 1 ∗ C 11C 1 ∗1 ∗C）与特征图U U U(H ∗ W ∗ C HWC H ∗W ∗C)，对应通道相乘，即特征图U U U中每个通道的H ∗ W H*W H ∗W个数值都乘s s s中对应通道的权值。

; SE模块的结构图

SE模块是一个 即插即用的模块，在上图中左边是在一个卷积模块之后直接插入SE模块，右边是在ResNet结构中添加了SE模块。

实现代码

import torch.nn as nn

class SEModel(nn.Module):
    def __init__(self, channel, reduction=16):
        super(SEModel, self).__init__()
        self.avg_pool = nn.AdaptiveAvgPool2d(1)
        self.fc = nn.Sequential(
            nn.Linear(channel, channel // reduction, bias=False),
            nn.ReLU(),
            nn.Linear(channel // reduction, channel, bias=False),
            nn.Sigmoid()
        )

    def forward(self, x):
        b, c, _, _ = x.size()
        y = self.avg_pool(x).view(b, c)
        y = self.fc(y).view(b, c, 1, 1)
        return x * y.expand_as(x)

网上有较多的公开代码，都可以进行参考。

最后

SE模块在使用时如何选择添加的位置是值得考虑的问题，如何实现最大化的提升。
MobileNetV3中使用了SE模块，通过神经网络架构搜索进行了最优位置选择，值得思考与学习。

如有错误，望大家指正。B站上有很多大佬的讲解视频，喜欢视频讲解的可以看一下。

Original: https://blog.csdn.net/renxingshen2022/article/details/125773673
Author: renxingshen2022
Title: SE注意力机制

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/723698/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

天池比赛——用户情感可视化分析

天池比赛——用户情感可视化分析目录天池比赛——用户情感可视化分析前言一、读取数据，查看基本情况并做数据预处理引入相关库读取数据，基础分析数据空值处理，数据映射对评论…

人工智能 2023年7月17日
0070
感受野详解

目录概念举例感受野的计算规律两种计算感受野的方法 * 从前往后从后往前推导VGG16网络的感受野 * 结构从后往前从前往后感受野大于图片为什么要增大感受野概念…

人工智能 2023年5月26日
0086
大数据常见组件zookeeper Kafka flume组件的常用操作命令

本文主要汇总了大数据常用组件zookeeper、kafka、flume的常用命令行操作 Zookeeper常用命令操作命令行语法 1）启动客户端 [atguigu@hadoop1…

人工智能 2023年6月4日
00100
目标检测系列——开山之作RCNN原理详解

🍊作者简介：秃头小苏，致力于用最通俗的语言描述问题🍊往期回顾：ubuntu使用指南阿里云对象存储oss+picgo+typora实现步骤及无法上传图片解决方案🍊近期目标：拥有…

人工智能 2023年7月9日
0072
嵌入式习题2

Linux的根文件系统中，存放设备文件的目录是填空 1 。（都用小写字母）正确答案：填空 1：dev Linux中，可以通过填空 1 文件查看已被驱动程序注册的中断。（都用…

人工智能 2023年6月4日
0077
胡笨笨硕士期间项目心得之项目四地学中砂岩文献内三角图和知识图谱关联

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月1日
0063
windows下跑通transformer 实现图像分割，3060基于cuda11.3+torch1.10+torchvision1.11

首先环境部署cuda11.3 和torch1.10 vs2019(默认安装即可)这些不再赘述。接下来比较重要的是：一些依赖的环境本人的依赖环境如下：很多博客上讲安装mmcv1…

人工智能 2023年5月28日
00107
python实现比例类指标差异分析-卡方检验（完整代码+实验效果）

实现功能： python实现比例类指标差异分析-卡方检验。对sex这一列，按照target取值进行分组差异分析。实现代码： # 导入需&…

人工智能 2023年7月18日
0057
刘二老师的代码合集

首先谢谢刘老师的视频课，我没有白嫖，我点赞投币了，哈哈哈哈，刘老师讲的很好，感谢，同时感谢吴恩达老师的深度学习的课程，很随和、亲和。谢谢还要谢谢CSDN博主（大佬）：错错莫、wh…

人工智能 2023年7月21日
0070
100天精通Python（数据分析篇）——第65天：Pandas聚合操作与案例

### 回答1：这个问题的意思是询问一个学习 Python 数据分析_的 _100 天_计划，我的回答如下： _Python 数据分析_是非常重要的技能之一，学习它需要长时间的实…

人工智能 2023年7月30日
0063
机器学习应用——监督学习（下）“手写数字识别”（神经网络实现&KNN实现）

前言机器学习应用博客中，将核心介绍三大类学习，即：无监督学习、监督学习、强化学习。本篇将简要介绍监督学习的”手写数字识别”实例运用MNIST数据集和D…

人工智能 2023年7月13日
0059
出现 The column label ‘ID‘ is not unique. For a multi-index, the label must be a tuple 解决方法

目录 1. 问题所示 2. 解决方法 3. 科普to_clipboard函数 ; 1. 问题所示数据预处理过程中，合并两张表的数据，代码出现如下问题: ValueError: T…

人工智能 2023年7月7日
0042
VIT模型个人笔记

前言 VIT模型即vision transformer，其想法是将在NLP领域的基于自注意力机制transformer模型用于图像任务中，相比于图像任务中的传统的基于卷积神经网络模…

人工智能 2023年5月27日
00163
Pytorch使用DDP加载模型时出现多进程在GPU0上占用过多显存的问题

使用pytorch DDP(DistributedDataParallel，分布式数据并行)可以进行多卡训练，涉及到模型保存与加载问题时，一般会涉及到以下两种需求：将多卡训练的模…

人工智能 2023年7月13日
00106
torch.backends.cudnn.deterministic = True torch.backends.cudnn.benchmark = False manual_seed控制程序的随机性

cuda 是NVIDIA 针对自家的CPU设计的并行计算的框架， cuDNN是is a GPU-accelerated library of primitives for deep…

人工智能 2023年7月23日
0076
单通道语音增强

单通道语音增强技术概念：语音增强是指在语音信号被各种噪声干扰甚至淹没时，从噪声背景中提取有用的语音信号，抑制和减少噪声干扰的技术。总之，从嘈杂的语音中提取出尽可能纯净的原始语音。…

人工智能 2023年5月27日
0086

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31