SeNet || 注意力机制——源代码+注释

2023年6月17日上午12:18 • 人工智能 • 阅读 163

文章目录

1 SeNet介绍
2 SeNet优点
3 Se模块的具体介绍
4 完整代码

1 SeNet介绍

SENet是Squeeze-and-Excitation Networks的简称，由Momenta公司所作并发于2017CVPR，论文中的SENet赢得了ImageNet最后一届（ImageNet 2017）的图像识别冠军
SENet主要是学习了channel之间的相关性，筛选出了针对通道的注意力，稍微增加了一点计算量，但是效果比较好。
通过学习的方式来自动获取到每个特征通道的重要程度，然后依照这个重要程度去提升有用的特征，并抑制对当前任务用处不大的特征。
Se模块思想简单，易于实现，很容易加载到现有的网络模型框架中。

2 SeNet优点

增加少量的参数，并能够在一定程度上提高模型的准确率。
是在ResNet的基础上建立的策略，创新点好，很适合自己创作新模型刷高准确率。
很方便插入到自己的深度神经网络模型中，以提高模型的准确性。

3 Se模块的具体介绍

Sequeeze：顺着 空间维度（channel）来进行特征压缩，将每个二维的特征通道变成一个实数，这个实数某种程度上具有全局的感受野,并且输出的维度和输入的特征通道数相匹配。它表征着在特征通道上响应的全局分布,且使得靠近输入的层也可以获得全局的感受野。
具体操作（和代码里面的数字是一一对应的）：对原特征图 50×512×7×7进行 global average pooling,然后得到了一个 50×512×1×1大小的特征图，这个特征图具有全局感受野。
Excitation ：输出的 50×512×1×1特征图，经过两个全连接神经网络，最后用一个类似于循环神经网络中 门的机制，通过参数来为每个特征通道生成权重，中参数被学习用来显式地建模特征通道间的相关性(论文中使用的是 sigmoid)。 50×512×1×1变成 50×512 / 16×1×1，最后再还原回来： 50×512×1×1
特征重标定：使用Excitation得到的结果作为权重,然后通过乘法逐通道加权到U的C个通道上（ 50×512×1×1通过 expand_as得到 50×512×7×7）, 完成在通道维度上对原始特征的重标定，并作为下一级的输入数据。

class SELayer(nn.Module):
    def __init__(self, channel, reduction=16):
        super(SELayer, self).__init__()
        self.avg_pool = nn.AdaptiveAvgPool2d(1)
        self.fc = nn.Sequential(
            nn.Linear(channel, channel // reduction, bias=False),
            nn.ReLU(inplace=True),
            nn.Linear(channel // reduction, channel, bias=False),
            nn.Sigmoid()
        )

    def forward(self, x):
        b, c, _, _ = x.size()
        y = self.avg_pool(x).view(b, c)
        y = self.fc(y).view(b, c, 1, 1)
        return x * y.expand_as(x)

4 完整代码

import numpy as np
import torch
from torch import nn
from torch.nn import init

class SEAttention(nn.Module):

    def __init__(self, channel=512, reduction=16):
        super().__init__()
        self.avg_pool = nn.AdaptiveAvgPool2d(1)
        self.fc = nn.Sequential(
            nn.Linear(channel, channel // reduction, bias=False),
            nn.ReLU(inplace=True),
            nn.Linear(channel // reduction, channel, bias=False),
            nn.Sigmoid()
        )

    def init_weights(self):
        for m in self.modules():
            print(m)
            if isinstance(m, nn.Conv2d):
                init.kaiming_normal_(m.weight, mode='fan_out')
                if m.bias is not None:
                    init.constant_(m.bias, 0)
            elif isinstance(m, nn.BatchNorm2d):
                init.constant_(m.weight, 1)
                init.constant_(m.bias, 0)
            elif isinstance(m, nn.Linear):
                init.normal_(m.weight, std=0.001)
                if m.bias is not None:
                    init.constant_(m.bias, 0)

    def forward(self, x):
        b, c, _, _ = x.size()
        y = self.avg_pool(x).view(b, c)
        y = self.fc(y).view(b, c, 1, 1)
        return x * y.expand_as(x)

if __name__ == '__main__':
    input = torch.randn(50, 512, 7, 7)
    se = SEAttention(channel=512, reduction=8)
    output = se(input)
    print(output.shape)

Original: https://blog.csdn.net/weixin_42521185/article/details/124330333
Author: 谜底是你_
Title: SeNet || 注意力机制——源代码+注释

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/627523/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

6- 构建一个简单的分类网络

神经网络由对数据进行操作的层/模块组成。pytorch.nn的namespace命名空间提供了构建自己的神经网络所需的所有构建块。PyTorch中的每个模块都是nn.Module的…

人工智能 2023年7月3日
0086
Transformer结构解析（附源代码）

mask机制 Mask机制几乎贯穿了Transformer架构的始终，若不能首先将mask机制交代清楚，就难以对Transformer进行连贯的阐述。因此，决定将mask机制的介绍…

人工智能 2023年5月27日
0095
改进方法实验测试

文章目录前言一、实验参数设置二、实验环境三、改进方法及结果 * （一）baseline-YOLOv5s实验结果 – 1.网络结构（二）ELAN+深度可分离卷积…

人工智能 2023年6月26日
0081
基于pytorch的DCGAN代码实现（DCGAN基本原理+代码讲解）

DCGAN原理Deep Convolution Generative Adversarial Networks(深度卷积生成对抗网络) DCGAN是将CNN 与 GAN 结合，原理…

人工智能 2023年7月21日
00125
图像处理中常见的几种插值方法：最近邻插值、双线性插值、双三次插值（附Pytorch测试代码）

插值方法零、前言一、最近邻插值（Nearest Neighbor Interpolation） * 1.相关介绍 2.代码实现二、双线性插值（Bilinear Interpo…

人工智能 2023年7月20日
00122
入行数据分析要知道数据挖掘到底是做什么的

大家好，我是Mr数据杨，数据挖掘，就像诸葛亮、周瑜、郭嘉等谋士们在军师帐下研究敌军的情报，深入研究每一个信息的细节，预测未来的战局，寻找最佳的战术策略。数据挖掘有两种方式，类似于冷…

人工智能 2023年7月15日
0066
Pandas中loc和iloc函数（提取某几列或者行的数据）

loc函数：通过行索引（列名、行名）中的具体值来取行数据（如取”Index”为”A”的行） iloc函数：通过行号（数字）来…

人工智能 2023年7月4日
0085
Ubuntu搭建Pytorch，就这一篇就够了

第一步：配置镜像源，安装必要环境我在这篇文章中详细写了如何配置清华源更换镜像第二步：安装anaconda 1 进入官网 https://www.anaconda.com/ 2 …

人工智能 2023年6月16日
00130
Allergo导出Gerber文件

首先设置导出路径，点击 Setup->User Preferences，在弹出的对话框中设置 ads_sdart的值为 Gerber(名字随意)，该文件夹在当前.brd文件所…

人工智能 2023年6月27日
0069
语音处理：Python实现音频文件声道分离批量处理

人工智能 2023年5月23日
0086
关于树的左0右1，位运算

要找到这个节点，编码就可以这样： ①让101与010做”与”，得到000，再取反，得到1，就node = node->left; ②010向右移一位，…

人工智能 2023年6月4日
0088
yolox的相关改动

yolox增加一个浅层检测分支前言该篇文章主要介绍yolox中如何增加一个检测层，之前的yolov3-yolov5增加检测分支都有人再写，我网上搜索没看到有yolox增加检测分…

人工智能 2023年6月25日
00154
SpringBoot SpringBoot 基础篇 4 基于 SpringBoot 的SSMP 整合案例 4.10 表现层标准开发

SpringBoot 【黑马程序员SpringBoot2全套视频教程，springboot零基础到项目实战（spring boot2完整版）】 SpringBoot 基础篇文章目…

人工智能 2023年6月27日
00113
[Pandas] 数据连接pd.concat

美图欣赏2022/06/25 Pandas数据可以实现纵向和横向连接，将数据连接后会形成一个新对象(Series或DataFrame) 连接是最常用的多个数据合并操作 pd.con…

人工智能 2023年7月6日
0077
[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集的产品化应用

目录 1….. 应用概述… 2 2….. 免费下载试用… 2 3….. 视频介绍… 2 4…….

人工智能 2023年6月4日
00118
mysql 数据备份与恢复使用详解

对一个运行中的线上系统来说，定期对数据库进行备份是非常重要的，备份不仅可以确保数据的局部完整性，一定程度上也为数据安全性提供了保障，设想如果某种极端的场景下，比如磁盘损坏导致某个时…

人工智能 2023年7月29日
0062

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

SeNet || 注意力机制——源代码+注释

文章目录

大家都在看