CA：用于移动端的高效坐标注意力机制 | CVPR 2021

2023年7月28日上午5:47 • 人工智能 • 阅读 67

论文提出新颖的轻量级通道注意力机制coordinate attention，能够同时考虑通道间关系以及长距离的位置信息。通过实验发现，coordinate attention可有效地提升模型的准确率，而且仅带来少量的计算消耗，十分不错
来源：晓飞的算法工程笔记公众号

论文: Coordinate Attention for Efficient Mobile Network Design

论文地址：https://arxiv.org/abs/2103.02907
*论文代码：https://github.com/Andrew-Qibin/CoordAttention

; Introduction

目前，轻量级网络的注意力机制大都采用SE模块，仅考虑了通道间的信息，忽略了位置信息。尽管后来的BAM和CBAM尝试在降低通道数后通过卷积来提取位置注意力信息，但卷积只能提取局部关系，缺乏长距离关系提取的能力。为此，论文提出了新的高效注意力机制coordinate attention，能够将横向和纵向的位置信息编码到channel attention中，使得移动网络能够关注大范围的位置信息又不会带来过多的计算量。
coordinate attention的优势主要有以下几点：

不仅获取了通道间信息，还考虑了方向相关的位置信息，有助于模型更好地定位和识别目标。
足够灵活和轻量，能够简单地插入移动网络的核心结构中。
可以作为预训练模型用于多种任务中，如检测和分割，均有不错的性能提升。

Coordinate Attention

Coordinate Attention可看作增强移动网络特征表达能力的计算单元，接受中间特征X = [ x 1 , x 2 , ⋯ , x C ] ∈ R C × H × W X=[x_1,x_2,\cdots,x_C]\in\mathbb{R}^{C\times H\times W}X =[x 1 ,x 2 ,⋯,x C ]∈R C ×H ×W作为输入，输出与X X X大小相同的增强特征Y = [ y 1 , y 2 , ⋯ , y C ] Y=[y_1,y_2,\cdots,y_C]Y =[y 1 ,y 2 ,⋯,y C ]。

; Coordinate Attention Blocks

Coordinate Attention基于coordinate information embedding和coordinate attention generation两个步骤来编码通道关系和长距离关系。

*Coordinate Information Embedding

channel attention常用全局池化编码全局空间信息，将全局信息压缩成一个标量，难以保留重要的空间信息。为此，论文将全局池化改造成两个1维向量的编码操作。对于输入X X X，使用池化核( H , 1 ) (H,1)(H ,1 )和( 1 , W ) (1,W)(1 ,W )来编码水平方向和垂直方向特征，即第c c c维特征的输出为：

上面的公式从不同的方向集成特征，输出一对方向可知的特征图。对比全局池化的压缩方式，这样能够允许attention block捕捉单方向上的长距离关系同时保留另一个方向上的空间信息，帮助网络更准确地定位目标。

*; Coordinate Attention Generation

为了更好地利用上述的coordinate infomation，论文提出了配套的coordinate attention generation操作，主要基于以下三点准则进行设计：

足够简单和轻量。
能完全利用提取的位置信息。
能同样高效地处理通道间的关系。

首先将公式4和公式5的输出concatenate起来，使用1 × 1 1\times 1 1 ×1卷积、BN和非线性激活进行特征转化：

f ∈ R C / r × ( H + W ) f\in\mathbb{R}^{C/r\times(H+W)}f ∈R C /r ×(H +W )为包含横向和纵向空间信息的中间特征，r r r为缩减因子。这里两个方向的特征没有做激烈的融合，concatenate的主要目的我觉得是进行统一的BN操作。随后将f f f分为两个独立的特征f h ∈ R C / r × H f^h\in\mathbb{R}^{C/r\times H}f h ∈R C /r ×H和f w ∈ R C / r × W f^w\in\mathbb{R}^{C/r\times W}f w ∈R C /r ×W，使用另外两个1 × 1 1\times 1 1 ×1卷积和sigmoid函数进行特征转化，使其维度与输入X X X一致：

将输出g h g^h g h和g w g^w g w合并成权重矩阵，用于计算coordinate attention block输出：

coordinate attention block与se block的最大区别是，coordinate attention block的每个权重都包含了通道间信息、横向空间信息和纵向空间信息，能够帮助网络更准确地定位目标信息，增强识别能力。

Implementation

将coordinate attention block应用于MobileNetV2和MobileNeXt上，block结构如图3所示。

; Experiment

基于MobileNetV2进行模块设置的对比实验。

不同注意力结构在不同主干网络上的性能对比。

对目标检测网络的性能对比。

对语义分割任务的性能对比。

Conclusion

论文提出新颖的轻量级通道注意力机制coordinate attention，能够同时考虑通道间关系以及长距离的位置信息。通过实验发现，coordinate attention可有效地提升模型的准确率，而且仅带来少量的计算消耗，十分不错。

如果本文对你有帮助，麻烦点个赞或在看呗～
更多内容请关注微信公众号【晓飞的算法工程笔记】

Original: https://blog.csdn.net/lichlee/article/details/125596913
Author: 晓飞的算法工程笔记
Title: CA：用于移动端的高效坐标注意力机制 | CVPR 2021

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/719881/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python文字语音互转

目录 pyttsx SAPI SpeechLib PocketSphinx pyttsx 安装 pyttsx库：pip install pyttsx3 import pyttsx3…

人工智能 2023年5月23日
0077
超实用的7种 pytorch 网络可视化方法，进来收藏一波

引导 * – 前言 – 1. torchsummary – 2. graphviz + torchviz – 3. Jupyter …

人工智能 2023年6月16日
00121
全球及中国电子鼻设备行业发展形势分析及投资风险展望报告2022-2028年

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月11日
0081
好心情：这4种营养素能增强抗抑郁药的疗效！不知道的人亏大了

抑郁症有多痛苦，只有经历过的人才懂~ 吃再美味的东西，都味同嚼蜡；累的感觉永无止境，睡再久也于事无补；自我攻击的想法会不停在脑海闪过：我真的太没用了，好事不会发生在我身上&#8…

人工智能 2023年6月28日
0076
基于seed数据集的脑电情绪识别（附论文和源码）（改进的循环神经网络（简单循环单元神经网络）和集成学习）并提取了微分熵、功率谱等特征

论文和源码链接见个人主页：基于seed数据集的脑电情绪识别（附论文和源码）（改进的循环神经网络和集成学习）并提取了微分熵、功率谱等特征。 https://download.csdn…

人工智能 2023年5月27日
0073
ORB匹配–基于OpenCV

ORB特征包含以下两部分： FAST角点提取：与原版不同的是计算了主方向 BRIEF描述子：使用了先前计算的方向信息 FAST关键点检测思想：如果一个像素与邻域像素差别较大，则…

人工智能 2023年6月22日
0069
Expected Calibration Error (ECE)模型校准原理解析

Expected Calibration Error (ECE)模型校准原理解析对于高风险应用来说，机器学习模型对其预测的置信度是至关重要的。 model calibration…

人工智能 2023年5月30日
00144
还看不懂Python OpenCV？不，我不允许！隔壁大爷都说看得懂！❤️环境配置+问题分析+视频图像入门❤️万字只为你~

📢📢📢📣📣📣🌻🌻🌻Hello，大家好我叫是Dream呀，一个有趣的Python博主，小白一枚，多多关照😜😜😜🏅🏅🏅CSDN Python领域新星创作者，大二在读，欢迎大家找我合作学…

人工智能 2023年6月19日
0090
使用Tesseract+OpenCV+Python进行光学字符识别 (OCR)

介绍我们人类几乎每时每刻都在阅读文本。如果我们的机器或系统也能像我们一样阅读文本，那不是很好吗？但更大的问题是”我们如何让我们的机器阅读”？这就是光学字符…

人工智能 2023年5月25日
0081
Flask入门学习教程

Flask学习文章目录 Flask学习 1.简介 2.安装 3.最小的应用 4.路由 5.变量规则 6.URL构建 7.HTTP方法 8.文件存放 9.渲染模板 10.Reque…

人工智能 2023年7月4日
0099
宝藏机器学习资料分享(超高质量pdf直接下载)

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月24日
00107
[Python] 反距离权重插值案例及代码

简介 2021年华为杯研赛B题”空气质量预报二次建模”第四题的数据预处理过程用到了一个反距离权重插值（见章节2.1），在这里整理一下。目录 1. 赛题及数…

人工智能 2023年7月18日
00126
亲测可用的RT1052+FreeRTOS10.3移植CmBacktrace方法——2022.11.12

搜遍全网都找不到一个靠谱的RT1052可用的移植方法，自己弄了一个分享出来，禁止一切形式未经许可的转载复制。文章目录 CmBacktrace 移植CmBacktrace * 前期…

人工智能 2023年6月29日
00154
python对BP神经网络实现

python对BP神经网络实现一、概念理解开始之前首先了解一下BP神经网络，BP的英文是back propagationd的意思，它是一种按误差反向传播(简称误差反传)训练的多…

人工智能 2023年6月16日
00102
Win RTX3070+cuda11.4+cuDNNv8.2.2+torch-gpu离线安装+tensorflow-gpu安装

查看cuda版本：鼠标右键，NVIDIA控制面板——系统信息——组件查看cuda版本或者 Win+R ——cmd——输入命令： nvidia-smi 查看cuda版本下载c…

人工智能 2023年5月23日
0088
python opencv实现灰度图的符号化(仿qgis单波段伪彩色)

一、前言：博主在使用qgis对图像进行处理的时候，发现qgis里面图层的符号化可以讲灰度图进行单波段伪彩色的操作，很方便对图像进行观察，后期需要大批量处理图像，所以用python…

人工智能 2023年7月19日
0065

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

CA：用于移动端的高效坐标注意力机制 | CVPR 2021

; Coordinate Attention Blocks

Implementation

大家都在看