Visual Attention Network

2023年6月16日上午9:00 • 人工智能 • 阅读 77

研究背景

对于各种视觉任务来说，例如图像分类、目标检测、语义分割等，一个先进的backbone往往能够显著地提高性能。由于Transformer自身强大的建模能力，自Vit将Transformer引入CV以来，基于Transformer的backbone，如swin-Transformer等迅速占据了各种任务的排行榜。

存在的问题

CNN

卷积运算采用静态权值，适应性差。

Transformer

self-attention起初是为1维的NLP任务设计的，将图片的二维结构视为一维序列，对图像的关键二维结构造成了破坏；
由于其二次计算和内存开销，它也难以处理高分辨率图像；
self-attention只考虑了空间维度的适应性，忽略了通道维度的适应性。

解决思路

回顾 Depth-wise Separable Convolution

depthwise separable convolution，由depthwise(DW) convolution和pointwise(PW) convolution两个部分结合起来，目的是降低网络参数量和计算量。

Visual Attention Network

Visual Attention Network

Visual Attention Network

假设输入shape为 Cin x Hin x Win，卷积核大小为 K x K，输出shape为 Cout x Hout x Wout
经典卷积核
参数为 K x K x C in x Cout
计算量为 K x K x C in x C out x H out x Wout
深度可分离卷积
参数为 K x K x C in + Cin x C out
计算量为 K x K x C in x H out x W out + C in x C out x H out x Wout
相除得到深度可分离卷积的参数量和计算量是经典卷积的_ 1/Cout + 1/(K x K)_

; Large Kernel Attention

注意机制可以看作是一个自适应选择过程，它可以根据输入特征选择有区别的特征，并自动忽略噪声响应。有两种众所周知的方法来建立不同部分之间的关系。

采用self-attention捕捉长期依赖。在计算机视觉中应用self-attention有三个明显的缺点，已在上文列出。
利用大核卷积构建相关性并生成注意图。这种方式也有明显的缺点。大核卷积带来了大量的计算开销和参数。

为了克服上述缺点，并利用self-attention和大核卷积的优点，我们提出分解一个大核卷积运算来捕获long-range relationship。如下图所示：

Visual Attention Network

一个大核卷积可以分为三个分量: 深度卷积(depth-wise卷积)、深度扩张卷积(depth-wise dilation卷积)和通道卷积(1×1卷积)。其中，一个K x K卷积分解为⌈K/d⌉×⌈K/d⌉深度卷积，同时包含dilation=d、(2d−1)× (2d−1)深度卷积和一个1×1卷积。通过上述分解，模块可以捕获长距离的关系，但计算成本和参数都很小。在获得长期关系后，我们可以估计一个点的重要性，并生成注意图。

Visual Attention Network

Visual Attention Network

LKA结合了卷积和自注意的优点。它考虑了局部的语境信息、大的接受域和动态过程。LKA不仅在空间维度上具有适应性，而且在通道维度上也具有适应性。值得注意的是，在深度神经网络中，不同的通道通常代表不同的对象，通道维度的适应性对于视觉任务也很重要。

Visual Attention Network

Visual Attention Network

; 复杂度分析

Visual Attention Network

同参数量下的模型性能对比

改进思路

继续完善网络结构，如采用不同的内核大小，引入多尺度结构，使用多分支结构。
VAN是CNN和VIT的天然结合。一方面，VAN可以利用图像的二维结构信息；另一方面，VAN可以根据输入图像动态调整输出，适合于自监督学习和迁移学习。结合以上两点，我们认为VAN在图像自我监督学习和迁移学习领域可以取得更好的性能。
由于资源有限，我们只能在视觉任务中表现出优秀的表现。VANs在N他领域，如NLP，是否也能表现良好，仍值得探讨。我们期待看到VAN成为通用车型。

Original: https://blog.csdn.net/qq_41327720/article/details/123772872
Author: 名字不如叫摸鱼
Title: Visual Attention Network

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/622867/

转载文章受原作者版权保护。转载请注明原作者出处！

赞 (0)

0

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

感知机python代码实现

目录 1、数据集准备 1.1 导入包 1.2 加载数据 1.3 原始数据可视化 1.4划分数据集和标签 2、感知机实现 2.1 初始化w、b、以及步长 2.2 设计激活函数 2.3…

人工智能 2023年6月15日
0053
transformer序列预测示例

本文参考：【python量化】将Transformer模型用于股票价格预测_蚂蚁爱Python的博客-CSDN博客_transformer 股票一、Transformer初步架…

人工智能 2023年6月24日
0085
backtrader框架使用与数据导入详解

原创文章第70篇，专注”个人成长与财富自由、世界运作的逻辑， AI量化投资”。百天100进行了2/3，期间有过一些反复。100天看似很短，但足以让你完成一…

人工智能 2023年7月7日
0057
现代企业管理笔记——企业概论

如果有兴趣了解更多相关内容，欢迎来我的个人网站看看：瞳孔空间一：现代企业类型及企业系统现代企业的特征：企业是以市场为导向、以营利为主要目的，专门从事商品生产和经营活动的经济组…

人工智能 2023年6月27日
0097
图神经网络（一）DGL框架搭建GCN图卷积神经网络模型

一、DGL DGL是基于pytorch开发的一个专门用于图神经网络模型搭建的框架，到现在为止，DGL已经高度封装了如GCN、GraphSage、GAT等常见的图神经网络模型，可以直…

人工智能 2023年6月16日
00109
【MATLAB深度学习工具箱】学习笔记–Deep Network Designer学习–组成和使用方法

Deep Newwork Designer是深度学习工具箱中深度神经网络的设计工具，其在深度学习和强化学习中有重要作用。本文对其组成和使用方法进行说明。打开方式第一种：在Com…

人工智能 2023年6月16日
0081
统计学习-01统计学习概念

chapter 2 统计学习 2.1基本概念统计学习是关于估计 f ( ⋅ ) f(\cdot)f (⋅) 的一系列方法，其中f ( ⋅ ) f(\cdot)f (⋅)为一个定量…

人工智能 2023年6月11日
00196
【知识图谱系列】清华大学基于对比学习的图谱预训练模型GCC

作者：CHEONG公众号：AI机器学习与知识图谱研究方向：自然语言处理与知识图谱本文介绍一篇基于对比学习的图谱预训练模型GCC（KDD 2020），介绍GCC模型核心点和模型思路…

人工智能 2023年6月1日
0083
YOLOV5-断点训练/继续训练

YOLOV5-断点训练/继续训练情况：1.训练过程中中断了，继续训练2.训练完了，但是未收敛，在这个基础上，还想用这个权重、学习率等参数继续训练多一些批次 1. 训练过程中中断了…

人工智能 2023年6月23日
0078
交互式医学影像标注器–MD.ai概述

今天给大家介绍一款交互式医学影像标注工具MD.ai，他的新颖之处在于一方面他是基于web模式的一款专业的医学影像标注工具，另一方面就是他是第一个创建的交互标注的工具，是一个多机构，…

人工智能 2023年6月20日
0098
目标检测数据集：Open Images Dataset V6 + Extensions 网站获取已经标注好的数据集

Open Images Dataset 网站获取已经标注好的数据集一、简介二、数据集说明 * 1.查看数据集 2.搜索选项三、数据集下载和使用 * 1.数据集下载 2.下载失…

人工智能 2023年7月9日
0061
用python做可视化驾驶舱大屏全代码

各位朋友大家好，医院数据显示越来越青睐驾驶舱，这两天我们参考了几个资深的python公共号，模仿制作了一个驾驶舱可视化大屏，把代码在这里保留下来，大家可以随时参考先是网络爬虫，爬…

人工智能 2023年7月8日
0061
python将str写入csv_python – Pandas将数据帧写入CSV fi

如果您遇到编码为’utf-8’的问题，并且想要逐个单元格地进行，您可以尝试以下其他方法。 Python 2 (其中”df”是您的Da…

人工智能 2023年7月8日
0087
Python中unique()用法及代码示例

在处理数据中，如果希望查看列中的去重之后的不同值或者唯一值，这可以使用 Pandas unique()函数来完成。Python的Pandas库Series.unique方法会返回S…

人工智能 2023年7月14日
00107
LSTM与BiLSTM的抽象理解——羽毛球双打

文章目录前言一、命名实体识别-NER 二、LSTM 三、Bi-LSTM 总结前言 LSTM的顶顶大名大家应该都听过，针对序列特征，LSTM相比于普通的RNN网络解决了两个棘手…

人工智能 2023年5月28日
0074
【知识图谱系列】-【Neo4j】之Cypher 二

人工智能 2023年6月10日
0092

亲爱的 Coder【最近整理，可免费获取】👉 最新必读书单 | 👏 面试题下载 | 🌎 免费的AI知识星球