NeurIPS 2021 | GFNet：用于图像分类的全局滤波网络

2023年6月20日上午11:25 • 人工智能 • 阅读 149

代码：https://github.com/raoyongming/GFNet
摘要：
本文提出一个全局滤波网络GFNet，用傅里叶变换处理代替ViT中的注意力机制，其中二维离散傅里叶变换将输入的空间特征转换为频域特征，然后通过全局滤波处理，最后反变换映射回空间域。解决了token大小改变带来的计算量问题。实验结果表明改进后的网络在计算速度和参数量/泛化能力上有提升。
Introduction
Transformer与MLP模型的发展证明了其具有以更少的归纳偏置取得更佳性能的潜力，这些模型往往基于从原始数据学习空间位置上相关性。这些自注意力与MLP的计算复杂度会随图像尺寸迅速增长O(N^2)，这使得其难以满足高分辨率特征需求。

频谱图表示图像梯度的分布图，所以原图和频率图上的点不是一一对应的，频谱图上的点表示空域图某点的灰度梯度大小，梯度大其频率高.经过傅里叶变换后，在频域中计算某一位置的信息时，对应空间域多个位置的信息，有综合考虑整个图像的效果,与transformer的自注意力层异曲同工。由此，本文提出了全局滤波器网络(GFNet)，一种概念简单且高效的架构，它在频域以log-linear复杂度学习长距离空间依赖。GFNet在ImageNet以及下游任务上表现出了非常有力的精度-复杂度均衡。相比Transformer与CNN模型，在高效性、泛化性以及鲁棒性方面极具竞争力。
Architecture

代码部分

滤波器初始化的时候将数据0.02，作用是将数变小，均值还是0方差变成原来的0.0004，猜测是希望初始化数据不要太分散了。然后加入了输入x是空间形状的判断，这里特征图是在网络中被展平之后传入，所以将他复原成二维之后再傅里叶变换。
实验

GFNet不同版本的详细配置:
GFNet-XS与 DeiT-S 和 ResMLP-12 具有类似的架构
GFNet-Ti、GFNet-S 和 GFNet-B对应 ResNet-18、 50 和 101有相似的计算代价
GFNet-H-Ti、GFNet-H-S和 GFNet-H-B对应 ResNet-18、 50 和 101

“↑384″表示在30个epoch的384 × 384图像上微调的模型

可以看到泛化和鲁棒性都有所提高

可视化中，频域可以学到更有区别的特征表示，空间域就比较模糊
总结：*
·本文提出一个全局滤波网络GFNet，用傅里叶变换处理代替ViT中的注意力机制，其中二维离散傅里叶变换将输入的空间特征转换为频域，然后通过全局滤波处理，最后反变换映射回空间域。
·解决了token数量带来的计算复杂度问题，以及token大小的限制。实验结果表明改进后的网络在计算速度和参数量/泛化能力上有提升。
·傅里叶变换应用到对特征图处理，可以考虑到全局位置信息，是很好的改进方向

Original: https://blog.csdn.net/qq_40464371/article/details/123256090
Author: 人间不值得_
Title: NeurIPS 2021 | GFNet：用于图像分类的全局滤波网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/641182/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

TCGA数据库与肿瘤数据分析（参考后整理）

1.INTRODUCTION（介绍） 1.数据来源 GDC Legacy Archive GDC Harmonized database 2.barcode 2.Install.p…

人工智能 2023年6月19日
00101
基于YOLOv5开源项目实现垃圾分类功能(2)

目录前言一、基本概念 * 1、什么是权重文件？ 2、GPU与CPU的区别 3、深度学习框架 4、PyTorch 二、下载和安装nvidia显卡驱动三、训练自己的模型并分析前…

人工智能 2023年7月1日
0083
爬虫+数据可视化分析

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档简单爬虫及数据分析一、前程无忧数据分析岗位爬虫二、Python 数据清洗+可视化分析 * 1.数据清洗 2. …

人工智能 2023年7月15日
0085
java计算机毕业设计VUE商场库存管理系统源码+数据库+系统+lw文档

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月26日
0081
模型介绍—–MLP

导读：M-P 模型是一个神经元结构，但是没有参数学习的过程；感知机将训练数据进行线性划分的分离超平面，引入损失函数，利用梯度下降法对损失函数进行极小化，求感知机模型，在此并提出了学…

人工智能 2023年6月15日
0093
python学习实验报告（第十周）

一、实验目的 1. 了解常用的HTML标签 2. 了解在网页中使用JavaScript代码的几种方式 3. 掌握Python标准库urllib的用法 4. 掌握Python扩展库s…

人工智能 2023年7月8日
0077
分类问题评价指标总结

1 二分类评价指标：准确率，精确率，召回率，F1-Score， AUC, ROC, P-R曲线对于二分类问题，通常以关注的类为正类，其他类为负类，分类器在数据集上的预测或者正确…

人工智能 2023年7月3日
0091
Keras-训练网络时的问题：loss一直为nan，accuracy一直为一个固定的数

在使用VGG19做分类任务时，遇到一个问题：loss一直为nan，accuracy一直为一个固定的数，如下输出所示，即使加入了自动调整学习率 (ReduceLROnPlateau)…

人工智能 2023年5月24日
00101
apex——安装方式和避免踩坑

背景：这个库的安装不是像其他的一样的直接使用 pip install XXX的形式，而是使用原始的Git方式 1、apex 这是NVIDIA开发的基于PyTorch的混合精度训练加…

人工智能 2023年7月9日
0095
YOLOV5中损失函数即代码讲解

YOLOV5中损失函数即代码讲解YOLOV5中loss.py文件代码讲解：https://blog.csdn.net/weixin_42716570/article/details…

人工智能 2023年7月6日
00102
详解torch.nn.utils.clip_grad_norm_ 的使用与原理

从上面文章可以看到， clip_grad_norm最后就是对所有的梯度乘以一个 clip_coef，而且乘的前提是 clip_coef一定是小于1的，所以，按照这个情况： clip…

人工智能 2023年6月16日
0093
python nextpow2_谱减法语音降噪的Python实现

转载出处：https://blog.csdn.net/iTaacy/article/details/60141849 效果：谱减法语音降噪的Python实现： !/usr/bin…

人工智能 2023年5月27日
0062
TensorFlow、Torch 安装GPU版本记录

安装的版本：python=3.7CUDA=11.3.1cuDNN=8.2.1Torch=1.11.0TensorFlow-gpu=2.6.0 前言 TensorFlow、Torch…

人工智能 2023年5月23日
0073
010-步进电机和蜂鸣器

单片机的IO口的结构 IO口结构的类型：准双向IO——内输出0，IO输出1；内输出1，IO输出0。开漏输出——要IO输出高电平，必须加外部的上拉电阻。（标准51一般是这样） …

人工智能 2023年6月6日
0086
neo4j 4.x新建数据库，并解决报错Unsupported administration command: CREATE DATABASE

重要社区版本不支持命令 create database xxx，只有企业版可以！社区版本只允许同时打开一个数据库，当然你可以多开几个neo4j服务，当你打开成新的数据库后，除了…

人工智能 2023年6月5日
00223
已经安装了python如何与anaconda共存？

嗨害大家好鸭，我是小熊猫🖤 有小伙伴问我：只听过python，anaconda 是什么？？？今天就来给大家说一说，已经安装了python如何与anaconda共存？有什么p…

人工智能 2023年7月5日
0080

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

NeurIPS 2021 | GFNet：用于图像分类的全局滤波网络

大家都在看