论文精读–Autoformer

2023年6月26日上午2:31 • 人工智能 • 阅读 92

论文简介

标题：Autoformer: Decomposition Transformers with Auto-Correlation for Long-Term Series Forecasting

作者：Haixu Wu, Jiehui Xu, Jianmin Wang, Mingsheng Long（Tsinghua University）

发表刊物：NeurIPS 2021

作者代码地址：GitHub – thuml/Autoformer: About Code release for “Autoformer: Decomposition Transformers with Auto-Correlation for Long-Term Series Forecasting” (NeurIPS 2021), https://arxiv.org/abs/2106.13008

背景及意义

长距离的时序预测问题，传统的transformer及其改版在计算注意力机制时通常使用以下公式：

导致每次计算时都要将Q与每一个K做相似度计算，而过长的输入迫使模型只能采用稀疏点积取代逐个点积，从而丢失部分信息。

针对此问题，本文提出Auto-Correlation，以 子序列之间的相关性计算取代点与点之间的相关性计算，从而直接捕捉子序列直接的关系，提高对历史数据的利用率。

此外，本文将传统transformer直接对输入原始数据处理，修改成 季节性-趋势性分解后进行处理，并将注意力机制着重点放在捕捉季节性信息。

研究方法

3.1. 整体框架

本文提出基于子序列相关性的Auto-Correlation块和基于时序分解的Series Decomp块，分别代替传统transformer中的Self-Attention块和Layer Norm块

3.2. Encoder

*结构流程

原始原始数据经过Auto-Correlation 得到带权和，与自身相加后通过Series Decomp 去除趋势性信息，经过前馈网络与自身相加后再次去除趋势性信息，作为全局的季节性信息表示传递给Decoder

*公式表达

3.3. Decoder

*结构流程

季节性信息部分：原始数据（预测部分的季节信息以0 填充）的季节信息经过Auto-Correlation 与自身相加后，经分解得到季节性信息作为Q ，与Encoder 传递的K/V 经Auto-Correlation 得到全局历史信息加权和，与自身相加、分解后把季节信息经过前馈网络再与自身相加，最后分解提取季节信息，得到最终季节预测。

趋势性信息部分：原始数据（预测部分的趋势信息以历史均值填充）的趋势信息，通过季节信息通道三次时序分解得到的趋势信息加权聚合，得到最终趋势预测

*公式表达

3.4. Auto-Correlation

*时延序列

选择时延时长

，将原始序列的前

个数据点转移到末尾（如上右图）

*子序列相关性（基于随机过程理论）

与Self-Attenetion中的相关性计算类似，通过QK之间的计算，结果越大，表明序列之间的相关性越大，经过SoftMax之后可得到非负且和为1的权重

*时延聚合

与Self-Attenetion中的加权和类似，将SoftMax输出的权重与时延子序列相乘相加得到时延子序列的加权和，即聚合感兴趣的历史信息

3.5. SeriesDecomp

*趋势性信息提取

以序列的滑动平均值作为趋势信息

*季节性信息提取

以源序列减去其滑动平均值作为季节性信息

实验验证

4.1. 不同Attention之间对比

作者将自己的Auto-Corelation将全Attention和两种稀疏Attention作比较，可以看出传统点积的Attention感兴趣的点与源点之间关联度并不高，对时序之间的模式提取能力弱，凸显本文新Attention在捕捉子序列相关性上的优势

4.2. 数据集测试效果对比

作者以MSE,MAE作为评估项目，在ETT等六种不同领域的时序数据集上，与Informer等三种Transformer改版、两种基于LSTM的模型和TCN进行对比，在不同未来预测长度中均胜过其余Baseline算法。

Original: https://blog.csdn.net/weixin_43909400/article/details/126707027
Author: 云龙弓手
Title: 论文精读–Autoformer

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/651986/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【OpenCV】中的鱼眼相机及其标定

1. 鱼眼镜头特性与镜头分类普通镜头和针孔相机在数学模型上可以等价对待，都是射影变换（Perspective transform）；鱼眼镜头受到水下斯涅耳窗口现象的启发，采用不同…

人工智能 2023年7月19日
0074
深度剖析家用洗地机的方案设计

对于我们每一位居民来说，家庭清洁永远是一个绕不开的工作。小余猜测，你们都有扫帚、拖把或吸尘器等基本清洁工具。随着科技的创新，扫地机器人、蒸汽拖把、家用洗地机等智能工具逐渐走进了我…

人工智能 2023年5月25日
0088
cuda+cudnn+tensorflow-gpu+keras安装及版本对应

本文使用的版本是cuda10.1cudnn7.6.5keras 2.2.4tensorflow-gpu1.15 cuda安装 1.确定电脑是否有GPU，有则可下cuda；2.查询电…

人工智能 2023年5月25日
0077
基于OpenHarmony开发的语音小助手

基于OpenHarmony开发的语音小助手本教程将演示如何在BearPi-HM_Nano开发板上使用GPIO输入功能去读取语音模块信息，实现*开关灯自由*！！一、实验前器材准备…

人工智能 2023年5月25日
0078
锁相环技术知识

目录 0 分类 1、PLL * 1.1 系统结构 2、SOGI-based PLL 未完待续 * 2.1 结构理解 2.2 C语言实现 – 2.2.1 通过控制框图直接…

人工智能 2023年7月28日
0069
深度网络架构的设计技巧(三)之ConvNeXt：打破Transformer垄断的纯CNN架构

单位：FAIR (DenseNet共同一作，曾获CVPR2017 best paper)，UC伯克利ArXiv：https://arxiv.org/abs/2201.03545Gi…

人工智能 2023年7月31日
00166
pycharm python3.7成功安装face_recognition以及dlib库教程

相应问题： Unable to open ..\shape_predictor_68_face_landmarks.dat 对应解决：(28条消息) Unable to open …

人工智能 2023年7月12日
0079
Bert+CNN文本分类（含代码实现）

以下是使用 Bert_进行 _文本分类_的示例 _代码： _python_ import torch from transformers import _Bert_Tokenize…

人工智能 2023年7月5日
0044
基于朴素贝叶斯模型进行垃圾邮件的分类

基于朴素贝叶斯模型进行垃圾邮件的分类一、模型分析贝叶斯方法是一个有着坚实的理论基础的一种方法，而且它在处理很多问题的时候直接而且高效。条件独立性：如果事件x,y对于给定的事件…

人工智能 2023年6月30日
0061
Pycharm创建虚拟环境，conda创建虚拟环境，安装Pytorch

一、在Pycharm里设置虚拟环境在软件的左上角选择：File – Settings – Project: pythonProject – Python Interpreter…

人工智能 2023年7月21日
0097
第七课 TensorFlow实现卷积神经网络

; TensorFlow实现卷积神经网络一本节课程介绍 1.1 知识点 1、卷积神经网络介绍；2、TensorFlow实践CNN网络；二课程内容 2.1 卷积神经网络基本介…

人工智能 2023年5月25日
0091
K210的20种物体分类识别

K210物体20种分类检测文章目录 K210物体20种分类检测前言一、找到模型原型以及固件 * 获得K210对应的机器码获得官方模型二、识别20种不同物体的模型 * 代码…

人工智能 2023年7月12日
00105
【报名中】“图无处不在”系列活动：图数据平台助力出海安全合规

新的一期 Neo4j”图无处不在”关联数据系列活动将于【9 月 14 日星期三】下午举办，现在报名预留观看席位，届时可以通过腾讯会议直接入会。报名后也能第…

人工智能 2023年6月1日
0099
Freesurfer recon-all命令详解及使用示例

一、一些名词解释 atlas 模板，带标签的地图 CA Canonical 典型的，规范的(CA Normalize, CA Register) GCA Gaussian Clas…

人工智能 2023年6月18日
0077
ImportError: cannot import name ‘Literal‘ from ‘typing‘ (D:Anacondaenvstensorflowlibtyping.py)

报错背景：因为安装tensorflow-gpu版本需要，我把原来的新建的anaconda环境（我的名为tensorflow）中的python3.8降为了3.7。在导入seabo…

人工智能 2023年6月17日
0069
Resnet-50网络结构详解

解决的问题：梯度消失，深层网络难训练。因为梯度反向传播到前面的层，重复相乘可能使梯度无穷小。结果就是，随着网络的层数更深，其性能趋于饱和，甚至迅速下降。关于为什么残差结构（即…

人工智能 2023年6月15日
0089

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31