时空图卷积网络:一种用于交通预测的深度学习框架

由于交通流的高度非线性和复杂性,传统方法不能满足中长期预测任务的要求,其往往忽略了空间和时间依赖性。在本文中,我们提出了一种新的深度学习框架,时空图卷积网络(STGCN),以解决交通领域的时间序列预测问题(即交通预测)。我们不使用正则卷积和循环单元,而是在图上描述问题,并建立具有完整卷积结构的模型,这使得训练速度更快,参数更少。该体系结构包括几个时空卷积块,它们是图形卷积层和卷积序列学习层的组合,用于建模空间和时间依赖性。这在交通研究中首次应用纯卷积结构从图形结构的时间序列中同时提取时空特征。

交通研究中,交通流的基本变量,即速度、交通量和密度,通常被选为监测交通状况的当前状态的和预测未来的指标。根据预测的长度,交通预测通常分为两个尺度:短期(5∼ 30分钟),中长期(超过30分钟)。大多数流行的统计方法(例如,线性回归)都能很好地进行短期预测。然而,由于交通流的不确定性和复杂性,这些方法对于相对长期的预测效果较差。

之前的中长期交通预测研究大致可以分为两类:动态建模和数据驱动方法。动态建模:使用数学工具(如微分方程)和物理知识,通过计算模拟来描述交通问题。为了达到稳定状态,模拟过程不仅需要复杂的系统编程,还需要消耗大量的计算能力。型中不切实际的假设和简化也会降低预测精度。因此,随着交通数据收集和存储技术的快速发展,大量研究人员将注意力转移到数据驱动的方法上。

经典统计模型和机器学习模型是数据驱动方法的两个主要代表。时间序列分析中,ARIMA及其变体是基于经典统计学的最综合的方法之一。受到时间序列平稳假设的限制,也没有考虑时空相关性。因此,这些方法对于高度非线性交通流的表达性受限。近年来,经典统计模型在交通预测任务中受到了机器学习方法的有力挑战。这些模型,如k近邻算法(KNN)、支持向量机(SVM)和神经网络(NN),可以实现更高的预测精度和更复杂的数据建模。近年深度学习相关工作取得了重大进展,但这些密集网络很难从输入中联合提取时空特征,此外,在狭隘的限制甚至完全没有空间属性的情况下,这些网络的代表能力将受到严重阻碍。

为了充分利用空间特征,使用卷积神经网络(CNN)捕捉交通网络之间的相邻关系,同时在时间轴上使用递归神经网络(RNN)。用于序列学习的循环网络需要迭代训练,这将逐步引入误差累积。此外,基于RNN的网络(包括LSTM)众所周知难以训练且计算量大。

为了克服这些问题,我们引入了几种策略来有效地建模交通流的时间动态和空间依赖性。为了充分利用空间信息,我们通过一个通用图来建模交通网络,而不是单独处理它(例如网格或线段)。为了解决递归网络的固有缺陷,我们在时间轴上采用了完全卷积结构。

交通量预测是一个典型的时间序列预测问题,即给定之前的M个交通量观测值,预测下一个H时间步中最可能的交通量测量值(例如速度或交通流)。

时空图卷积网络:一种用于交通预测的深度学习框架

时空图卷积网络:一种用于交通预测的深度学习框架

图上的卷积

时空图卷积网络:一种用于交通预测的深度学习框架

时空图卷积网络:一种用于交通预测的深度学习框架

本文所提模型

网络架构,将详细介绍提出的时空图卷积网络(STGCN)的架构。STGCN由几个时空卷积块组成,每个时空卷积块形成一个”三明治”结构,两个门控序列卷积层和中间一个空间图卷积层

时空图卷积网络:一种用于交通预测的深度学习框架

时空图卷积网络:一种用于交通预测的深度学习框架

图卷积网络用于提取空间特征。

交通网络通常组织为图结构,用数学方法将道路网络表示为图。之前的研究忽略了交通网络的空间属性:网络的连通性和全局性被忽略,因为它们被分割成多个段或网格。我们的模型中,图卷积直接用于图结构数据,以提取空间域中具有高度意义的模式和特征。由于图的Fourier基的O(n2)复杂度乘法,公式(2)计算图卷积中的核Θ可能会很昂贵,有两种近似策略用于克服这个问题。

切比雪夫多项式逼近

时空图卷积网络:一种用于交通预测的深度学习框架

一阶近似

时空图卷积网络:一种用于交通预测的深度学习框架

在垂直方向上应用一阶近似的图卷积堆栈,获得与K局部卷积水平方向相似的效果,所有这些卷积都利用了来自中心节点的(K−1)阶邻域的信息,在这种情况下,K是模型中连续过滤操作或卷积层的数量。此外,分层线性结构对于大型图来说是参数经济且高效的,因为近似的阶数仅限于一

图卷积的推广

时空图卷积网络:一种用于交通预测的深度学习框架

用于提取时间特征的门控CNN

基于RNN的模型在时间序列分析中得到了广泛应用,但用于交通预测的循环网络仍然存在耗时的迭代、复杂的门机制以及对动态变化的缓慢响应等问题。相反,CNN具有训练速度快、结构简单、与之前步骤没有依赖性约束的优势。我们采用时间轴上的整个卷积结构来捕捉交通流的时间动态行为。这种特殊的设计允许通过多层卷积结构形成分层表示,从而实现并行和可控的训练过程。

时间卷积层含一个带有宽度为Kt的核的1-D因果卷积,后跟门控线性单元(GLU)作为非线性(右)。对于图G中的每个节点,时间卷积在没有填充的情况下探索输入元素的Kt个邻居,导致每次将序列长度缩短Kt-1。每个节点的时间卷积输入可以被视为一个长度为M带有Ci个通道的序列,

时空图卷积网络:一种用于交通预测的深度学习框架

时空图卷积网络:一种用于交通预测的深度学习框架

时空图卷积网络:一种用于交通预测的深度学习框架

时空卷积块

为了融合时空域的特征,构造时空卷积块(ST Conv块)来联合处理图形结构的时间序列。根据特定情况的规模和复杂性,区块本身可以堆叠或延伸。中间的空间层是连接两个时间层的桥梁,可以实现从通过时间卷积的来自图卷积的快速空间状态传播(中)。”三明治”结构还有助于网络充分应用瓶颈策略,通过图卷积层对通道C进行降尺度和升尺度,实现尺度压缩和特征压缩。此外,在每个ST-Conv块中使用层标准化来防止过度拟合。

时空图卷积网络:一种用于交通预测的深度学习框架

时空图卷积网络:一种用于交通预测的深度学习框架

时空图卷积网络:一种用于交通预测的深度学习框架

总结:STGCN是处理结构化时间序列的通用框架,可处理一般的时空序列学习任务。时空块结合了图卷积和门控时间卷积,可以提取空间特征,并连贯地捕获时间特征。模型完全由卷积结构组成,因此能够以较少的参数和较快的训练速度实现对输入的并行化。

Original: https://blog.csdn.net/stranger_Ss/article/details/124647550
Author: stranger_Ss
Title: 时空图卷积网络:一种用于交通预测的深度学习框架

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/532545/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球