论文阅读2–《融合多因素的短时交通流预测研究》

1.问题的提出

现有的交通流预测研究大多为常态下的预测,而未考虑天气、节假日等外部因素的影响。

2.交通流预测相关工作

(1)传统的短时交通流研究方法:
卡尔曼滤波模型、历史平均模型、时间序列模型、非参数回归模型、混沌理论模型等。
缺点: 交通流受多种外部因素的影响,交通流数据具有随机性和不确定性,传统的模型普遍存在实时性差、预测精度不高的问题。

(2)组合模型的预测:
将两种模型的优点结合起来提高短时交通流的预测准确率。
a.卷积神经网络+支持回归分类器:提高了准确率
但是未充分考虑外部因素对交通流预测的影响

b. 混沌理论+模拟退火算法:优化了相关向量机的核心参数
但是没有考虑交通流数据的随机性

c. 通过异常值识别扩展了卡尔曼滤波,使其能对噪声进行识别和过滤,但其对交通流特征挖掘不充分

(3)LSTM的加入
LSTM在特征提取上具有强大的鲁棒性和灵活性,不仅能提取交通流的时序特征,还能将随机外部因素纳入考虑
深度双向长短时记忆网络模型:在时空特征提取上具有独特的优势,却忽略了相邻路段交通流的影响
LSTM+注意力机制:提高了交通流预测精度,但考虑因素单一

本文结合天气、节假日等因素对交通流特征进行分析,选择长短时记忆网络(LSTM)并引入注意力机制对短时交通流进行预测

3.相关理论

(1)循环神经网络(RNN)
RNN可以随着时间的变化动态的调整自身的网络状态不断进行循环传递,并且还可以接受广泛的序列信息作为输入。
但是RNN会随着循环神经网络模型的规模的增大,对序列数据的记忆能力会下降,当序列信号在神经网络经过多次传递后,会使网络丧失链接先前信息的能力,从而引起梯度消失或者梯度爆炸。

为了保存长期序列信息,减少随着时间传播而衰减的信息,于是LSTM诞生了。

(2)长短时记忆网络(LSTM)
LSTM引入门控机制来控制信息传递的路径,门的作用是允许LSTM的记忆单元存储和访问序列信息,从而减少梯度消失问题。有输入门、遗忘门和输出门。
输入门:如果输入门保持关闭(即激活函数接近0),则新的输入不会进入网络,网络中的记忆单元会一直保持开始的激活状态。通过对输入门的开关控制,可以控制循环神经网络模型什么时候接受新的数据、什么时候拒绝新的数据接入,于是梯度信息就随时间的传递而被保留下来了。
遗忘门:用于控制记忆单元是否记住或丢弃之前的状态
输出门:决定记忆单元中哪些信息允许被输出

(3)注意力机制
通过模拟人脑注意力的特点,以概率分布的思想捕捉关键信息,注意力机制能够专注于局部信息,对一些不必要的信息忽略不计。
在交通流预测中,考虑到交通流量会受到天气、节假日等各种外部因素的影响,这些外部因素对预测时间交通流量的影响程度不同,因此本文引入注意力机制层来自动捕获不同输入特征,以概率分布的思想对重要的信息分布足够的权重,以此来提升交通流的预测精度。

4.本文模型

融合多因素的短时交通里预测模型

(1)交通流特性

a.周期性:具有一定的规律,周一到周五期间,有明显的上下班高峰,相较于周六周日交通流波动较大,周六、周日的交通状态则较为平缓。
b.时空特性:当前t时刻的交通流不仅受前一段时间交通流量的影响,还受当前时刻不同路段交通流量的影响。
c.受天气的影响:天气因素影响着人们的出行率,暴雨、暴雪、沙尘暴等恶劣天气期间,道路情况不确定,路面由于恶劣天气造成结冰、能见度低等,这时交通流量会骤减;中雨、中雪的情况下,会影响一部分交通流量;小雨、小雪对交通流量的影响较小。本文根据天气情况将天气状态量化如下:

论文阅读2--《融合多因素的短时交通流预测研究》
d.节假日期间,交通流数据具有明显的波动。本文将节假日状态量化如下:
论文阅读2--《融合多因素的短时交通流预测研究》

; (2)数据集的构造

将采集到的原始数据(交通流数据和天气数据)进行预处理,包括数据缺失值的补全、去噪和标准化。将预处理后的数据构造数据集,作为训练模型的输入,模型的参数设置如表1所示。

论文阅读2--《融合多因素的短时交通流预测研究》
式中,w表示不同天气状态下的数据,1表示严重,2表示重度,3表示轻度,4表示无影响,h表示是否为节假日,0表示工作日,1表示节假日

(3)交通流数据空间特征的提取

论文阅读2--《融合多因素的短时交通流预测研究》
那么S个监测点T个时刻的交通流量输入矩阵为:
论文阅读2--《融合多因素的短时交通流预测研究》
利用卷积神经网络(CNN)根据历史数据提取交通流的空间特性,本文采用2层的交通卷积网络,使用卷积层来提取交通流数据的局部特征,为了保留交通流原始数据的真实性,本文仅用CNN的卷积层对数据进行特征提取,不用池化层压缩数据,卷积核的大小设置为3

; (4)结合注意力机制的短时交通流预测

(Attention-based CNN-LSTM,CLA)

论文阅读2--《融合多因素的短时交通流预测研究》
CLA有四层结构。
第一层:利用卷积神经网络(CNN)提取交通流的空间特性
第二层:利用长短时记忆网络(LSTM)提取交通流的时间特性
第三层:将提取到的时空特性结合外部因素引入注意力机制
第四层:综合交通流量的特征分析,使用全连接层进行预测

5.实验结果与分析

(1)数据集:
交通流数据:采用加拿大Whitemud Drive 高速公路开放数据进行实力分析
天气数据:本文选取的数据来源于埃德蒙顿城市气象观测中心,数据记录了每日气温、天气状况、降雨量、降雪量、风速等
(2)评价指标:
采取均方根误差(RMSE)
平均绝对误差(MAE)
平均绝对百分比误差(MAPE)
当预测值与真实值完全吻合时,RMSE、MAE、MAPE的值为0,称之为完美模型,值越大,则表示预测值与真实值的误差越大。
(3)实验结果:

论文阅读2--《融合多因素的短时交通流预测研究》

变体模型预测结果对比分析
选取了未引入注意力机制的CLA-ATTN模型及 未引入多因素的CLA-MFACTOR模型进行对比

论文阅读2--《融合多因素的短时交通流预测研究》

; 结论

本文使用公开数据集,融合多种外部因素并引入注意力机制,对每个影响交通流量潜在因素或特征的重要程度进行区分,并与传统及变体模型的预测结果进行对比,发现本文所提出的模型与传统模型相比具有比较好的预测效果。

展望

虽然本文所提出的模型提高了预测准确率,但模型在引入注意力机制分配权重时,需要计算每一个输入特征的权重,会消耗大量的计算资源,未来的研究工作应进一步考虑这些因素以提高交通流的预测效率。

Original: https://blog.csdn.net/weixin_43217572/article/details/120482939
Author: 红心柚大果
Title: 论文阅读2–《融合多因素的短时交通流预测研究》

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/544858/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球