时间序列预测（ARIMA、VAR、回归树）原理

2023年6月17日下午12:18 • 人工智能 • 阅读 95

typora-root-url: …\图

时间序列预测（不包含深度学习）

文章目录

时间序列预测（不包含深度学习）
*
一、单变量预测
–
二、多变量预测
–

一、单变量预测

ARIMA

ARIMA（p，d，q）模型全称为差分自回归移动平均模型，其中 AR是自回归，p是自回归项； MA是移动平均，q是移动平均项数； d是时间序列变得平稳时所做的 差分次数。

原理：将非平稳时间序列转化为平稳时间序列，然后对 因变量的滞后值以及 随机误差项的现值和滞后值进行回归所建立的模型。

1.基本步骤

获取被观测系统时间序列数据；
对数据绘图，观测是否为平稳时间序列；对于非平稳时间序列要先进行d d d 阶差分运算，化为平稳时间序列；
经过第二步处理，已经得到平稳时间序列。要对平稳时间序列分别求得其 自相关系数ACF 和 偏自相关系数PACF ，通过对自相关图和偏自相关图的分析，得到最佳的阶层 p p p 和阶数 q q q；

; （1）自回归模型AR

描述当前值与历史值之间的关系，用变量自身的历史时间数据对自身进行预测

自回归模型必须满足平稳性要求

p阶自回归过程的公式定义：

y t y_t y t 是当前值，μ \mu μ是常数项，P P P是阶数，γ i \gamma_i γi 是自相关系数，ϵ t \epsilon_t ϵt 是误差（符合正态分布）

（P 当前值距p天前值的关系）

（2）移动平均模型MA

移动平均模型关注的是自回归模型中的误差项的累加

q阶自回归过程的公式定义：

; （3）自回归移动平均模型（ARMA)

（4）选择 p p p 和 q q q 的方法

（1）自相关函数ACF（q），偏自相关函数PACF（p）

模型ACFPACFAR§衰减趋于零（几何型或震荡型）P阶后截尾MA(q)q阶后截尾衰减趋于零（几何型或震荡型）ARMA(p,q)q阶后衰减趋于零（几何型或震荡型）p阶后衰减趋于零（几何型或震荡型）

若PACF p阶段后截尾，则截尾的阶数即为模型所确定的参数p

（2）AIC准则，BIC准则

; 2.参数（以Merlion包下ARIMA模型为例）

max_forecast_steps：想要预测的期数

target_seq_index：预测目标的索引

order：（p,d,q）

二、多变量预测

1.VAR

向量自回归模型，简称VAR模型，是AR 模型的推广，是一种常用的计量经济模型。在一定的条件下，多元MA和ARMA模型也可转化成VAR模型。

原理：VAR模型把系统中每一个内生变量作为系统中所有内生变量滞后值的函数来构造模型，从而实现了将单变量自回归模型推广到由多元时间序列变量组成的”向量”自回归模型。

（1）基本步骤

其中，

Y t Y_t Y t 表示 k k k 维内生变量列向量
Y t − i ， i = 1 , 2 , . . . , p Y_{t-i}，i=1,2,…,p Y t −i ，i =1 ,2 ,…,p为滞后的内生变量
X t X_t X t 表示d d d维外生变量列向量，它可以是常数变量、线性趋势项或者其他非随机变量
p p p是滞后阶数
T T T为样本数目
Φ i 即 Φ 1 ， Φ 2 ， . . . ， Φ p \Phi_i即\Phi_1，\Phi_2，…，\Phi_p Φi 即Φ1 ，Φ2 ，…，Φp 为k × k k×k k ×k维的待估矩阵
B B B为k × d k×d k ×d维的待估矩阵
ε t ε_t εt ~N ( 0 , Σ ) N(0,Σ)N (0 ,Σ) 为 k 维白噪声向量，它们相互之间可以同期相关，但不与自己的滞后项相关（ε t ε_t εt 独立同分布，而ε t ε_t εt 中的分量不要求相互独立），也不与上式中右边的变量相关。Σ ΣΣ 是ε t ε_t εt 的协方差矩阵，是一个 k × k k×k k ×k的正定矩阵。

; （2）参数

max_forecast_steps：想要预测的期数

target_seq_index：预测目标的索引

maxlags：AR的最大滞后数

2.回归树

核心：划分点选择 + 输出值确定。

回归树就是将特征空间划分成若干单元，每一个划分单元有一个特定的输出。因为每个结点都是”是”和”否”的判断，所以划分的边界是平行于坐标轴的。对于测试数据，我们只要按照特征将其归到某个单元，便得到对应的输出值。

【例】左边为对二维平面划分的决策树，右边为对应的划分示意图，其中c1,c2,c3,c4,c5是对应每个划分单元的输出。

如现在对一个新的向量(6,6)决定它对应的输出。第一维分量6介于5和8之间，第二维分量6小于8，根据此决策树很容易判断(6,6)所在的划分单元，其对应的输出值为c3。

; （1）基本步骤

[切分点选择：最小二乘法]; [输出值：单元内均值]

假设X和Y分别为输入和输出变量，并且Y是连续变量，给定训练数据集为D = ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x N , y N ) D={(x_1,y_1),(x_2,y_2),…,(x_N,y_N)}D =(x 1 ,y 1 ),(x 2 ,y 2 ),…,(x N ,y N )，其中x i = ( x i ( 1 ) , x i ( 2 ) , . . . , x i ( n ) ) x_i=(x_i^{(1)},x_i^{(2)},…,x_i^{(n)})x i =(x i (1 ),x i (2 ),…,x i (n ))为输入实例（特征向量），n为特征个数，i = 1 , 2 , . . . , N i=1,2,…,N i =1 ,2 ,…,N，N N N为样本容量。

对特征空间的划分采用启发式方法，每次划分逐一考察当前集合中所有特征的所有取值，根据平方误差最小化准则选择其中最优的一个作为切分点。如对训练集中第j j j个特征变量x ( j ) x^{(j)}x (j )和它的取值s，作为切分变量和切分点，并定义两个区域R 1 ( j , s ) = { x ∣ x ( j ) ≤ s } R_1(j,s)={x|x^{(j)}\leq s}R 1 (j ,s )={x ∣x (j )≤s }和R 2 ( j , s ) = { x ∣ x ( j ) > s } R_2(j,s)={x|x^{(j)}>s}R 2 (j ,s )={x ∣x (j )>s }，为找出最优的j j j和s s s，对下式求解

也就是找出使要划分的两个区域平方误差和最小的j j j和s s s。

其中，c 1 c_1 c 1 ，c 2 c_2 c 2 为划分后两个区域内固定的输出值，方括号内的两个min意为使用的是最优的c 1 c_1 c 1 和c 2 c_2 c 2 ，也就是使各自区域内平方误差最小的c 1 c_1 c 1 和c 2 c_2 c 2 ，易知这两个最优的输出值就是各自对应区域内Y Y Y的均值，所以上式可写为

。

（2）示例

下表为训练数据集，特征向量只有一维，根据此数据表建立回归决策树。
x 1 2 3 4 5 6 7 8 9 10 y

5.565.75.916.46.87.058.98.799.05

1) 选择最优切分变量j与最优切分点s：

在本数据集中，只有一个特征变量，最优切分变量自然是x。接下来考虑9个切分点{ 1.5 , 2.5 , 3.5 , 4.5 , 5.5 , 6.5 , 7.5 , 8.5 , 9.5 } {1.5,2.5,3.5,4.5,5.5,6.5,7.5,8.5,9.5}{1 .5 ,2 .5 ,3 .5 ,4 .5 ,5 .5 ,6 .5 ,7 .5 ,8 .5 ,9 .5 }（切分变量两个相邻取值区间[ a i , a i + 1 ) [a^i,a^{i+1})[a i ,a i +1 )内任一点均可），计算每个待切分点的损失函数值：

a. 计算子区域输出值

当s=1.5时，两个子区域R 1 = { 1 } R_1={1}R 1 ={1 },R 2 = { 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 } R_2={2,3,4,5,6,7,8,9,10}R 2 ={2 ,3 ,4 ,5 ,6 ,7 ,8 ,9 ,1 0 }，c 1 = 5.56 c_1=5.56 c 1 =5 .5 6，c 2 = 1 9 ( 5.7 + 5.91 + 6.4 + 6.8 + 7.05 + 8.9 + 8.7 + 9 + 9.05 ) = 7.5 c_2=\frac19 (5.7+5.91+6.4+6.8+7.05+8.9+8.7+9+9.05)=7.5 c 2 =9 1 (5 .7 +5 .9 1 +6 .4 +6 .8 +7 .0 5 +8 .9 +8 .7 +9 +9 .0 5 )=7 .5

同理，得到其他各切分点的子区域输出值，列表如下
1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5c 1 c_1 c 1

5.565.635.725.896.076.246.626.887.11
c 2 c_2 c 2

7.57.737.998.258.548.918.929.039.05

b. 计算损失函数值，找到最优切分点

当s=1.5时，L ( 1.5 ) = ( 5.56 − 5.56 ) 2 + [ ( 5.7 − 7.5 ) 2 + ( 5.91 − 7.5 ) 2 + . . . + ( 9.05 − 7.5 ) 2 ] = 15.72 L(1.5)=(5.56-5.56)^2+[(5.7-7.5)^2+(5.91-7.5)^2+…+(9.05-7.5)^2]=15.72 L (1 .5 )=(5 .5 6 −5 .5 6 )2 +[(5 .7 −7 .5 )2 +(5 .9 1 −7 .5 )2 +…+(9 .0 5 −7 .5 )2 ]=1 5 .7 2

同理，计算得到其他各切分点的损失函数值，列表如下
s 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5

L(s)15.7212.078.365.783.911.938.0111.7315.74

易知，取s = 6.5 s=6.5 s =6 .5时，损失函数值最小。因此，第一个划分点为( j = x , s = 6.5 ) (j=x,s=6.5)(j =x ,s =6 .5 )。

2)用选定的对( j , s ) (j,s)(j ,s ) 划分区域并决定相应的输出值：

划分区域为：R 1 = { 1 , 2 , 3 , 4 , 5 , 6 } , R 2 = { 7 , 8 , 9 , 10 } R_1={1,2,3,4,5,6},R_2={7,8,9,10}R 1 ={1 ,2 ,3 ,4 ,5 ,6 },R 2 ={7 ,8 ,9 ,1 0 }

对应输出值：c 1 = 6.24 , c 2 = 8.91 c_1=6.24,c_2=8.91 c 1 =6 .2 4 ,c 2 =8 .9 1

3) 调用步骤(1),(2)，继续划分：

对R 1 R_1 R 1 ，取切分点{ 1.5 , 2.5 , 3.5 , 4.5 , 5.5 } {1.5,2.5,3.5,4.5,5.5}{1 .5 ,2 .5 ,3 .5 ,4 .5 ,5 .5 }，计算得到单元输出值为
s 1.5 2.5 3.5 4.5 5.5c 1 c_1 c 1

5.565.635.725.896.07
c 2 c_2 c 2

6.376.546.756.937.05

损失函数值为
s 1.5 2.5 3.5 4.5 5.5 L(s)

1.30870.7540.27710.43681.0644

L(3.5)最小，取s=3.5为划分点。后面同理。

4) 生成回归树：

假设两次划分后即停止，则最终生成的回归树为：

Original: https://blog.csdn.net/weixin_48252774/article/details/122453504
Author: 糖
Title: 时间序列预测（ARIMA、VAR、回归树）原理

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/630067/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

iqooneo系统升级好不好_IQOONeo系统测评全新FuntouchOS9十分好用

类DC调光 iQOO Neo系统中还加入了全新的低亮度防屏闪功能(类DC调光)，该技术是通过Dimlayer蒙版算法以及抖动插值算法，来拟合实现调节屏幕亮度的效果。开启低亮度防屏闪…

人工智能 2023年5月27日
00149
python 图像增强算法实现

使用python编写了共六种图像增强算法：1）基于直方图均衡化2）基于拉普拉斯算子3)基于对数变换4)基于伽马变换5)限制对比度自适应直方图均衡化：CLAHE6)retinex-S…

人工智能 2023年6月18日
0079
机器知道哪吒是部电影吗？解读阿里巴巴概念图谱AliCG

概念是人类认知世界的基石。比如对于”哪吒好看吗？”，”哪吒铭文搭配建议”两句话，人可以结合概念知识理解第一个哪吒是一部电影，第二个哪…

人工智能 2023年6月10日
00121
opencv 图像分割与提取(python)

图像分割与提取 * – + * 图像分割与提取 * – 用分水岭算法实现图像分割与提取 – + 算法原理 + 相关函数介绍 + 分水岭算法图像分…

人工智能 2023年5月28日
00106
机器学习之逻辑回归Logistic Regression（python代码实现）

逻辑回归（Logistic Regression）逻辑回归是一个非常经典的算法，用于解决分类问题的机器学习方法，用于估计某种事物的可能性，其有着简单、可并行化、可解释强的特点。逻…

人工智能 2023年7月4日
0065
【OpenCV 例程200篇】81. 频率域高斯低通滤波器

【OpenCV 例程200篇】81. 频率域高斯低通滤波器欢迎关注『OpenCV 例程200篇』系列，持续更新中欢迎关注『Python小白的OpenCV学习课』系列，持续更新…

人工智能 2023年6月20日
0083
机器学习分类算法之支持向量机

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月19日
0085
机器学习之回归模型-梯度下降法求解线性回归

机器学习之回归模型-梯度下降法求解线性回归线性回归是一种线性模型，它假设输入变量x与单个输出变量y之间存在线性关系。具体的说，就是利用线性回归模型，从一组输入变量的线性组合中，计…

人工智能 2023年6月15日
00102
教你用300行Python代码实现一个人脸识别系统

用300行Python代码实现一个人脸识别系统最近又多了不少朋友关注，先在这里谢谢大家。关注我的朋友大多数都是大学生，而且我简单看了一下，低年级的大学生居多，大多数都是为了完成课…

人工智能 2023年7月29日
0078
盲图像超分辨率重建 ( CVPR，2022) (Pytorch)（附代码）

🍊 这篇测评文章用心写了一个下午，个人觉得作为一个初学者入门教程，再合适不过了，敬请查阅 🍊 精选专栏，超分重建-代码环境搭建-知识总结 🍊 博主：墨理，2020年硕士毕业，目前从…

人工智能 2023年5月26日
00120
音频（四) 语谱图 Spectrogram 的分类

1 窗函数窗函数是用语音设计的，窗函数的性质大同小异。这里，以窗函数为分析对象。 [En] The window function is designed in speech, …

人工智能 2023年5月25日
00104
如何在GPU上运行pytorch程序（正确方法）

用GPU跑pytorch程序就3点： 1.申明用GPU 2.把你的model放到GPU上 3.把数据和标签放到GPU上详细步骤： 1.申明： device=torch.devic…

人工智能 2023年7月13日
0086
影像匹配代码，论文：Remote sensing image matching featured by the optimal entropy classification

影像匹配代码最近发表了一篇论文，现在将论文代码进行分享，希望对您的研究有帮助，禁止用于商业用途。欢迎各位前辈，同行使用本文算法进行对比、参考。如果有任何建议，问题、疑问，请联系…

人工智能 2023年6月22日
0098
python之Tkinter详解

Python之Tkinter详解文章目录 Python之Tkinter详解 * 1、Tkinter是什么 2、Tkinter创建窗口 – ①导入 tkinter的库 …

人工智能 2023年7月3日
0088
SRCNN 图像超分辨率重建（tf2）

文章目录前言一、SRCNN 二、SRCNN 实现 * 1.模型的搭建 2.生成训练数据 3.训练过程： 4.测试过程总结前言把由放大缩小的引起的导致分辨率低的图像，转换成…

人工智能 2023年5月26日
00186
Anaconda创建环境及环境配置

Anaconda创建环境及环境配置 1-创建环境 2-激活环境 3-删除环境 4-退出环境 5-注 1-创建环境前情提要：默认你已经安装 _anaconda_的基础上。以下操…

人工智能 2023年6月16日
0090

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31