PyTorch搭建LSTM实现多变量输入多变量输出时间序列预测（多任务学习）

2023年7月20日下午5:45 • 人工智能 • 阅读 57

上面所有文章都是”单变量输出”，虽然某些文章中提到了”多变量”，但这个多变量只是输入多变量，而不是输出多变量。比如我们利用前24个时刻的[负荷、温度、湿度、压强]预测接下来12个时刻的负荷，此时输入为多变量，虽然有多个输出（多步长），但输出的都是同一变量。

那么有没有办法一次性输出多个变量呢？当然是可以的，在前几篇文章的评论中也有人提到了这个问题，当时我给出的回答是：”这样做效果很不好，不建议这么做”。

II. 多变量输入多变量输出

多变量输入自不必说，不了解的可以去看一下前面几篇文章。

多变量输出是指：我们一次性输出多个变量的预测值。比如我们利用前24小时的[负荷、温度、湿度、压强]预测接下来12个时刻的[负荷、温度、湿度、压强]。实际上， 我们可以将多个变量的输出分解开来，看成多个任务，也就是多任务学习，其中每一个任务都是前面提到的多变量输入单变量输出。

具体来讲，假设需要预测四个变量，输出在经过LSTM后得到output，我们将output分别通过四个全连接层，就能得到四个输出。得到四个输出后，我们就可以计算出四个损失函数，对这四个损失函数，本文将其简单求平均以得到最终的损失函数。关于如何组合多任务学习中的损失，已经有很多文献探讨过，感兴趣的可以自行了解。

III. 代码实现

3.1 数据处理

本次实验用到了两个数据集：数据集1包含某个地区的负荷、湿度以及能见度三个特征。数据集2中包含三个地区的负荷值。

数据集1：

数据集2：

依旧使用前24个时刻的三个变量预测后12个时刻的三个变量，数据处理同前面文章一致。

; 3.2 模型搭建

多输入多输出LSTM模型搭建如下：

class LSTM(nn.Module):
    def __init__(self, input_size, hidden_size, num_layers, output_size, batch_size, n_outputs):
        super().__init__()
        self.input_size = input_size
        self.hidden_size = hidden_size
        self.num_layers = num_layers
        self.output_size = output_size
        self.num_directions = 1
        self.n_outputs = n_outputs
        self.batch_size = batch_size
        self.lstm = nn.LSTM(self.input_size, self.hidden_size, self.num_layers, batch_first=True)

        self.fc1 = nn.Linear(self.hidden_size, self.output_size)
        self.fc2 = nn.Linear(self.hidden_size, self.output_size)
        self.fc3 = nn.Linear(self.hidden_size, self.output_size)

    def forward(self, input_seq):

        batch_size, seq_len = input_seq.shape[0], input_seq.shape[1]
        h_0 = torch.randn(self.num_directions * self.num_layers, batch_size, self.hidden_size).to(device)
        c_0 = torch.randn(self.num_directions * self.num_layers, batch_size, self.hidden_size).to(device)

        output, _ = self.lstm(input_seq, (h_0, c_0))
        preds = []
        pred1, pred2, pred3 = self.fc1(output), self.fc2(output), self.fc3(output)
        pred1, pred2, pred3 = pred1[:, -1, :], pred2[:, -1, :], pred3[:, -1, :]

        pred = torch.stack([pred1, pred2, pred3], dim=0)

        return pred

可以看到，由于需要预测三个变量，所以我们在模型中定义了三个全连接层。在得到LSTM的输出后，分别利用三个全连接层得到三个变量的输出，再将三个输出进行拼接，得到最后的pred，pred的shape为：

predict(n_outputs, batch_size, output_size)

其中n_outputs=3，表示一次性预测三个变量，output_size=12表示这里采用了PyTorch搭建LSTM实现多变量多步长时间序列预测（一）：直接多输出中的策略，一次性输出接下来12个时刻的预测值，因为是直接多输出，所以这里pred_step_size=output_size。

3.3 模型训练/测试

模型训练中，经过预测后，我们得到的label和pred的shape分别为：

label(batch_size, n_outputs, pred_step_size)
pred((n_outputs, batch_size, pred_step_size))

由于需要对每一个output计算损失然后相加求平均，所以我们的损失函数求解如下：

total_loss = 0
for k in range(args.n_outputs):
    total_loss = total_loss + loss_function(preds[k, :, :], labels[:, k, :])
total_loss /= preds.shape[0]

即每次都取出一个output进行计算求和再平均。

3.4 实验结果

数据集1中包含的是某个地区的负荷、湿度以及能见度三个特征，其预测结果如下所示：

变量负荷湿度能见度MAPE9.76%6.44%8.49%

数据集2中包含三个地区的负荷值：

变量负荷1负荷2负荷3MAPE5.37%8.89%6.29%

观察上述结果我们可以发现，数据集2上的预测效果明显更好，这可能是因为 三个负荷变量之间相关性较强。

; IV. 源码及数据

后面将陆续公开~

Original: https://blog.csdn.net/Cyril_KI/article/details/125242049
Author: Cyril_KI
Title: PyTorch搭建LSTM实现多变量输入多变量输出时间序列预测（多任务学习）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/705425/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

使用计算机视觉和深度学习创建现代 OCR 管道

文章目录 * – 研究和原型设计 – 字深网 – 字检测器 – 组合式端到端系统 – 生产化 – 性能调优 …

人工智能 2023年6月16日
0077
iOS15更新体验报告

苹果公司在WWDC2021开发者大会上公布了iOS15系统，介绍了众多新系统的功能和优化，我们来看下iOS15系统主要有哪些变化和更新。 1、FaceTime视频通话 FaceTi…

人工智能 2023年5月25日
0099
数据分析-回归-案例-波士顿房价数据集

@数据分析-回归-波士顿房价数据集数据来源： 1、目标 2、数据集介绍 3、代码 3.1 导入必须的工具包 3.2 导入数据 3.3 数据探索 3.4 数据集划分 3.5 模型构…

人工智能 2023年6月12日
0075
Swin-Transformer-Object-Detection 配置与训练自己的数据集（踩坑）

官方Swin Transformer 目标检测训练流程 * – 一、环境配置 – + 1. 矩池云相关环境租赁 + 2. 安装pytorch及torchvi…

人工智能 2023年7月9日
0082
vue知识图谱可视化_知识图谱(节点关系图)-echarts实现方案

前言最近项目需求,要做一个知识图谱,参照为思知.然后就去看了一下效果及他的实现方案,也找了其他的方案,对比之后发现echarts的关系图实现起来比较简单,于是乎就基于echart…

人工智能 2023年6月1日
0066
使用halcon实现基于深度学习的目标检测

0、所需了解的知识数据集数据集的类别已有不需要另外指定，这是因为在读取之前已有数据集的时候，数据集中就会包含了许多数据，其中结构如下：包括类别序号以及类别名字预训练模型或者…

人工智能 2023年7月9日
00105
linux系统中-bash: python: command not found解决方法

第一次使用ubantu系统运行，记录一下出现的问题以及如何解决刚开始运行代码，就报错了 -bash: python: command not found 本来想用pip查看一下已…

人工智能 2023年7月6日
00101
如何激活conda环境？conda创建新环境步骤教程

如何激活conda环境？针对这个问题，本教程将手把手按照创建、激活、查看活跃的环境三个步骤教大家conda创建新环境。如何激活conda环境步骤一：创建 conda creat…

人工智能 2023年7月5日
0060
MMdet的Resnet卷积替换成Ghost卷积组所出现的问题

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月9日
0067
tensorflow serving过程及线上预测碰到的一些神经网络相关问题

一.安装docker 安装教程很多，例如可参考docker官网：https://docs.docker.com/install/linux/docker-ce/centos/ su…

人工智能 2023年5月24日
0087
机器学习（一）——聚类

文章目录 1. 聚类任务 2. 性能度量 * 2.1 外部指标 2.2 内部指标 3. 距离计算 * 3.1 有序属性 3.2 无序属性 3.3 混合属性 4. 原型聚类 * 4….

人工智能 2023年5月31日
0084
RK1808 计算棒使用（主动模式）

文章目录 RK1808 计算棒使用（主动模式） * 一、主动模式流程二、上位机连接 RK1808 – 2.1 RK1808 虚拟网口连接 2.2 RK1808 外网访…

人工智能 2023年7月14日
00118
OpenCV python（二）图像预处理：改变图像大小 && 提取感兴趣区域

OpenCV python（二）图像预处理：改变图像大小 && 提取感兴趣区域一、改变图像大小 * 1、获取图像宽、高、通道数 2、resize函数 3、案例二…

人工智能 2023年6月17日
0062
Outlier Detection Based on Fuzzy Rough Granules in Mixed Attribute Data论文精读

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月17日
0076
科比，老大1000天

不知不觉，老大已经走了1000天了，正好这个星期的数据分析的课就是科比投篮可视化，让我一起来分享一下吧。对照列表机翻,仅供参考 action_type 进攻方式（更具体） com…

人工智能 2023年7月6日
0063
Git 的基本使用

基础操作 1.选择一个合适的地方，创建一个新目录 mkdir learngit cd learngit 2.通过 git init命令把这个目录变成Git可以管理的仓库 git i…

人工智能 2023年6月4日
0059

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

PyTorch搭建LSTM实现多变量输入多变量输出时间序列预测（多任务学习）

目录

3.1 数据处理

; 3.2 模型搭建

3.3 模型训练/测试

3.4 实验结果

大家都在看