基于pytorch搭建多特征LSTM时间序列预测代码详细解读（附完整代码）

2023年7月3日下午4:21 • 人工智能 • 阅读 91

文章目录

LSTM时间序列预测
*
数据获取与预处理
模型构建
训练与测试

LSTM时间序列预测

对于LSTM神经网络的概念想必大家也是熟练掌握了，所以本文章不涉及对LSTM概念的解读，仅解释如何使用 pytorch使用LSTM进行时间序列预测，复原使用代码实现的全流程。

数据获取与预处理

首先预览一下本次实验使用的数据集，该数据集共有三个特征，将最后一列的压气机出口温度作为标签预测（该数据集是我在git上收集到的）

定义一个xls文件读取的函数，其中data.iloc()函数是将dataframe中的数据进行切片，返回数据和标签


def get_Data(data_path):

    data=pd.read_excel(data_path)
    data=data.iloc[:,:3]
    label=data.iloc[:,2:]
    print(data.head())
    print(label.head())
    return data,label

使用sklearn中的preprocessing模块中的归一化函数对数据进行归一化处理，其中data=data.values函数是将dataframe中的数据从pd格式转换np数组，删除轴标签，fit_transform函数是fit（）和transform（）的组合，是将fit和transform合并，一步到位的结果，最后返回data，label和归一化的标签值


def normalization(data,label):

    mm_x=MinMaxScaler()
    mm_y=MinMaxScaler()
    data=data.values
    label=label.values
    data=mm_x.fit_transform(data)
    label=mm_y.fit_transform(label)
    return data,label,mm_y

我们将数据进行归一化之后，数据是np数组格式，我们需要将其转换成向量的格式存储在列表当中，因此，先创建两个空列表，建立一个for循环将预处理过的数据最后按x.size(0),seq_length,features）的纬度输出至列表当中。其中seq_length代表的是时间步长，x.size(0)则表示的是数据的第一维度，features代表的是数据的特征数。打印x,y的维度并返回x,y。


def split_windows(data,seq_length):

    x=[]
    y=[]
    for i in range(len(data)-seq_length-1):
        _x=data[i:(i+seq_length),:]
        _y=data[i+seq_length,-1]
        x.append(_x)
        y.append(_y)
    x,y=np.array(x),np.array(y)
    print('x.shape,y.shape=\n',x.shape,y.shape)
    return x,y

将数据和标签都准备好之后即可分离数据，将数据分离成训练集和测试集。定义split_data()函数，其中split_ratio是设定的测试集比例，本次实验设置的训练集与测试集之比为9:1，即split_ratio=0.1。将分离好的数据分别装入Variable中封装好，并且将array转换成tensor格式，得到测试集和训练集。注意，一定要使用Variable函数对数据集进行封装，否则不支持后面torch的迭代。


def split_data(x,y,split_ratio):

    train_size=int(len(y)*split_ratio)
    test_size=len(y)-train_size

    x_data=Variable(torch.Tensor(np.array(x)))
    y_data=Variable(torch.Tensor(np.array(y)))

    x_train=Variable(torch.Tensor(np.array(x[0:train_size])))
    y_train=Variable(torch.Tensor(np.array(y[0:train_size])))
    y_test=Variable(torch.Tensor(np.array(y[train_size:len(y)])))
    x_test=Variable(torch.Tensor(np.array(x[train_size:len(x)])))

    print('x_data.shape,y_data.shape,x_train.shape,y_train.shape,x_test.shape,y_test.shape:\n{}{}{}{}{}{}'
    .format(x_data.shape,y_data.shape,x_train.shape,y_train.shape,x_test.shape,y_test.shape))

    return x_data,y_data,x_train,y_train,x_test,y_test

将封装好的训练集和测试集装入torch支持的可迭代对象torch.utils.data.DataLoader中，num_epochs是计算得到的迭代次数，返回train_loader,test_loader,num_epochs，这样，数据集就预处理好了，可以进行模型的搭建了。


def data_generator(x_train,y_train,x_test,y_test,n_iters,batch_size):

    num_epochs=n_iters/(len(x_train)/batch_size)
    num_epochs=int(num_epochs)
    train_dataset=Data.TensorDataset(x_train,y_train)
    test_dataset=Data.TensorDataset(x_test,y_test)
    train_loader=torch.utils.data.DataLoader(dataset=train_dataset,batch_size=batch_size,shuffle=False,drop_last=True)
    test_loader=torch.utils.data.DataLoader(dataset=test_dataset,batch_size=batch_size,shuffle=False,drop_last=True)

    return train_loader,test_loader,num_epochs

模型构建

使用torch构建模型无非就是定义一个类，在这个类中定义一个模型实例和前向传播函数，就这么简单，接下来让我们来看看。


class Net(nn.Module):
    def __init__(self,input_size,hidden_size,num_layers,output_size,batch_size,seq_length) -> None:
        super(Net,self).__init__()
        self.input_size=input_size
        self.hidden_size=hidden_size
        self.num_layers=num_layers
        self.output_size=output_size
        self.batch_size=batch_size
        self.seq_length=seq_length
        self.num_directions=1

        self.lstm=nn.LSTM(input_size=input_size,hidden_size=hidden_size,num_layers=num_layers,batch_first=True)
        self.fc=nn.Linear(hidden_size,output_size)

    def forward(self,x):

        batch_size, seq_len = x.size()[0], x.size()[1]
        h_0 = torch.randn(self.num_directions * self.num_layers, x.size(0), self.hidden_size)
        c_0 = torch.randn(self.num_directions * self.num_layers, x.size(0), self.hidden_size)

        output, _ = self.lstm(x, (h_0, c_0))
        pred = self.fc(output)
        pred = pred[:, -1, :]
        return pred

首先定义一个实例，其中包括必须参数input_size,hidden_size,num_layers,output_size,batch_size,seq_length。将self.num_directions设置为1代表这是一个单项的LSTM，然后再添加一个lstm层和一个全连接层fc，lstm层输入维度为(input_size=input_size,hidden_size=hidden_size,num_layers=num_layers)，设置了,batch_first=True则代表shape=（batch_size，seq_size,hidden_size），fc层的参数为(hidden_size,output_size)，返回pred

训练与测试

训练模型，初始化i,(batch_x, batch_y)，将train_loader设置为枚举类型，optimizer.zero_grad() 代表将每次传播时的梯度累积清除，torch中如果不声明optimizer.zero_grad()则会一直累积计算梯度，设置每100次输入打印一次损失


iter=0
for epochs in range(num_epochs):
  for i,(batch_x, batch_y) in enumerate (train_loader):
    outputs = moudle(batch_x)
    optimizer.zero_grad()

    loss = criterion(outputs,batch_y)
    loss.backward()
    optimizer.step()
    iter+=1
    if iter % 100 == 0:
      print("iter: %d, loss: %1.5f" % (iter, loss.item()))

最后几次损失如下

iter: 2400, loss: 0.00331
iter: 2500, loss: 0.00039
...

iter: 4400, loss: 0.00332
iter: 4500, loss: 0.00022
iter: 4600, loss: 0.00380
iter: 4700, loss: 0.00032

将最后训练集和测试集的MAE/RMSE画出，得到最终结果。

def result(x_data, y_data):
  moudle.eval()
  train_predict = moudle(x_data)

  data_predict = train_predict.data.numpy()
  y_data_plot = y_data.data.numpy()
  y_data_plot = np.reshape(y_data_plot, (-1,1))
  data_predict = mm_y.inverse_transform(data_predict)
  y_data_plot = mm_y.inverse_transform(y_data_plot)

  plt.plot(y_data_plot)
  plt.plot(data_predict)
  plt.legend(('real', 'predict'),fontsize='15')
  plt.show()

  print('MAE/RMSE')
  print(mean_absolute_error(y_data_plot, data_predict))
  print(np.sqrt(mean_squared_error(y_data_plot, data_predict) ))

result(x_data, y_data)
result(x_test,y_test)

最终结果：训练集：MAE/RMSE：35.114613\75.8706
测试集：MAE/RMSE:213.30313\213.31061
本文仅作示范pytorch构建lstm的用法，预测结果不是很准确，像dropout等都没加，仅供参考。
完整代码见我的github:https://github.com/Tuniverj/Pytorch-lstm-forecast

Original: https://blog.csdn.net/hardworking_T/article/details/126673957
Author: 小一爱吃梨
Title: 基于pytorch搭建多特征LSTM时间序列预测代码详细解读（附完整代码）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/667928/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

修改jupyter notebook的默认路径

前言由于不想占用C盘空间，所以想修改jupyter notebook的默认路径，第一次打开anaconda中自带的jupyter notebook，默认路径都是C:\Users…

人工智能 2023年7月16日
0056
Selenium被检测为爬虫，怎么屏蔽和绕过

Selenium 操作被屏蔽使用selenium自动化网页时，有一定的概率会被目标网站识别，一旦被检测到，目标网站会拦截该客户端做出的网页操作。比如淘宝和大众点评的登录页，当手…

人工智能 2023年7月4日
0068
10分钟搞定miniconda-python环境安装

windows配置python环境每次到一个新电脑就要安装环境，很多包安装起来很麻烦，下面对安装地址和常规使用包做了总结，一键安装所有包不用再一个一个找了！所有问题10分钟搞定！…

人工智能 2023年7月21日
0065
Jetson nano到底是个怎样的产品？（Jetson nano性能如何）

AI新维度 Jetson Nano 模块的大小仅为 70 x 45mm，比一张信用卡还小。而在为多个行业（包括智慧城市、智慧工厂，以及农业和机器人）的边缘设备部署 AI 时，此支持…

人工智能 2023年6月4日
0058
SAS常用函数

SAS函数是一个子程序，对自变量返回一个结果值。SAS函数的基本形式：y=函数名(X1,X2,…)，其中X1,X2…为参数值易混淆的概念字符—chara…

人工智能 2023年7月15日
0070
3. 5种常见卷积论文、解读、使用方法、实现代码整理（conv）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月26日
0051
Spark学习:如何在DataFrame上做数据处理?

·对于在DataFrame上的数据处理,SparkSql支持两种:一类是Sql;另一类是DataFrame开发算子一、Sql语句对于任意的DataFrame，都可以使用create…

人工智能 2023年7月8日
0052
Python快速刷题网站——牛客网数据分析篇（二）

👦👦一个帅气的boy，你可以叫我Love And Program🖱 ⌨个人主页：Love And Program的个人主页💖💖如果对你有帮助的话希望三连💨💨支持一下博主 pytho…

人工智能 2023年6月11日
0092
yolov7 网络架构深度解析

在美团yolov6刚出来不到一个月，yolov4的官方人马yolov7带着论文和代码高调现身，迅速霸屏，膜拜下速度和精度：四个字”多快好省”， yolov7…

人工智能 2023年7月29日
00111
动态SLAM论文归纳

持续更新，持续更新基于视觉的移动平台运动目标检测 [2018]Detect-SLAM_ Making Object Detection and SLAM Mutually Ben…

人工智能 2023年7月28日
0051
在Recognition算法中，常见的特征提取方法有哪些

特征提取方法在Recognition算法中的作用在Recognition算法中，特征提取方法起着十分重要的作用。它们能够将原始数据转化为特征向量，这样就可以用来表示不同的目标或者…

人工智能 2024年1月3日
0051
YOLOv5s的模型训练与使用(纯小白入门)

YOLOv5s的模型训练与使用(纯小白入门) 文章目录 YOLOv5s的模型训练与使用(纯小白入门) * 概要下载yolov5与安装依赖训练检测 – 检测图片实…

人工智能 2023年7月22日
0059
基于TensorFlow卷积神经网络与MNIST数据集设计手写数字识别算法

随着数字化的普及和信息技术的发展，在编号处理、数量读取、价格统计等场合，手写数字识别系统的应用需求越来越强烈，如何将数字方便、快速地输入到计算机中已成为关系到计算机技术普及的关键问…

人工智能 2023年5月25日
0074
Matlab内置的柱状图函数bar使用方法

标题：Matlab内置的柱状图函数bar使用方法在2019年9月发布的《在Matlab中使用barweb绘制带方差的分组柱状图时的几个注意事项》中介绍了由第三方编写的barweb…

人工智能 2023年6月21日
0083
ConvNet—20年代的卷积神经网络

A ConvNet for the 2020s 摘要 1. 引言 2. ConvNet 现代化：路线图 * 2.1 训练技巧 2.2 宏观设计 2.3 ResNeXt-ify 2….

人工智能 2023年7月27日
0049
Nature子刊：一个从大脑结构中识别阿尔茨海默病维度表征的深度学习框架

脑部疾病的异质性是精准诊断/预后的一个挑战。作者描述并验证了一种名为Smile-GAN（SeMI-supervised cLustEring-Generative Adversar…

人工智能 2023年6月16日
0073

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

基于pytorch搭建多特征LSTM时间序列预测代码详细解读（附完整代码）

文章目录

数据获取与预处理

模型构建

训练与测试

大家都在看