【数值预测案例】(3) LSTM 时间序列电量预测，附Tensorflow完整代码

2023年6月16日下午2:06 • 人工智能 • 阅读 58

大家好，今天和各位分享一下如何使用循环神经网络LSTM完成时间序列预测， 本文是针对单个特征的预测，下一篇是对多个特征的预测。文末有完整代码

1. 导入工具包

这里使用GPU加速计算，加快网络的训练速度。

import tensorflow as tf
from tensorflow import keras
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings('ignore')
调用GPU加速
gpus = tf.config.experimental.list_physical_devices(device_type='GPU')
for gpu in gpus:
    tf.config.experimental.set_memory_growth(gpu, True)

2. 获取数据集

数据集有需要的自取：https://pan.baidu.com/s/1uWW7w1Ci04U3d8YFYPf3Cw 提取码：00qw

借助pandas库读取电量时间序列数据，两列特征数据，时间和电量

#（1）获取数据，按时间间隔1h记录的电力数据
filepath = 'energy.csv'
data = pd.read_csv(filepath)
print(data.head())

【数值预测案例】(3) LSTM 时间序列电量预测，附Tensorflow完整代码

3. 数据预处理

由于是基于时间序列的预测， 将数据中的索引变成时间，取AFP电量特征列作为训练的特征。

由于原始数据最大值和最小值之间相差较大，为了避免数据影响网络训练的稳定性， 对训练用的特征数据进行标准化处理。

#（3）选择特征
temp = data['AEP_MW'] # 获取电力数据
temp.index = data['Datetime'] # 将索引改为时间序列
temp.plot()  # 绘图展示

#（4）对训练集预处理
temp_mean = temp[:train_num].mean()  # 均值
temp_std = temp[:train_num].std()  # 标准差
标准化
inputs_feature = (temp - temp_mean) / temp_std

绘制原始数据分布图

4. 划分数据集

首先，需要 通过时间序列滑动窗口选择特征值及其对应的标签值。比如对某一时间点预测，规定每20个特征值，预测得到一个标签值。由于只有一列特征数据，相当于， 用前20个数据预测第21个数据。同理对某一时间片段预测，用第1到20个数据预测第21到30的电量。

#（2）构建时间序列采样函数
'''
dataset为输入的特征数据，选取用哪些特征
start_index 这么多数据选择从哪个开始，一般从0开始取序列
history_size表示时间窗口大小；若为20，代表从起始索引开始找20个样本当作x，下一个索引当作y
target_size表示需要预测的结果时窗口后的第几个时间点；0表示下一时间点的预测结果，取其当作标签；若为一个序列，预测一个序列的指标
indices=range(i, i+history_size) 代表窗口序列的索引，i表示每个窗口的起始位置，窗口中所有数据的索引
'''
def database(dataset, start_index, end_index, history_size, target_size):
    data = []  # 存放特征值
    labels = []  # 存放目标值

    # 初始的取值片段[0:history_size]
    start_index = start_index + history_size

    # 如果不指定特征值终止索引，就取到最后一个分区前
    if end_index is None:
        end_index = len(dataset) - target_size

    # 遍历整个电力数据，取出特征及其对应的预测目标
    for i in range(start_index, end_index):
        indices = range(i - history_size, i) # 窗口内的所有元素的索引
        # 保存特征值和标签值
        data.append(np.reshape(dataset[indices], (history_size, 1)))
        labels.append(dataset[i+target_size]) # 预测未来几个片段的天气数据
    # 返回数据集
    return np.array(data), np.array(labels)

接下来就可以在原始数据集中划分 训练集、验证集、测试集， 分别占比 90:9.8:0.2

取前90%个数据作为训练集
train_num = int(len(data) * 0.90)
90%-99.8%用于验证
val_num = int(len(data) * 0.998)
最后1%用于测试

#（5）划分训练集和验证集
窗口为20条数据，预测下一时刻气温
history_size = 20
target_size=0

训练集
x_train, y_train = database(inputs_feature.values, 0, train_num,
                            history_size, target_size)

验证集
x_val, y_val = database(inputs_feature.values, train_num, val_num,
                          history_size, target_size)

测试集
x_test, y_test = database(inputs_feature.values, val_num, None,
                          history_size, target_size)

查看数据信息
print('x_train.shape:', x_train.shape)  # x_train.shape: (109125, 20, 1)

5. 构造数据集

将划分好的numpy类型的训练集和验证集转换为tensor类型，用于网络训练。使用 shuffle()函数打乱训练集数据， batch()函数指定每个step训练多少组数据。借助 迭代器iter()使用 next()函数从数据集中 取出一个batch的数据用于验证。

#（6）构造tf数据集
训练集
train_ds = tf.data.Dataset.from_tensor_slices((x_train, y_train))
train_ds = train_ds.shuffle(10000).batch(128)
验证集
val_ds = tf.data.Dataset.from_tensor_slices((x_val, y_val))
val_ds = val_ds.batch(128)

查看数据信息
sample = next(iter(train_ds))
print('x_batch.shape:', sample[0].shape, 'y_batch.shape:', sample[1].shape)
print('input_shape:', sample[0].shape[-2:])
x_batch.shape: (128, 20, 1) y_batch.shape: (128,)
input_shape: (20, 1)

6. 模型构建

由于本案例数据量比较少，特征也只有一个，因此不需要使用复杂网络， 使用一个LSTM层用于提取特征，一个全连接层用于输出预测结果。

构造输入层
inputs = keras.Input(shape=sample[0].shape[-2:])
搭建网络各层
x = keras.layers.LSTM(8)(inputs)
x = keras.layers.Activation('relu')(x)
outputs = keras.layers.Dense(1)(x)  # 输出结果是1个
构造模型
model = keras.Model(inputs, outputs)
查看模型结构
model.summary()

网络架构如下：

Layer (type)                 Output Shape              Param #
=================================================================
input_1 (InputLayer)         [(None, 20, 1)]           0
_________________________________________________________________
lstm_1 (LSTM)                (None, 8)                 320
_________________________________________________________________
activation_1 (Activation)    (None, 8)                 0
_________________________________________________________________
dense_1 (Dense)              (None, 1)                 9
=================================================================
Total params: 329
Trainable params: 329
Non-trainable params: 0

7. 网络训练

首先进行模型编译，使用adam优化器设置学习率0.01，使用平均绝对误差作为网络训练时的损失函数，网络迭代20次。回归问题不能设置metrics监控指标为准确率，这一般用于分类问题。

#（8）模型编译
opt = keras.optimizers.Adam(learning_rate=0.001)  # 优化器

model.compile(optimizer=opt, loss='mae')  # 平均误差损失

#（9）模型训练
epochs=20
history = model.fit(train_ds, epochs=epochs, validation_data=val_ds)

训练过程如下：

Epoch 1/20
853/853 [==============================] - 5s 5ms/step - loss: 0.4137 - val_loss: 0.0878
Epoch 2/20
853/853 [==============================] - 4s 5ms/step - loss: 0.0987 - val_loss: 0.0754
Epoch 19/20
853/853 [==============================] - 4s 5ms/step - loss: 0.0740 - val_loss: 0.0607
Epoch 20/20
853/853 [==============================] - 4s 4ms/step - loss: 0.0736 - val_loss: 0.0628

8. 查看训练信息

history变量中保存了训练过程的所有信息，我们绘制训练集损失和验证集损失曲线。

#（10）获取训练信息
history_dict = history.history  # 获取训练的数据字典
train_loss = history_dict['loss']  # 训练集损失
val_loss = history_dict['val_loss']  # 验证集损失

#（11）绘制训练损失和验证损失
plt.figure()
plt.plot(range(epochs), train_loss, label='train_loss')  # 训练集损失
plt.plot(range(epochs), val_loss, label='val_loss')  # 验证集损失
plt.legend()  # 显示标签
plt.xlabel('epochs')
plt.ylabel('loss')
plt.show()

9. 预测阶段

对先前划分好的测试集进行预测， model中保存了网络训练好了的权重，使用 predict()函数 预测特征 x_test 分别对应的电量 y_predict，真实值 y_test，绘图展示预测值和真实值的偏离程度。也可以计算预测值和真实值之间的方差或标准差等指标来表明预测的准确性。

#（12）预测
y_predict = model.predict(x_test)  # 对测试集的特征值进行预测

x_test 等同于经过预处理后的 temp[val_num:-20].values
dates = temp[val_num:-20].index  # 获取时间索引

#（13）绘制预测结果和真实值对比图
fig = plt.figure(figsize=(10,5))
真实值
axes = fig.add_subplot(111)
axes.plot(dates, y_test, 'bo', label='actual')
预测值，红色散点
axes.plot(dates, y_predict, 'ro', label='predict')
设置横坐标刻度
axes.set_xticks(dates[::30])
axes.set_xticklabels(dates[::30],rotation=45)

plt.legend()  # 注释
plt.grid()  # 网格
plt.show()

由于 x_test 对应原始数据中索引在 val_num 之后的特征信息，找到 x_test 中每个元素对应的时间 dates，作为x轴刻度

Original: https://blog.csdn.net/dgvv4/article/details/124349963
Author: 立Sir
Title: 【数值预测案例】(3) LSTM 时间序列电量预测，附Tensorflow完整代码

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/624630/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

目标检测-小目标检测技巧

目前阶段，目标检测对小目标的检测效果还不尽如人意，例如yolov5经过FPN后有三种输出尺寸，1919， 3838， 7676 ，最大的7676负责检测小目标,而对应到608608…

人工智能 2023年5月26日
0074
图神经网络GNN(一): 简单图论与PyG中图数据集的表示及其使用

1. 写在前面这个系列整理的关于GNN的相关基础知识，图深度学习是一个新兴的研究领域，将深度学习与图数据连接了起来，推动现实中图预测应用的发展。之前一直想接触这一块内容，但总…

人工智能 2023年6月1日
00130
SegNet算法详解

SegNet论文详解 SegNet算法Pytorch实现： https://github.com/codecat0/CV/tree/main/Semantic_Segmentati…

人工智能 2023年7月13日
0057
Python创建类

python 有一个传说”一切皆对象” 面向对象编程是在面向过程编程的基础上发展来的，它比面向过程编程具有更强的灵活性和拓展性。面向对象编程是程序员发展的风…

人工智能 2023年7月5日
0071
CUDA+cuDNN下载安装（配备GPU环境）

最近准备开始做一个CV+NLP方面的图像标题生成任务（挖坑） GPU运行必不可少，所以小白在下载安装配置自己的烂笔记本（win10） 1.查看电脑是否支持GPU 首先，查看自己的显…

人工智能 2023年6月17日
0096
面试：CountDownLatch、CyclicBarrier 原理

CountDownLatch 基于 AQS 的共享模式的使用；CyclicBarrier 基于 Condition 来实现的。一、CountDownLatch原理描述 Count…

人工智能 2023年6月30日
0067
神经网络参数学习和优化方法的原理

神经网络学习参数和搜索最优超参数的过程梯度检查简单将解析梯度与数值梯度进行比较，但实际上运算非常复杂使用有限差分近似计算数值梯度时，常用公式为： [En] simply com…

人工智能 2023年5月24日
0095
机器学习实用代码汇总（你想要的这里都有）

机器学习实用代码汇总（你想要的这里都有）文章目录机器学习实用代码汇总（你想要的这里都有）前言一、数据导入 * 1.数据文件读取 2.提取特征和标签 3.数据分布及关系图（P…

人工智能 2023年6月13日
00105
机器学习强基计划1-1：图文详解感知机算法原理+Python实现

目录 0 写在前面 1 什么是线性模型？ 2 感知机概述 3 手推感知机原理 4 Python实现 * 4.1 创建感知机类 4.2 更新权重与偏置 4.3 判断误分类点 4.4 …

人工智能 2023年6月23日
0070
DCGAN理论讲解及代码实现

目录 DCGAN理论讲解 DCGAN的改进： DCGAN的设计技巧 DCGAN纯代码实现导入库导入数据和归一化定义生成器定义鉴别器初始化和模型训练运行结果 DCGAN…

人工智能 2023年6月22日
00101
机器学习——Adaboost 算法

机器学习——Adaboost 算法资料来源：《MATLAB 神经网络 43 个案例分析》 Adaboost算法思想 Adaboost算法的基本思想是合并多个弱分类器来实现更为有效…

人工智能 2023年7月28日
0048
【Unity人物动画】SALSA With RandomEyes (语音生成嘴型/人物说话) 使用

SALSA使用探索之前做项目时想实现人物说话的效果，因为我们的语音是AI合成的，有很多片段，如果能根据语音生成嘴部的动画，那将极大便利我们的工作。后面是找到了SALSA的这款插件…

人工智能 2023年5月27日
0049
机器学习期末题库

机器学习期末题库 1.属于监督学习的机器学习算法是：贝叶斯分类器 2.属于⽆监督学习的机器学习算法是：层次聚类 3.⼆项式分布的共轭分布是：Beta分布 4.多项式分布的共轭分布是…

人工智能 2023年6月15日
0097
零售药店管理系统 Python+MySQL数据库

零售药店管理系统【Python+数据库】 1 背景介绍结合本学期所学的Python和数据库完成一个零售药店管理系统 2 问题定义零售药店管理系统通过录入零售药品信息、员工信息…

人工智能 2023年7月30日
0063
安装PCL库【完全版】

在哪下载？ C++版一般用C++写的比较多个人比较喜欢用C++写pcl。在此列出c++ 版本的PCL的安装地址：GitHub：https://github.com/PointCl…

人工智能 2023年5月26日
0078
论文阅读——Aspect Sentiment Quad Prediction as Paraphrase Generation

Aspect Sentiment Quad Prediction as Paraphrase Generation Abstract 现有的研究通常考虑对部分情绪要素的检测，而不是…

人工智能 2023年5月27日
0080

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【数值预测案例】(3) LSTM 时间序列电量预测，附Tensorflow完整代码

大家都在看