python短期电力预测——基于LSTM神经网络

2023年7月18日下午12:35 • 人工智能 • 阅读 38

模型预测
计算模型r^2值
计算模型精确度
代码：
*

-*- coding: utf-8 -*-
@Time : 2022/3/22 15:36
@Author : 中意灬
@FileName: test2.py
@Software: PyCharm
import csv
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import r2_score
import tensorflow as tf
from tensorflow.python.keras import Sequential, layers, utils
def predict_next(model, sample, epoch=20):
    temp1 = list(sample[:,0])
    for i in range(epoch):
        sample = sample.reshape(1, x_Seq_len, 1)
        pred = model.predict(sample)
        value = pred.tolist()[0][0]
        temp1.append(value)
        sample = np.array(temp1[i+1 : i+x_Seq_len+1])

    return temp1
def create_new_dataset(dataset, seq_len=12):
    '''基于原始数据集构造新的序列特征数据集
    Params:
        dataset : 原始数据集
        seq_len : 序列长度（时间跨度）
    Returns:
        X, y
    '''
    X = []  # 初始特征数据集为空列表
    y = []  # 初始标签数据集为空列表,y标签为样本的下一个点，即预测点

    start = 0  # 初始位置
    end = dataset.shape[0] - seq_len  # 截止位置,dataset.shape[0]就是有多少条

    for i in range(start, end):  # for循环构造特征数据集
        sample = dataset[i: i + seq_len]  # 基于时间跨度seq_len创建样本
        label = dataset[i + seq_len]  # 创建sample对应的标签
        X.append(sample)  # 保存sample
        y.append(label)  # 保存label
    # 返回特征数据集和标签集
    return np.array(X), np.array(y)
def split_dataset(X, y, train_ratio=0.8):
    '''基于X和y，切分为train和test
    Params:
        X : 特征数据集
        y : 标签数据集
        train_ratio : 训练集占X的比例

    Returns:
        X_train, X_test, y_train, y_test
    '''
    X_len = len(X)  # 特征数据集X的样本数量
    train_data_len = int(X_len * train_ratio)  # 训练集的样本数量

    X_train = X[:train_data_len]  # 训练集
    y_train = y[:train_data_len]  # 训练标签集

    X_test = X[train_data_len:]  # 测试集
    y_test = y[train_data_len:]  # 测试集标签集

    # 返回值
    return X_train, X_test, y_train, y_test

功能函数：基于新的X_train, X_test, y_train, y_test创建批数据(batch dataset)

def create_batch_data(X, y, batch_size=32, data_type=1):
    '''基于训练集和测试集，创建批数据
    Params:
        X : 特征数据集
        y : 标签数据集
        batch_size : batch的大小，即一个数据块里面有几个样本
        data_type : 数据集类型（测试集表示1，训练集表示2）

    Returns:
        train_batch_data 或 test_batch_data
    '''
    if data_type == 1:  # 测试集
        dataset = tf.data.Dataset.from_tensor_slices((tf.constant(X), tf.constant(y)))  # 封装X和y，成为tensor类型
        test_batch_data = dataset.batch(batch_size)  # 构造批数据
        # 返回
        return test_batch_data
    else:  # 训练集
        dataset = tf.data.Dataset.from_tensor_slices((tf.constant(X), tf.constant(y)))  # 封装X和y，成为tensor类型
        train_batch_data = dataset.cache().shuffle(1000).batch(batch_size)  # 构造批数据
        # 返回
        return train_batch_data
if __name__ == '__main__':
    plt.rcParams['font.sans-serif'] = ['SimHei']  # 显示中文标签
    plt.rcParams['axes.unicode_minus'] = False#解决负数问题
    x_Seq_len=16
    dataset = pd.read_csv("C:/Users/97859/Documents/WPS Cloud Files/319911131/附件1-区域15分钟负荷数据.csv", encoding='GBK')
    dataset['数据时间']=pd.to_datetime(dataset['数据时间'],format="%Y-%m-%d %H:%M:%S")
    dataset.index=dataset.数据时间#将其索引变为时间
    dataset.drop(columns='数据时间',axis=1,inplace=True)
    plt.figure()
    plt.plot(dataset)
    plt.show()
"""
    数据清洗
"""
    #缺失值处理
    #查看是否有缺失值
    print(dataset.info())#无缺失值
    # print(dataset[dataset.isnull()==False])#无
    # dataset['总有功功率（kw）']=dataset['总有功功率（kw）'].fillna(0) 对缺失值填值处理
    # dataset1=dataset[dataset['总有功功率（kw）'].notnull()] 剔除存在缺失值的数据，自己选择一直缺失值处理的方法
    #异常值处理
"""
    箱型图查看
"""
    f, ax = plt.subplots()
    sns.boxplot(y='总有功功率（kw）', data=dataset, ax=ax)
    plt.show()
    s = dataset.describe()
    # 基本统计量，存在异常值的将其筛选出来进行处理，可以用中位数填值或者众数填值，方法任选，这里没有异常值就没有处理
    q1 = s.loc['25%']
    q3 = s.loc['75%']
    iqr = q3 - q1#分位差
    mi = q1 - 1.5 * iqr#下限，低于这个为异常值
    ma = q3 + 1.5 * iqr#上限，高于这个为异常值
    #无异常值
"""
      归一化处理，均值为0，方差为1
"""
    scaler = MinMaxScaler()
    dataset['总有功功率（kw）'] = scaler.fit_transform(dataset['总有功功率（kw）'].values.reshape(-1, 1))
    #将归一化的数据保持
    with open('data.csv','w',encoding='utf-8',newline='')as f:
        w=csv.writer(f)
        w.writerow(dataset['总有功功率（kw）'])
    #归一化后的绘图
    dataset['总有功功率（kw）'].plot()
    plt.show()
"""
    特征提取（特征工程）
"""
    dataset_new = dataset
    # X为特征数据集，y为标签数据集
    X, y = create_new_dataset(dataset_new.values, seq_len=x_Seq_len)
    # X_train为数据训练集，X_test为数据测试集,y_train为标签训练集,y_test为标签测试集合
    X_train, X_test, y_train, y_test = split_dataset(X, y)
    # 基于新的X_train, X_test, y_train, y_test创建批数据(batch dataset)
    # 测试批数据
    test_batch_dataset = create_batch_data(X_test, y_test, batch_size=24, data_type=1)
    # 训练批数据
    train_batch_dataset = create_batch_data(X_train, y_train, batch_size=24, data_type=2)
"""
     构建模型
"""
    model = Sequential([
        layers.LSTM(8, input_shape=(x_Seq_len, 1)),
        layers.Dense(1)
    ])
    # 定义 checkpoint，保存权重文件
    file_path = "best_checkpoint.hdf5"#将数据加载到内存
    checkpoint_callback = tf.keras.callbacks.ModelCheckpoint(filepath=file_path,
                                                             monitor='loss',
                                                             mode='min',
                                                             save_best_only=True,
                                                             save_weights_only=True)
"""
     编译运行预测
"""
    # 模型编译
    model.compile(optimizer='adam', loss="mae")
    # 模型训练（次数200）
    history = model.fit(train_batch_dataset,
                        epochs=100,
                        validation_data=test_batch_dataset,
                        callbacks=[checkpoint_callback])
    # 显示 train loss 和 val loss
    plt.figure()
    plt.plot(history.history['loss'], label='train loss')
    plt.plot(history.history['val_loss'], label='val loss')
    plt.title("LOSS")
    plt.xlabel("Epochs")
    plt.ylabel("Loss")
    plt.legend(loc='best')
    plt.show()
    # 模型验证
    test_pred = model.predict(X_test, verbose=1)
    plt.figure()
    d1=plt.plot(y_test, label='True')
    d2=plt.plot(test_pred, label='pred')
    plt.legend([d1,d2],labels=['True','pred'])
    plt.show()
    # 计算r2
    score = r2_score(y_test, test_pred)
    print("r^2 的值： ", score)
    # 绘制test中前100个点的真值与预测值
    y_true = y_test # 真实值
    y_pred = test_pred  # 预测值

    fig, axes = plt.subplots(2, 1)
    ax0=axes[0].plot(y_true, marker='o', color='red',label='true')
    ax1=axes[1].plot(y_pred, marker='*', color='blue',label='pred')
    plt.show()
"""
    模型测试
"""
    # 选择test中的最后一个样本
    sample = X_test[-1]
    sample = sample.reshape(1, sample.shape[0], 1)
    # 模型预测
    sample_pred = model.predict(sample)#predict()预测标签值
    ture_data = X_test[-1]  # 真实test的最后20个数据点
    # 预测后48个点
    preds=predict_next(model,ture_data,48)
    # 绘图
    plt.figure()
    plt.plot(preds, color='yellow', label='Prediction')
    plt.plot(ture_data, color='blue', label='Truth')
    plt.xlabel("Epochs")
    plt.ylabel("Value")
    plt.legend(loc='best')
    plt.show()
relative_error = 0
'''模型精确度计算'''
for i in range(len(y_pred)):
    relative_error += (abs(y_pred[i] - y_true[i]) / y_true[i]) ** 2
acc = 1- np.sqrt(relative_error / len(y_pred))
print(f'模型的测试准确率为：',acc)

结果分析：
* 电力数据可视化

Original: https://blog.csdn.net/qq_55977554/article/details/124213591
Author: 中意灬
Title: python短期电力预测——基于LSTM神经网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/700795/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

「微服务网关实战三」详细理解 SCG 路由、断言与过滤器

又来给大家更文了。本篇带给大家的是 SpringCloudGateway （下文简称 SCG）的各种断言与过滤器的讲解，由于在上一篇文章中我们已经使用过了断言与过滤器，但是一直没…

人工智能 2023年6月28日
0082
神经网络阈值是什么意思,神经网络的权值和阈值

BP神经网络中初始权值和阈值的设定 1、首先需要了解BP神经网络是一种多层前馈网络。2、以看一下在matlab中BP神经网络的训练函数，有梯度下降法traingd,弹性梯度下降法t…

人工智能 2023年7月13日
0069
Anaconda安装OpenCV的方法

笔者最近在学习用OpenCV做人脸识别，用的是python语言，Anaconda里面自带的Spyder编辑器，但是按照人脸识别的教程安装好OpenCV后发现。。。。只是在Pytho…

人工智能 2023年6月18日
0068
有手就行的移动平均法、指数平滑法的Excel操作，用来时间序列预测

数学建模比赛中的预测方法前言 * 移动平均法指数平滑前言大家好！ φ(*￣0￣) 2022年的比赛将在九月份进行，通常每个学校都会六月或七月给本校的学生发通知，并把那些对这…

人工智能 2023年7月15日
0067
PyTorch中的自动微分是什么？它有什么作用

问题：PyTorch中的自动微分是什么？它有什么作用？详细介绍在深度学习中，反向传播算法是一个关键的概念，用于计算神经网络中各个参数对损失函数的偏导数。PyTorch是一个基于…

人工智能 2024年1月2日
0020
【DeepLearning文本分类实战】狂肝三天三夜写下Pytorch+Bert、Roberta+Bilstm、Lstm等实现IMDB情感分析完整项目（项目已开源）

🍊作者最近在看了大量论文的源代码后，被它们干净利索的代码风格深深吸引，因此也想做一个结构比较规范而且内容较为经典的任务🍊本项目使用Pytorch框架，使用上游语言模型+下游网络模型…

人工智能 2023年7月24日
0074
【论文导读】- Federated Graph Neural Networks: Overview, Techniques and Challenges（联邦图神经网络：概述、技术和挑战）

文章目录论文信息摘要论文内容与结构 * 1. Introduction 2. Terminology and Taxonomy（术语与分类法） 3. Data Owners …

人工智能 2023年7月12日
0038
机器学习——统计学三大相关性系数（pearson、spearman、kendall）

应用场景当想要比较变量间变化趋势时，可以先做出散点图从视觉上判断是否存在相关性（趋势一致）。然后再采用相关性分析从统计角度衡量。 pearson correlation coeff…

人工智能 2023年7月18日
0044
OpenCV图像处理学习十，图像的形态学操作——膨胀腐蚀

一.形态学操作概念图像形态学操作是指基于形状的一系列图像处理操作的合集，主要是基于集合论基础上的形态学数学对图像进行处理。形态学有四个基本操作：腐蚀、膨胀、开操作、闭操作，膨胀…

人工智能 2023年6月18日
0084
控制系统中的AI、AO、DI、DO是什么意思——控制系统基础知识

控制系统中AI、AO、DI、DO是集散控制系统中模块上常见的一些基本标注，好处就是便于分清什么类型量的设备，方便前期的产品选型及后期的维修与保养。同时将现场模拟量仪表和开关量设备等…

人工智能 2023年6月24日
00184
OpenCV三角测量重建triangulatePoints原理解析

双相机立体重建时，利用物体点-光心-像点三者共线的原理，在找到左右匹配的像点并且完成去畸变之后（OpenCV去畸变undistortPoints原理解析），就能够在三维空间中形成两…

人工智能 2023年7月18日
0033
entity什么类型_细粒度实体分类（1）——什么是细粒度实体分类

研究生期间其实关注了实体链接（Entity Linking）、共指消解（Coreference Resolution）、细粒度实体分类（Fine-grained Entity Ty…

人工智能 2023年6月10日
0064
是否只适用于推荐系统

人工智能 2024年1月2日
0038
10.Opencv的重要结构体Mat—深拷贝与浅拷贝

目录 Mat深拷贝与浅拷贝访问图像(Mat)的属性通道的分离与合并 Mat是什么？是一个矩阵，灰色图像2通道，彩色图像3通道。 Mat的优点：可以Numpy以矩阵的方式进…

人工智能 2023年7月18日
0045
sklearn实现决策树，随机森林，逻辑回归，KNN，贝叶斯，SVM，以葡萄干数据集为例

数据集介绍本次使用的数据集为葡萄干数据集，来源于UCI中： https://archive.ics.uci.edu/ml/datasets/Raisin+Dataset 介绍为：…

人工智能 2023年7月27日
0042
NAACL 2022事件相关(事件抽取、事件关系抽取、事件预测等)论文汇总

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月30日
0070

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

python短期电力预测——基于LSTM神经网络

大家都在看