LSTM股票价格预测

2023年5月23日下午4:29 • 人工智能 • 阅读 106

ID：399899
注：这里使用的数据源是Tushare

LSTM股票价格预测实验

实验介绍

使用LSTM进行股票价格的预测，用到的框架主要包括：TensorFlow2.0，主要用于深度学习算法的构建，本实验以Tushare平台的601398股票历史数据为基础，基于Keras深度学习库股票价格进行预测。

算法原理：

这里就不对模型原理进行介绍了这里引用一下别人的需要的朋友去看一下https://juejin.cn/post/6973082167970627620

搭建思路：

使用LSTM模型对股票数据的’open’, ‘high’, ‘low’, ‘close’, ‘pre_close’, ‘change’, ‘pct_chg’, ‘vol’, ‘amount’九个特征进行训练预测收盘价。

准备工作

环境准备：python3.7；Tensorflow；Keras

数据准备：https://www.tushare.pro/ ；原始数据取得是由tushare平台提供的股票日线行情历史数据。

实验步骤

导入实验环境

导入相应的模块

import pandas as pd
import tensorflow as tf
import numpy as np
import tushare as ts
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['KaiTi']

plt.rcParams['axes.unicode_minus'] = False

导入实验数据集

步骤 1 获取数据


ts.set_token('这里填写自己的token码在个人主页可以获取')
pro = ts.pro_api()
data = pr.daily(ts_code='601398.SH')

data = data.iloc[::-1,]

data1 = data.copy(deep=True)

tushare主页：https://tushare.pro/document/2

步骤 2 检测是否有缺失值

data.isna().any()

输出结果：

ts_code False

trade_date False

open False

high False

low False

close False

pre_close False

change False

pct_chg False

vol False

amount False

步骤 3 异常值检测

data1 = data

mean1 = data1['vol'].quantile(q=0.25)

mean2 = data1['vol'].quantile(q=0.75)

mean3 = mean2-mean1

topnum21 = mean2+1.5*mean3

bottomnum21 = mean2-1.5*mean3

print("正常值的范围：",topnum21,bottomnum21)

print("是否存在超出正常范围的值：",any(data1['vol']>topnum21))

print("是否存在小于正常范围的值：",any(data1['vol']<bottomnum21))

输出结果：

正常值的范围： 4625919.582500001 -113825.70250000013

是否存在超出正常范围的值： True

是否存在小于正常范围的值： False

检测到存在超出正常范围的值，并替换该值的这一部分。

[En]

Detect that there is a value outside the normal range, and replace this part of the value.

replace_value=data1['vol'][data1['vol']<topnum21].max()

data1.loc[data1['vol']>topnum21,'vol']=replace_value

mean1 = data1['amount'].quantile(q=0.25)

mean2 = data1['amount'].quantile(q=0.75)

mean3 = mean2-mean1

topnum21 = mean2+1.5*mean3

bottomnum21 = mean2-1.5*mean3

print("正常值的范围：",topnum21,bottomnum21)

print("是否存在超出正常范围的值：",any(data1['amount']>topnum21))

print("是否存在小于正常范围的值：",any(data1['amount']<bottomnum21))

输出结果：

正常值的范围： 2558165.1642500004 -167064.92425000016

是否存在超出正常范围的值： True

是否存在小于正常范围的值： False

检测到存在超出正常范围的值，并替换该值的这一部分。

[En]

Detect that there is a value outside the normal range, and replace this part of the value.

replace_value=data1['amount'][data1['amount']<topnum21].max()

data1.loc[data1['amount']>topnum21,'amount']=replace_value

步骤 4 归一化处理

这里采用的最大和最小归一化可以使模型更具稳健性。

[En]

The maximum and minimum normalization adopted here can make the model more robust.

data = data.iloc[:,2:]

data_max = data.max()

data_min = data.min()

data = (data-data_min)/(data_max-data_min)

步骤 5 数据划分并查看数据集信息

dataset_st = np.array(data)

def data_set(dataset, lookback):

    dataX, dataY = [], []

    for i in range(len(dataset)-lookback):

        a = dataset[i:(i+lookback)]

        dataX.append(a)

        dataY.append(dataset[i+lookback][3])

    return np.array(dataX), np.array(dataY)

train_size = int(len(dataset_st)*0.7)

test_size = len(dataset_st)-train_size

train, test = dataset_st[0:train_size], dataset_st[train_size:len(dataset_st)]

print(len(train))

print(len(test))

lookback = 60

trainX, trainY = data_set(train, lookback)

testX, testY = data_set(test, lookback)

print('trianX:,trianY', trainX.shape, trainY.shape)

输出结果：

trianX:,trianY (2560, 60, 7) (2560,)

LSTM回归预测建模

步骤 1 初始化神经网络

数据集已经准备好了，然后我们需要建立一个训练模型，我们首先需要建立一个初始化的神经网络。

[En]

The data set is ready, and then we need to build a training model, and we first need to establish an initialized neural network.

model=tf.keras.Sequential([tf.keras.layers.LSTM(120,input_shape=(trainX.shape[1],

trainX.shape[2]),return_sequences=True),

    tf.keras.layers.Dropout(0.2),

    tf.keras.layers.LSTM(60),

    tf.keras.layers.Dropout(0.2),

    tf.keras.layers.Dense(30,activation='relu'),

    tf.keras.layers.Dense(1)

    ])

步骤 2 定义学习率更新规则

设置模型的学习率参数。

给出学习率（步长）进行更新

model.compile(

    optimizer=tf.keras.optimizers.Adam(0.001),

    loss='mean_squared_error',

    metrics=["mse"]

)

步骤 3 构建模型训练

神经网络模型参数的更新是一个迭代过程，可以将模型训练过程定义为训练模型的函数。

[En]

The updating of model parameters of neural network is an iterative process, so we can define the process of model training as a function to train the model.

history = model.fit(trainX, trainY,

                    batch_size=64, epochs=25, validation_data=(testX, testY),

                    validation_freq=1)

步骤 4 构建绘图函数

绘制train loss与epoch的关系图，这样我们就可以查看模型训练的每一步损失值。

def plot_learning_curves(history):

    pd.DataFrame(history.history).plot(figsize=(10,6))

    plt.grid(True)

    plt.title('训练情况')

    plt.savefig('./训练情况.jpg')

plt.show()

3实验结果及分析 ****

3 .1 实验结果 ****

评价指标：

MSE: tf.Tensor(25.45738, shape=(), dtype=float32)

MAE: tf.Tensor(5.0175276, shape=(), dtype=float32)

MAPE: tf.Tensor(93.39253, shape=(), dtype=float32)

; 实验分析

从评价指标可以看出，总体误差不大，预测形势走势与实际情况基本一致，但价格有所偏离，值得改进。

[En]

From the evaluation indicators, we can see that the overall error is small, and the trend of the predicted situation is basically consistent with the actual situation, but the price is deviated, which is worth improving.

整体来说，LSTM模型股票价格预测有一定效果，对证券投资市场具有一定的指导作用。

Original: https://blog.csdn.net/As_Yan_Do/article/details/124649032
Author: 千世先森
Title: LSTM股票价格预测

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/496450/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

opencv图像处理基本算法

opencv基础功能一.提取单通道颜色1.首先是opencv的ROI功能，就是只取图像一部分通道的颜色。我们知道所有的图片都是由三原色（红，绿，蓝）这三个通道构成的，如果我们只想…

人工智能 2023年6月18日
0070
OpenCV-Python实战（番外篇）——利用 SVM 算法识别手写数字

OpenCV是一款非常强大的计算机视觉库，其中包含了很多功能强大的图像处理和计算机视觉算法。而在这个系列的第三篇文章中，我们将重点介绍如何在OpenCV中绘制图形和文本。 Ope…

人工智能 2023年6月24日
0071
20220522Python3.10安装教程

目录一、python3.10下载 1.从官网进入Windows python下载页面 2.双击安装python，安装界面勾选Add Python 3.10 to PATH让pyt…

人工智能 2023年7月4日
0074
基于计算听觉场景分析的语音增强系统设计

基于计算听觉场景分析的语音增强系统设计 [En] Design of speech Enhancement system based on Computational audito…

人工智能 2023年5月27日
0071
ubuntu18.04 RTX3060配置深度学习环境

一、版本选择 Ubuntu 18.04+python3.7+CUDNN 8.2.0+CUDA11.3 +TensorRT8.2+ Pytorch1.10.1+Tensorflow-…

人工智能 2023年5月24日
0081
Python Pandas 数据分析工具透视表（pivot table）

数据透视表概念数据透视表是Excel中常用的工具，本片文章的重点不是认识数据透视表，所以找了一片文章，供大家参考。>>>Excel学习笔记-数据透视表透视表操…

人工智能 2023年7月7日
00103
【项目实战】Python基于Apriori关联规则算法实现商品零售购物篮分析

说明：这是一个机器学习实战项目（附带数据+代码+文档+视频讲解），如需数据+代码+文档+视频讲解可以直接到文章最后获取。 1.项目背景购物篮分析是商业领域最前沿、最具挑战性的…

人工智能 2023年6月16日
0099
(01)ORB-SLAM2源码无死角解析-(04)单目追踪_总体框架讲解TrackMonocular→GrabImageMonocular

一、前言前面我们使用深度图调试，并且进行了简单的讲解。但是深度图涉及的东西没有单目图像多，为了大家学习到更多的东西，接下来使用我们使用单目图像进行讲解。根据前面的博客，运行单目摄…

人工智能 2023年6月10日
0074
Thinkphp5 5.0.22/5.1.29 远程代码执行漏洞漏洞复现

为方便您的阅读，可点击下方蓝色字体，进行跳转↓↓↓ * – 01 漏洞描述 – 02 影响范围 – 03 验证方式 – 04 利用方…

人工智能 2023年6月27日
0080
Transformer、BERT等模型学习笔记

记录一下刷B站教学视频的一些笔记，目前主刷：李沐老师的【跟李沐学AI】公众号-【NLP从入门到放弃】的视频文章目录 1 Transformer从零详细解读(可能是你见过最通…

人工智能 2023年5月28日
0062
从天猫迈巴赫到双引擎回归框架：如何化技术为生产力？

🍊 Java学习：Java从入门到精通总结 🍊 Spring系列推荐：Spring源码解析 🍊 绝对不一样的职场干货：大厂最佳实践经验指南 📆 最近更新：2022年4月8日 🍊 个…

人工智能 2023年6月16日
0087
论文导读 | 动态图上图分析系统的研究

前言现实生活中的图数据常表现出动态的形式，图上的节点和边在不断的更新，例如社交网络，金融网络，网络图等。因此，近年来图数据领域中的大量研究工作都与动态图(dynamic grap…

人工智能 2023年6月1日
0070
向毕业妥协系列之机器学习笔记:构建ML系统(二)

目录一.指定性能评估基准二.学习曲线三.决定下一步做什么四.方差与偏差一.指定性能评估基准 Jtrain即在训练集上的成本函数计算，f的计算是用训练的w和b计算。以语音…

人工智能 2023年6月29日
0086
【Reinforcement Learning】什么是强化学习以及算法分类

一、什么是强化学习强化学习是一类算法，让计算机从什么都不懂，通过不断尝试，从错误中学习，找到规律，从而到达目标的过程。围棋机器人AlphaGo就是自己不断尝试，更新自己的行为准则…

人工智能 2023年7月3日
0089
[机器学习与scikit-learn-25]：算法-聚类-KMeans的适用范围与评估指标

作者主页(文火冰糖的硅基工坊)：文火冰糖（王文兵）的博客_文火冰糖的硅基工坊_CSDN博客本文网址：https://blog.csdn.net/HiWangWenBing/art…

人工智能 2023年5月31日
0069
【神经网络】(16) MobileNetV3 代码复现，网络解析，附Tensorflow完整代码

各位同学好，今天和大家分享一下如何使用 Tensorflow构建 MobileNetV3轻量化网络模型。 MobileNetV3 做了如下改动（1）更新了V2中的逆转残差结构；（…

人工智能 2023年5月23日
0094

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

LSTM股票价格预测

实验介绍

准备工作

实验步骤

导入实验环境

导入实验数据集

LSTM回归预测 建模

给出学习率（步长）进行更新

3实验结果及分析 ****

3 .1 实验结果 ****

; 实验 分析

大家都在看

LSTM回归预测建模

; 实验分析