【数据挖掘】使用移动平均预测道琼斯、纳斯达克、标准普尔指数——Python中的基本数据操作和可视化

2023年7月14日下午6:58 • 人工智能 • 阅读 71

如上图所示，数据格式为csv，其中Date表示开盘的日期，Open表示开盘价，High表示当日最高值，Low表示当日最低值，Close表示收盘价格，Adj Close表示调整后的收盘价格，Volume表示当日成交量。我们需要预测的则是Adj Close这一列。
我们可以使用pandas读取csv文件，并打印出Adj Close这一列：

import pandas as pd
data = pd.read_csv('DOW.csv',header=0)
data = data.applymap(str)
print(data['Adj Close'])

结果如下，可以看到在道琼斯数据集中，我们需要预测的Adj Close有798行，type为object，我们要做的就是根据数据，使用移动平均算法，预测后面的指数。

【数据挖掘】使用移动平均预测道琼斯、纳斯达克、标准普尔指数——Python中的基本数据操作和可视化

五、移动平均预测

移动平均值，就是指定时间段， 对时间序列数据进行移动计算平均值。移动平均值常常用在计算股票的移动平均线、存货成本等方面。移动平均的本质是⼀种低通滤波。它的⽬的是过滤掉时间序列中的⾼频扰动，保留有⽤的低频趋势。 计算公式：S M A t = P 1 + P 2 + … + P n n S M A_{t}=\frac{P_{1}+P_{2}+\ldots+P_{n}}{n}SM A t =n P 1 +P 2 +…+P n
比如若依次得到测定值x 1 、 x 2 、 x 3 、 x 4 、 x 5 、 x 6 、 x 7 . . . x_1、x_2、x_3、x_4、x_5、x_6、x_7…x 1 、x 2 、x 3 、x 4 、x 5 、x 6 、x 7 …,按顺序取一定个数所做的全部算术平均值就是移动平均值，如y 1 = ( x 1 + x 2 + x 3 ) / 3 、 y 2 = ( x 2 + x 3 + x 4 ) / 3…. y_1=(x_1+x_2+x_3)/3、y_2=(x_2+x_3+x_4)/3….y 1 =(x 1 +x 2 +x 3 )/3 、y 2 =(x 2 +x 3 +x 4 )/3….，

而 panda提供了rolling函数可以用来计算移动平均，使用简单，速度较快：
DataFrame.rolling(window, min_periods=None, freq=None, center=False, win_type=None, on=None, axis=0, closed=None)

参数用法
window

表示
时间窗的大小

，注意有两种形式(int or offset)。如果使用int，则数值表示计算统计量的观测值的数量即向前几个数据。如果是offset类型，表示时间窗的大小。min_periods最少需要有值的观测点的数量，对于int类型，默认与window相等。对于offset类型，默认为1。freq不用管，从0.18版本中已经被舍弃。win_type窗口类型，不用管，默认为None一般不特殊指定on对于DataFrame如果不使用index(索引)作为rolling的列，那么用on来指定使用哪列。closed定义区间的开闭，不用管，新版本中已经被舍弃axis方向(轴)，一般都是0。center是否使用window的中间值作为label，默认为false。只能在window是int时使用。

那么我们使用的简单移动平均直接使用： data['ma5'] = data['Adj Close'].rolling(5).mean()，其表示窗口大小为5的移动平均。计算后，使用matplotlib.pyplot进行画图，横轴为时间，竖轴为预测价格，将其在pyplot 图中打印:

import matplotlib.pyplot as plt
fig = plt.figure(figsize=(16,9))
ax1 = fig.add_subplot(111, ylabel='Price')
data.ma5.plot(ax=ax1, color='plum', lw=2., legend=True)

效果如下：

我们以同样方法画出多个均线并且和原数据real对比：

data['real'] = data['Adj Close'].rolling(1).mean()
data['ma5'] = data['Adj Close'].rolling(5).mean()
data['ma10'] = data['Adj Close'].rolling(10).mean()
data['ma20'] = data['Adj Close'].rolling(20).mean()
data['ma30'] = data['Adj Close'].rolling(30).mean()
data['ma50'] = data['Adj Close'].rolling(50).mean()
data['ma100'] = data['Adj Close'].rolling(100).mean()
data['ma200'] = data['Adj Close'].rolling(200).mean()
data['ma250'] = data['Adj Close'].rolling(250).mean()

data.tail()

fig = plt.figure(figsize=(16,9))
ax1 = fig.add_subplot(111, ylabel='Price')
data.real.plot(ax=ax1, color='black', lw=2., legend=True)
data.ma5.plot(ax=ax1, color='plum', lw=2., legend=True)
data.ma10.plot(ax=ax1, color='grey', lw=2., legend=True)
data.ma20.plot(ax=ax1, color='salmon', lw=2., legend=True)
data.ma30.plot(ax=ax1, color='goldenrod', lw=2., legend=True)
data.ma50.plot(ax=ax1, color='hotpink', lw=2., legend=True)
data.ma100.plot(ax=ax1, color='khaki', lw=2., legend=True)
data.ma200.plot(ax=ax1, color='bisque', lw=2., legend=True)
data.ma250.plot(ax=ax1, color='skyblue', lw=2., legend=True)

plt.grid()
plt.show()

可以发现， 移动平均存在一定的滞后性，移动平均以滞后性的代价换来了平滑性，滞后性说明由简单移动平均计算得到的低频趋势对近期的最新数据不够敏感。 没有未来数据便是滞后的根本原因。当股价不是随着趋势的变化方向，发生突发的方向趋势，移动平均线行动往往过于迟缓，改变方向速度落后于大趋势。这是一个极大弱点
在股价原有趋势发生反转时，由于MA的追踪趋势的特性，MA的行动往往过于迟缓，掉头速度落后于大趋势。这是MA的一个极大的弱点。等MA发出反转信号时，股价调头的深度已经很大了。

附录DOW在不同MA值下的滑动平均值：

Nasdaq在不同MA值下的滑动平均值：

S&P在不同MA值下的滑动平均值：

六、封装函数

我们将其进行封装如下，代码整体如下：

import matplotlib.pyplot as plt
import pandas as pd
import os
def cal_ma(name,data, day):
    data = pd.read_csv(data, header=0)
    data = data.applymap(str)

    day = int(day)
    data['ma'+str(day)] = data['Adj Close'].rolling(day).mean()

    data.tail()

    fig = plt.figure(figsize=(16, 9))
    ax1 = fig.add_subplot(111, ylabel='Price')
    data['ma'+str(day)].plot(ax=ax1, color='red', lw=2., legend=True)

    plt.rcParams['font.sans-serif'] = ['FangSong']
    plt.title("MA"+str(day)+" about "+name+" data", fontsize=10, loc='center', color='black')
    plt.grid()
    plt.show()

if __name__ == "__main__":
    dataname = input("请输入数据名：")
    day = input("请输入MA的天数：")
    cal_ma(dataname,dataname+'.csv', day)

完整项目已经打包，免费下载： 数据挖掘项目——移动平均预测道琼斯、纳斯达克、标准普尔指数

最后

💖 个人简介：人工智能领域研究生，目前主攻文本生成图像（text to image）方向

📝 关注我：中杯可乐多加冰

🔥 限时免费订阅：文本生成图像T2I专栏

🎉 支持我：点赞👍+收藏⭐️+留言📝

如果这篇文章帮助到你很多，希望能点击下方打赏我一杯可乐！多加冰哦

Original: https://blog.csdn.net/air__Heaven/article/details/126359020
Author: 中杯可乐多加冰
Title: 【数据挖掘】使用移动平均预测道琼斯、纳斯达克、标准普尔指数——Python中的基本数据操作和可视化

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/692671/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

目标检测里的mAP计算过程和原理

经过检测模型以后，得到了所有图片的预测框，对于某一个图片，某个类，计算预测框和真实框之间的IOU值，并得到每一个预测框最大的IOU值和对应的真实框这个要遍历每个图片每个类，共存在…

人工智能 2023年7月11日
0050
R语言使用class函数查看数据对象的类型（数值型、整数型、字符型、复数型、逻辑型和原生型）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月17日
0061
CNN中常用的优化器有哪些？它们是如何影响模型的训练和收敛速度的

优化器介绍在深度学习中，优化器是用来更新模型参数以最小化损失函数的算法。在卷积神经网络 (CNN) 中，常用的优化器有梯度下降法 (Gradient Descent)、动量 (M…

人工智能 2024年1月5日
0032
【Python】基于 Pillow 的图像处理（零基础入门教程）

文章目录 * – 1. 引言 – 2. 安装 – 3. 教程 – + 3.1. 使用 Image 类 + 3.2. 读取和保存图像 …

人工智能 2023年6月20日
00171
项目中如何配置 Maven 为国内源

目录 1. 创建出一个 Maven 项目 2. 打开项目配置界面, 检查并配置国内源 2.1 打开配置界面 (当前项目界面和新项目配置界面) 2.2 搜索 “Maven…

人工智能 2023年6月26日
0073
Autoware1.14-摄像头目标检测YOLO-V3

下载YOLO-V3 权重文件权重地址： https://pjreddie.com/media/files/yolov3.weights 建议存放地址： autoware.ai/i…

人工智能 2023年7月9日
0063
python中dataframe 判断是否存在_python – 如何检查列中是否存在Pandas

有一种方法来检查一个Pandas DataFrame中是否存在列？假设我有以下DataFrame： import pandas as pd from random import …

人工智能 2023年7月7日
00127
pytorch双线性插值

1、单线性插值化简得：重要公式将y视为像素值的函数； ; 2、双线性插值问题：求P点的像素值？ ; 根据单线性插值公式： 1、得到R1和R2点的像素值： ; 2、然后通过R1和…

人工智能 2023年6月17日
0078
Python每日学习总结（七）

1.Python数据可视化分析实现（1）matplotlib基础折线图/散点图： plot（x轴，y轴，展现形式）折线图： import matplotlib.pylab a…

人工智能 2023年6月11日
0078
【MFC】第一个窗口程序（2）

Windows C窗口程序也称”SDK编程”，即调用 Windows 提供的API接口（C），完成窗口程序的设计，API接口可以理解为一些C的函数和数据类…

人工智能 2023年6月29日
0079
深度学习(四)：ubuntu系统tensorflow框架搭建与测试

目录一、tensorflow安装与测试 1.1 tensorflow 与cuda版本对应版本 1.2 测试gpu 一、tensorflow安装与测试 1.1 tensorflow…

人工智能 2023年5月26日
0068
python之panda模块1

Python是一门实现数据可视化很好的语言，他们里面的很多库可以很好的画出图形，形象明了。今天我们就来说说:Pandas数据分析核心支持库初识Pandas： Pandas 是 …

人工智能 2023年7月7日
0060
基于极限学习机的轴承故障分类（西储大学数据）

matlab2018pycharm2020python版本：python3.7（重要） import numpy as np import scipy.io as scio fro…

人工智能 2023年7月2日
0067
VS Code中安装Python机器学习与数据分析相关第三方模块教程

我们需要使用 pip来引入Python的第三方模块， pip是Python包管理工具，该工具提供了对Python包的查找、下载、安装与卸载等功能。（1）更新 pip: 打开VS …

人工智能 2023年7月15日
00116
模型评价 – 分类模型的常用评价指标

习题答案习题一答案一、选择题 1. 软件的主要特性是(A B C)。 A) 无形 B) 高成本 C) 包括程序和文档 D) 可独立构成计算机系统 2. 软件工程三要素是(…

人工智能 2023年7月2日
0082
PyTorch+BERT实现文本分类任务(少于80行代码)

本文主要介绍一个框架nlp-basictasksnlp-basictasks是利用PyTorch深度学习框架所构建一个简单的库，旨在快速搭建模型完成一些基础的NLP任务，如分类、匹…

人工智能 2023年5月31日
0087

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【数据挖掘】使用移动平均预测道琼斯、纳斯达克、标准普尔指数——Python中的基本数据操作和可视化

目录

大家都在看