pandas+plotly实现数据图表的绘制和多维度下多个子图的展示

2023年7月8日下午4:52 • 人工智能 • 阅读 90

记录使用plotly和pandas实现对数据的处理和绘制,如果要说的高级一点，那可以说是数据可视化
plotly是一个图表绘制的三方库，而pandas 则是专业对数据进行处理的三方库，使用pandas处理得到的数据，再配合使用plotly 则可以很好的实现数据的处理和展示。
常规的数据量小的图，可以用Excel 简单完成，但是数据量庞大一点，Excel就支撑不住了，例如数据量达到数万条的情况下，再使用Excel 进行绘图，不仅生成图时耗时会很久，同时Excel会陷入卡顿，使用体验是非常的不爽。
基于这种需求，我们可以采用pandas+plotly去替代实现，pandas做数据的提取，处理；plotly则将处理好的数据绘制成想要的图表

plotly有两种模式，一种是在线绘制，需要账户，可以将绘图保存在云端，一种是离线绘制，也就是本地绘制，保存在本地。保存在哪里不重要，重要的是怎么实现,怎么理解实现。

数据

先来份数据，从网易财经捞份股票数据，数据规整，省去数据缺失处理的麻烦, 部分数据如下：

; 单个维度分析

首先，先来分析一个简单的数据，分析所有时间内开盘价的波动情况。分析实现的思路：
需要的数据两列，一列是时间，另一列是开盘价，取出数据中的【时间】列作为横坐标，【开盘价】作为作为纵坐标，调用对应的模型画出图即可

import plotly.offline as py
import pandas as pd
import plotly.graph_objects as go
file_path='test_data.csv'
df=pd.read_csv(file_path)
time_column=df['日期']
opening_price=df['开盘价']

trace=go.Scatter(x=time_column,y=opening_price,mode="lines",name='开盘价')

layout=go.Layout(title='开盘价分析',xaxis={'title':'Time','tickangle':60},yaxis={'title': '开盘价'})
fig=go.Figure(trace,layout)
py.plot(fig)

生成的对应的折线图：

可以明显看到开盘价使用折线图能够很好的展示价格的波动情况
按照这个思路，我们想要将所有的数据都展示出来，只需要加个循环，将数据循环读取并画出来即可

; 多个维度分析

import plotly.offline as py
import pandas as pd
import plotly.graph_objects as go
file_path='test_data.csv'
df=pd.read_csv(file_path)

column_head_list=df.columns.values
time_column=df['日期']
trace_list=[]

for i in range(1,len(column_head_list)):
    data_column = df[column_head_list[i]]
    trace = go.Scatter(x=time_column, y=data_column, mode="lines", name=column_head_list[i])
    trace_list.append(trace)

layout=go.Layout(title='财经数据分析',xaxis={'title':'Time','tickangle':60},yaxis={'title': '价格'})
fig=go.Figure(trace_list,layout)
py.plot(fig)

多维度结果

根据这个思路，可以得到相应的画图结果：

可以看到已经按照我们的要求实现所有数据列的绘制, X 轴显示时间，Y轴显示价格，右边显示图例标识不同的线的颜色代表的数据，大体上看上去没什么问题。
但是仔细查看源数据，我们发现数据的最后两列分别为涨跌额和涨跌幅，这两列和前几列价格数据差很大。涨跌额数据中存在大量的负数，而涨跌幅则是百分比，尤其是涨跌幅，和价格数据相差很大，不是一个量级，无法很好的体现数据的波动情况。
于是我们可以猜想，是否可以将各列数据分开来画图，在同一张画布上一次性将所有的数据分开绘制，能够更加直观的提现涨跌幅的数据波动情况
实现思路：
1.每个图都以时间列作为横坐标，对应列数据作为纵坐标
2.子图创建个数和列数一致
3.子图之前的间隔恒定

于是可以引入子图make_subplots作为一种实现方式：

; 多维度子图分析

import plotly.offline as py
import pandas as pd
import plotly.graph_objects as go
from plotly.subplots import make_subplots

file_path = 'test_data.csv'
df = pd.read_csv(file_path)

column_head_list = df.columns.values

fig = make_subplots(rows=len(column_head_list) - 1, cols=1)
for j in range(1, len(column_head_list)):
    column_head = column_head_list[j]
    trance = go.Scatter(x=df['日期'], y=df[column_head], mode="lines", name=column_head)
    fig.append_trace(trance, j, 1)
    fig.update_layout(width=1500, height=((len(column_head_list)-1))*600)
py.plot(fig)

多维度子图展示

具体实现效果如下

可以看到，我们将不同维度的数据，展示在各个图上，可以直观的看到涨跌幅相较于价格的变化趋势。

; 多个文件分列展示在同一画布

在前面的基础上，增加一个使用场景：如果存在多个文件想要展示在同一个画布上的需求，可以做简单分析
如果有两个文件，可以分别将两个文件规划在两列，实现思路：
1.循环读取两个文件，存储为两个对象
2.两个文件的列数不一致的情况，取出列数中大的一个，作为子图的行数（因为子图行数是按照文件的列数去画的，取大的一个，使得另一个列数少的能够全部展示完，没有数据，则不做渲染）
3.分别将两个文件，规划在两列

import plotly.offline as py
import pandas as pd
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import os

files = ''
root = ''
for root, dir, files in os.walk('csv_file'):
    print('all file name:', files)

df_list = []
column_list = []
for file in files:
    file_name = root + '/' + file
    df = pd.read_csv(file_name)
    df_list.append(df)

    column_num = len(df.columns.values)
    column_list.append(column_num)

max_num = max(column_list)

fig = make_subplots(rows=max_num - 1, cols=len(files))
for i in range(len(df_list)):
    df = df_list[i]
    column_head_list = df.columns.values
    for j in range(1, len(column_head_list)):
        column_head = column_head_list[j]
        trance = go.Scatter(x=df['日期'], y=df[column_head], mode="lines", name=column_head)

        fig.append_trace(trance, j, i + 1)
    fig.update_layout(width=1300, height=((len(column_head_list) - 1)) * 600)

py.plot(fig)

多文件子图展示

根据以上的思路，画出的图展示如下：

为了方便对比效果，没有让两个文件的列数一致
第一个文件只有两列，第二个文件则是所有数据，可以看到，我们取的列数较大的一个文件，也就是右边文件的列数，作为子图的行数，右边文件的子图全部展示，左边文件没有的列，则没有渲染，实际使用中也会比较灵活。
两个文件的情况还可以接受，文件过多则不建议使用这种方式，太多的列挤在一起，每个图个比例相应的被缩小，不是很利于观察。反之，我们可以将每个文件分别画在一个画布上，实现的方式和这个大同小异了。

欢迎来交流，有问题可以私信

更多的类型的图：https://plotly0icopy0site.4×5.top/

如果对你有帮助，可以请博主咖啡哟~~ ☕️

Original: https://blog.csdn.net/weixin_43643587/article/details/120353275
Author: Richard.sysout
Title: pandas+plotly实现数据图表的绘制和多维度下多个子图的展示

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/678901/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

一文解决VS Code安装、C++环境配置、OpenCV配置

前言本文包括 VScode安装、 C++环境配置以及 OpenCV配置全过程。VS Studio配置OpenCV比较简单，可以直接使用OpenCV官网已有的用VS Studio编…

人工智能 2023年7月19日
00100
[总结] 半监督学习方法: 一致性正则化(Consistency Regularization)

许多机器学习方法中, 尤其是深度学习中的神经网络, 都存在几个问题: 模型容易过拟合. 模型在受到微小扰动(噪声)后, 预测结果会受相当程度的影响. 为了减少过拟合现象, 典型的监…

人工智能 2023年7月26日
0067
tensorflowJS入门以及数据可视化美国金县的房价预测

前言 tensorflowJS是一个基于javascript的机器学习库，由tensorflow官方团队移植到javascript并进行维护。可以在web和node环境下运行。为了…

人工智能 2023年5月25日
0064
NanoDet代码逐行精读与修改（四）动态软标签分配：dynamic soft label assigner

–neozng1@hnu.edu.cn 4. Dynamic Soft Label Assigner 4.1. 初始化和参数 4.2. 筛除不在ground truth…

人工智能 2023年7月9日
0059
LiveVideoStack Meet回归北京站：未来会更卷吧？

点击上方”LiveVideoStack”关注我们 9月25日，新回归的LiveVideoStack Meet第一站在北京举行，嘉宾们分享技术、趋势与如何应对…

人工智能 2023年6月18日
0097
论文笔记：U2Fusion A Unified Unsupervised ImageFusion Network（2020 TPAMI）

U2Fusion: A Unified Unsupervised Image Fusion Network 【引用格式】： Xu H , Ma J , Jiang J , et …

人工智能 2023年5月26日
00100
ONNX YOLOv6目标检测，GitHub搜索引擎，Tooll 3 实时动画创建，汇编通俗入门，AI前沿论文 | ShowMeAI资讯日报

ShowMeAI 日报系列全新升级！覆盖AI人工智能工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文等方向。点…

人工智能 2023年7月9日
0067
深度学习中图像增强技术的综合综述

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月17日
0062
Linux安装python显示“软件包python没有可安装候选”

在Linux中安装python时，调用”sudo apt-get install python”命令出现以下问题：sudo apt-get install …

人工智能 2023年7月4日
00110
np.arange()和np.linspace()绘制logistic回归图像时得到不同的结果？

1.公式 logistic回归函数的公式： logistic回归函数的导数公式： σ'(x) = σ(x) * ( 1 – σ(x) ) 2.np.arange()函数…

人工智能 2023年6月17日
00142
python（模块）xlwt

目录一、xlwt简介二、xlwt语法 * 1、模块安装 2、模块导入 3、向xls文件中写入内容 4、设置写入文件的格式 – 4.1 字体设置（font） 4.2 …

人工智能 2023年7月4日
0067
knowledge graph embedding—Trans全家桶

知识图谱（knowledge graph）是一种具有多种节点类型和多种连接关系的网络，因为其可以表示现实世界中丰富的关系而得到重视，从知识图谱中挖掘出有用的信息称为研究的一个热点。…

人工智能 2023年6月10日
0067
YOLOv5的Tricks | 【Trick6】学习率调整策略（One Cycle Policy、余弦退火等）

如有错误，恳请指出。文章目录 0. Yolov5的学习率调整方案 1. LR Range Test 2. Cyclical LR 3. One Cycle Policy 4. S…

人工智能 2023年7月20日
0090
基于yoloV7-pose添加任意关键点＋多类别分类网络修改

一修改思想目前yoloV7已经发布有一段时间了，其中yoloV7有一个关键点检测的分支pose，是一个姿态关键点的检测算法，其中有给出的数据，大家可以下载运行起来。由于实际项目…

人工智能 2023年7月3日
0055
python pandas模块读取excel_利用python的pandas库读取excel数据文件数据

数据文件格式有xlsx、xls、csv，利用pandas库可将数据文件读取到python中，亦可将python处理好的数据导出为excel文件。读取xlsx、xls文件 pand…

人工智能 2023年7月7日
0048
iNeuOS工业互联网操作系统，数据点、设备和业务的计算与预警

目录概述… 2 概念解释… 2 数据点的计算与预警… 2 设备的计算与预警… 3 业务的计算与预警… 4 概述 iN…

人工智能 2023年6月4日
00220

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30