#18 可视化基础4-簇形柱状图、百分比堆积柱状图、并列子图

2023年9月4日下午3:43 • Python • 阅读 55

plot.bar(“指定为x轴的columns”,[“指定为y轴的columns1″,”指定为y轴的columns2”,···])

e.g.对比每层楼的每月销量情况

「Dataframe的一列\Series」-绘制柱状图

Dataframe的一列\Series.plot.bar()

百分比堆积柱状图

plot.bar(“指定为x轴的columns”,[“指定为y轴的columns1″,”指定为y轴的columns2”,···],stacked=True)

并列子图

通过matplotlib.pyplot模块在子图上进行绘制

plt.subplot(子图的行数,子图的列数,子图的序号)

避免坐标轴遮挡-旋转x轴刻度

plt.xticks(rotation=度数)

绘制图像（叠加图）

matplotlib.pyplot模块+pandas模块
1. 百分比堆积柱状图（叠加图）
2. 簇形柱状图（叠加图）
3. 并列子图（叠加图）

一般情况下， 簇形柱状图和 百分比堆积柱状图这两种图像需要展示的数据往往是由多个分类组成，也就是要用到一个DataFrame或多个Series中的数据。
在使用matplotlib.pyplot绘制图像的同时，搭配pandas模块。

pandas模块本身具有绘图功能，此功能依赖于matplotlib模块，可简化从DataFrame和Series生成可视化的过程。

簇形柱状图

用来比较某一维度上的多个数据。
e.g.每一层楼的每月销量，i.e.同一维度上的多个数据。
对一个DataFrame对象，使用 pandas模块中的 plot.bar()函数。

「不指定x轴和y轴数据」

`plot.bar()`

对一个 DataFrame对象使用函数时， 行索引index会作为 x轴， 每一行数值类型的值会被分组到并排的柱子中作为 y轴。
同时，会根据x轴和y轴的数据，自动生成x轴标题和图例，以及x轴刻度会自动旋转90度。

「不指定x轴和y轴数据」

`plot.bar("` `指定为x轴的columns` `",["` `指定为y轴的columns1` `","` `指定为y轴的columns2` `",` `···` `])`

调用plot.bar()函数时，把DataFrame的列索引（columns）\包含列索引（columns）的列表，依次传入该函数中,指定x轴和y轴。

e.g.对比每层楼的每月销量情况

做完绘图准备工作后，对data变量使用 plot.bar()函数，并把列索引”month”和列索引列表[“first_floor”,”second_floor”,”third_floor”]依次传入到该函数中，指定x轴和y轴。

·列索引”month”被自动设置为x轴的标题

·用于指定y轴的列索引们会自动生成对应的图例

·x轴刻度会自动旋转90度

一个DataFrame对象

读取文件后，把生成的 DataFrame对象赋值给了 变量data。表示将对 data进行操作。

plot.bar()函数

x轴数据

传入 列索引”month”，指定 x轴数据。

y轴数据

一个列表，包含对应的多列索引（columns） “first_floor”,”second_floor”,”third_floor”指定这三列为 y轴数据。

根据下图的数据，以”month”为x轴，绘制对比”first_floor”、”second_floor”和”third_floor”销量的簇形柱状图。

导入matplotlib.pyplot，并使用"plt"作为该模块的简写
import matplotlib.pyplot as plt
导入pandas，并使用"pd"作为该模块的简写
import pandas as pd

使用pd.read_csv()函数 读取路径为 "/Users/yequ/书店每月销量数据.csv" 的CSV文件，并赋值给变量data
data = pd.read_csv("/Users/yequ/书店每月销量数据.csv")

通过给 plt.rcParams["font.sans-serif"] 赋值 将字体设置为 Arial Unicode MS
plt.rcParams["font.sans-serif"] = "Arial Unicode MS"

使用plot.bar()函数，以"month"为x轴
["first_floor","second_floor","third_floor"]为y轴
绘制簇形柱状图
data.plot.bar("month",["first_floor","second_floor","third_floor"])

使用plt.show()函数显示图像
plt.show()

通过 plt.xlabel()、 plt.ylabel()和 plt.title()函数设置 坐标轴标题和 图像标题：

使用plt.xlabel()函数，将x轴标题设置为"月份"
plt.xlabel("月份")
使用plt.ylabel()函数，将y轴标题设置为"销量"
plt.ylabel("销量")
使用plt.title()函数，将图表标题设置为"2019年8月至2020年7月书店每月各楼层销量走势"
plt.title("2019年8月至2020年7月书店每月各楼层销量走势")

「Dataframe的一列\Series」-绘制柱状图

Dataframe的一列\Series `.` `plot.bar()`

直接对Dataframe的一列\Series，i.e.只有一列数据，使用 plot.bar()，直接绘制出普通的柱状图。该函数自动将index作为x轴的值，values作为y轴的值。

直接对"first_floor"列，使用plot.bar()函数，绘制柱状图
data["first_floor"].plot.bar()

百分比堆积柱状图

显示单个项目与整体之间的关系，比较各个类别的每个数值所占总数值的比例。

e.g.每层楼的每月销量占当月总销量的比例

Step1 (x轴一般为类别型数据，y轴为数值型)求和得到每个类别的总和数值，并计算占比;

`plot.bar("` `指定为x轴的columns` `",["` `指定为y轴的columns1` `","` `指定为y轴的columns2` `",` `···` `],` `stacked=True` `)`

Step2 将pandas模块中的簇形柱状图绘制函数 plot.bar()函数的参数 stacked设置为True;
stacked=True会使DataFrame中每一行的值垂直堆叠放置，形成堆积柱状图

Step3 通过 plt.xlabel()、 plt.ylabel()和 plt.title()函数设置坐标轴标题和图像标题：

导入matplotlib.pyplot，并使用"plt"作为该模块的简写
import matplotlib.pyplot as plt
导入pandas，并使用"pd"作为该模块的简写
import pandas as pd

使用pd.read_csv()函数 读取路径为 "/Users/yequ/书店每月销量数据百分比.csv" 的CSV文件，并赋值给变量data
data = pd.read_csv("/Users/yequ/书店每月销量数据百分比.csv")

通过给 plt.rcParams["font.sans-serif"] 赋值 将字体设置为 Arial Unicode MS
plt.rcParams["font.sans-serif"] = "Arial Unicode MS"

使用plot.bar()函数 根据data变量，以"month"为x轴，["一楼","二楼","三楼"]为y轴 绘制百分比堆积柱状图
data.plot.bar("month",["一楼","二楼","三楼"],stacked=True)

使用plt.xlabel()函数，将x轴标题设置为"月份"
plt.xlabel("月份")
使用plt.ylabel()函数，将y轴标题设置为"占比"
plt.ylabel("占比")
使用plt.title()函数，将图表标题设置为"2019年8月至2020年7月书店每月销量占比"
plt.title("2019年8月至2020年7月书店每月销量占比")

使用plt.show()函数显示图像
plt.show()

并列子图

matplotlib的画布（Figure）对象至少包含一个子图，也就是一个坐标图形（Axes）对象。
一幅图像中，有多少个坐标图形，就有多少个子图。

通过matplotlib.pyplot模块在子图上进行绘制

`plt.subplot(`子图的行数,子图的列数,子图的序号 `)`

在matplotlib.pyplot模块中，绘制子图最常用 plt.subplot()函数。
plt.subplot()函数中有以下三个参数：
1. 子图的行数
2. 子图的列数
3. 子图的序号
前两个参数决定了图表的整个绘图区域会被分成几行几列。
子图的序号从1开始，按照从左到右，从上到下的顺序排列，最后一个参数指定了创建的子图对象所在的区域。

e.g. plt.subplot(2,2,1)将图像规则地划分为一个2×2（两行两列）的子图，并选择其中序号为1的子图。

「子图的划分不规则」，如图:

可以先将整个图像按照2×2划分，上面两个子图分别是 (2, 2, 1) 和 (2, 2, 2)。

第三个图占用了 (2, 2, 3) 和 (2, 2, 4)，需要对其重新划分, 将整个图像按照2×1划分。

创建一个2×2的图表框架后，准备在每个子图里进行绘图。
在对应的 plt.subplot()函数下，接上绘图的代码即可，matplotlib.pyplot会自动选择当前状态下的子图进行绘制。

使用plt.subplot()函数添加4个子图 两行两列
选择序号为1子图
plt.subplot(2,2,1)
使用plt.plot()函数绘制折线图
plt.plot(data["month"],data["sum"])

选择序号为2子图
plt.subplot(2,2,2)
使用plt.scatter()函数
以df["ads_fee"]为x轴的值和df["sales"]为y轴的值，绘制散点图
plt.scatter(df["ads_fee"],df["sales"])

选择序号为3的子图
plt.subplot(2,2,3)

选择序号为4子图
plt.subplot(2,2,4)

避免坐标轴遮挡-旋转x轴刻度

运行出来的图像，序号为1的子图上的折线图，横坐标刻度出现了重叠遮挡的情况。

`plt.xticks` `(rotation=度数)`

使用 plt.xticks()函数，将度数作为整数赋值给 rotation 参数，传入该函数中，来旋转x轴的刻度。
e.g.将横坐标的刻度旋转90度

使用plt.xticks()函数旋转x轴的刻度至90度
plt.xticks(rotation=90)

避免坐标轴遮挡-调整子图布局

旋转后，图像序号为1的x轴刻度又被序号为3的图像遮挡了。

`plt.tight_layout()`

在用plt.show()函数展示图像前，使用 plt.tight_layout()函数，来调整子图的布局，避免重叠

使用plt.tight_layout()函数来调整子图布局
plt.tight_layout()

以上，通过matplotlib.pyplot模块在子图上进行绘制。

在子图上使用pandas模块绘图

`ax=plt.gca()`

在子图上使用pandas模块绘图，需要在绘图的函数中，传入 ax=plt.gca()。
ax 参数用来指定 坐标图形（axes）对象，而 plt.gca()则是用来返回 当前状态下的坐标图形（axes）对象。
由于pandas模块不能像matplotlib.pyplot一样默认将图像绘制到当前的子图坐标轴上，所以需要传入 ax=plt.gca()，来确保图像绘制在当前子图的坐标轴中。

e.g，选择序号为3的子图，根据data的数据，使用pandas模块的 plot.bar()函数，以其中的”month”为x轴，来绘制对比”first_floor”、”second_floor”和”third_floor”销量的簇形柱状图：

选择序号为3的子图
plt.subplot(2,2,3)
使用plot.bar()函数和ax=plt.gca()
根据data中的数据
以"month"为x轴，["first_floor","second_floor","third_floor"]为y轴
绘制簇形柱状图
data.plot.bar("month",["first_floor","second_floor","third_floor"],ax=plt.gca())

使用常用的参数和函数，完善每个子图的图像。

导入matplotlib.pyplot，并使用"plt"作为该模块的简写
import matplotlib.pyplot as plt
导入pandas，并使用"pd"作为该模块的简写
import pandas as pd

读取路径为 "/Users/yequ/书店每月销量数据.csv" 的CSV文件，并将结果赋值给变量data
data = pd.read_csv("/Users/yequ/书店每月销量数据.csv")
读取路径为 "/Users/yequ/书店图书销量和广告费用.csv" 的CSV文件，并将结果赋值给变量df
df = pd.read_csv("/Users/yequ/书店图书销量和广告费用.csv")
使用pd.read_csv()函数
读取路径为 "/Users/yequ/书店每月销量数据百分比.csv" 的CSV文件，并赋值给变量percentData
percentData = pd.read_csv("/Users/yequ/书店每月销量数据百分比.csv")

通过 rcParams 参数将字体设置为 Arial Unicode MS
plt.rcParams["font.sans-serif"] = "Arial Unicode MS"

使用plt.subplot()函数添加4个子图
子图有两行两列
选择序号为1子图
plt.subplot(2,2,1)
使用plt.plot()函数绘制折线图
plt.plot(data["month"],data["sum"])
使用plt.xticks()函数旋转x轴的刻度至90度
plt.xticks(rotation=90)
使用plt.xlabel()函数，将x轴标题设置为"月份"
plt.xlabel("月份")
使用plt.ylabel()函数，将y轴标题设置为"销量"
plt.ylabel("销量")

选择序号为2子图
plt.subplot(2,2,2)
使用plt.scatter()函数
以df["ads_fee"]为x轴的值和df["sales"]为y轴的值，绘制散点图
plt.scatter(df["ads_fee"],df["sales"])
使用plt.xlabel()函数，将x轴标题设置为"广告费用"
plt.xlabel("广告费用")
使用plt.ylabel()函数，将y轴标题设置为"销量"
plt.ylabel("销量")

选择序号为3的子图
plt.subplot(2,2,3)
使用plot.bar()函数和ax=plt.gca()
根据data中的数据
以"month"为x轴，["first_floor","second_floor","third_floor"]为y轴
绘制簇形柱状图
data.plot.bar("month",["first_floor","second_floor","third_floor"],ax=plt.gca())
使用plt.xlabel()函数，将x轴标题设置为"月份"
plt.xlabel("月份")
使用plt.ylabel()函数，将y轴标题设置为"销量"
plt.ylabel("销量")

选择序号为4子图
plt.subplot(2,2,4)
使用plot.bar()函数，stacked=True和ax=plt.gca()
根据percentData中的数据
以"month"为x轴，绘制对比["一楼","二楼","三楼"]的百分比堆积柱状图
percentData.plot.bar("month",["一楼","二楼","三楼"],stacked=True,ax=plt.gca())
使用plt.xlabel()函数，将x轴标题设置为"月份"
plt.xlabel("月份")
使用plt.ylabel()函数，将y轴标题设置为"占比"
plt.ylabel("占比")

使用plt.tight_layout()函数来调整子图布局
plt.tight_layout()
使用plt.show()函数显示图像
plt.show()

以上可视化主要是用于观察和分析数据关系，需要将其用于报告展现的图表详见《Python数据可视化》。

Original: https://blog.csdn.net/m0_62366803/article/details/125196404
Author: Ag_MoonLi
Title: #18 可视化基础4-簇形柱状图、百分比堆积柱状图、并列子图

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/767825/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

gunicorn 进程不断重启，CRITICAL WORKER TIMEOUT

记录一个奇怪的问题，暂时解决，但是没有找到根本原因，有空再回来解决 gunicornconf.py import os home = ‘/home/ops’ print(‘home…

Python 2023年8月11日
00124
Python工具箱系列（九）

在计算机世界里，信息安全始终占据着重要的地位，我们随处就可以看到信息安全的应用： ◆ 访问网站时，使用https而不是http会使访问者的安全性大大提升 ◆ 下载文件时，正规的网站…

Python 2023年10月31日
0033
pandas 取数汇总

df = pd.DataFrame([[1, 2], [4, 5], [7, 8]], index=[‘cobra’, ‘viper’, ‘sidewinder’], column…

Python 2023年8月18日
0049
自动驾驶轨迹预测论文阅读（二）TPNet: Trajectory Proposal Network for Motion Prediction

论文链接：https://openaccess.thecvf.com/content_CVPR_2020/papers/Fang_TPNet_Trajectory_Proposal…

Python 2023年10月8日
0047
【求解】pyspark中文编码问题怎么解决？

最近使用python-spark遇到一个无法解决的中文编码问题。查了网上的资料和解决方法，都无法使之解决。不知道哪位大佬可以帮忙指点一二？问题摘要，python使用UTF8编…

Python 2023年8月22日
0053
微信小程序 | 小程序系统API调用

🖥️ 微信小程序专栏：小程序系统API调用🧑‍💼 个人简介：一个不甘平庸的平凡人🍬✨ 个人主页：CoderHing的个人主页🍀 格言: ☀️ 路漫漫其修远兮,吾将上下而求索☀️👉 …

Python 2023年11月4日
0039
windows 修改(pip/conda)镜像源

前言本文仅介绍了 Windows 环境下的 pip 和 conda 的镜像源修改方法， linux系统请移步主页另一篇博文。 1、什么是镜像源？国内的下载资源，国外源pip i…

Python 2023年9月7日
0056
Django 搭建博客网站-task00：环境配置

Django 搭建博客网站目录 Django 搭建博客网站前言一、软件和平台二、环境搭建步骤 * 1.下载 U b u n t u Ubuntu U b u n t u 2…

Python 2023年8月6日
0047
Python基于深度学习算法实现图书推荐系统项目实战

说明：这是一个机器学习实战项目（附带数据+代码+文档+视频讲解），如需数据+代码+文档+视频讲解可以直接到文章最后获取。 1.项目背景在线推荐系统是许多电子商务网站的事情。推…

Python 2023年9月26日
0033
Windows/Linux/Mac系统下的MySQL安装（全网最全步骤）

MySQL相关链接官方网站：https://www.mysql.com下载地址：https://dev.mysql.com/downloads/mysql英文教程：https://…

Python 2023年6月3日
0077
如何使用 IdGen 生成 UID

在分布式系统中，雪花 ID 是一种常用的唯一 ID 生成算法。它通过结合时间戳、机器码和自增序列来生成 64 位整数 ID，可以保证 ID 的唯一性和顺序性。在.Net 项目中，…

Python 2023年10月12日
0038
【spinning up】2.2 功能超全的强化学习画图脚本

功能超全的强化学习画图脚本文章目录功能超全的强化学习画图脚本 * 原始画图效果：加了九大功能：最终画图效果：多个子图绘制和图例legend位置调整：代码链接，有详细注释…

Python 2023年9月6日
0066
“小升初”数学题？看不起谁啊？用Python来解给你看看

前段时间，我在群里面发布了一道题。没想到明佬用心了，很快记下了，马上就用Python解答出来了。题目如下：小学题目都这么难，看不起谁呢。今天明佬将尝试通过Python来解题。首…

Python 2023年8月29日
0062
Python Matplotlib 基因表达可视化 (多层级散点图示意)

细胞群体基因表达测序结果可视化背景最近帮小陈处理了一下相关实验数据，Python结果展示效果还不错，记录一下。需求示意不同细胞群体的基因表达量测序结果可视化分析。预处理 …

Python 2023年9月5日
0063
Pandas数据分析19——pandas分类数据

参考书目：《深入浅出Pandas：利用Python进行数据处理与分析》 pandas中有专门的分类数据类型，虽然平时用的不多，但是也需要了解一下。读取spss文件时会自动生成分类数…

Python 2023年8月22日
0048
信息安全之弱口令和社工弱口令规律，及其反制措施（第一章）

本文只用于讨论和学习，由完全原创，若需要转载引用请在先与我联系，若有疑问或者错误的观点也可以评论区发言，谢谢。本文研究数据来源于：国内网上常见密码字典（China）、中国高校大学…

Python 2023年10月15日
0059

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

#18 可视化基础4-簇形柱状图、百分比堆积柱状图、并列子图

「不指定x轴和y轴数据」

plot.bar()

「不指定x轴和y轴数据」

plot.bar(" &#x6307;&#x5B9A;&#x4E3A;x&#x8F74;&#x7684;columns ",[" &#x6307;&#x5B9A;&#x4E3A;y&#x8F74;&#x7684;columns1 "," &#x6307;&#x5B9A;&#x4E3A;y&#x8F74;&#x7684;columns2 ", &#xB7;&#xB7;&#xB7; ])

e.g.对比每层楼的每月销量情况

一个DataFrame对象

plot.bar()函数

x轴数据

y轴数据

「Dataframe的一列\Series」-绘制柱状图

Dataframe的一列\Series . plot.bar()

plot.bar(" &#x6307;&#x5B9A;&#x4E3A;x&#x8F74;&#x7684;columns ",[" &#x6307;&#x5B9A;&#x4E3A;y&#x8F74;&#x7684;columns1 "," &#x6307;&#x5B9A;&#x4E3A;y&#x8F74;&#x7684;columns2 ", &#xB7;&#xB7;&#xB7; ], stacked=True )

通过matplotlib.pyplot模块在子图上进行绘制

plt.subplot(子图的行数,子图的列数,子图的序号 )

避免坐标轴遮挡-旋转x轴刻度

plt.xticks <span>(rotation=</span><span>&#x5EA6;&#x6570;</span><span>)</span>

避免坐标轴遮挡-调整子图布局

plt.tight_layout()

在子图上使用pandas模块绘图

ax=plt.gca()

大家都在看

`plot.bar()`

`plot.bar("` `指定为x轴的columns` `",["` `指定为y轴的columns1` `","` `指定为y轴的columns2` `",` `···` `])`

Dataframe的一列\Series `.` `plot.bar()`

`plot.bar("` `指定为x轴的columns` `",["` `指定为y轴的columns1` `","` `指定为y轴的columns2` `",` `···` `],` `stacked=True` `)`

`plt.subplot(`子图的行数,子图的列数,子图的序号 `)`

`plt.xticks` `<span>(rotation=</span><span>度数</span><span>)</span>`

`plt.tight_layout()`

`ax=plt.gca()`