python数据分析透视表，定制你的分析计算需求

2023年8月21日下午12:18 • Python • 阅读 47

透视表是一种可以对数据动态排布并且分类汇总的表格格式，在常用的python的数据分析非标准库pandas中体现为pivot_table模块。

pivot_table数据透视表可以灵活的定制数据分析需求进行汇总，当然在Excel办公操作中早就存在了数据透视表的工具。如今，数据透视表被应用在python语言中更是给我们带来了大大地便利。

pivot_table有四个最重要的参数index、values、columns、aggfunc，通过设置不同的参数属性从而完成不同的数据分析需求。

pivot_table是pandas非标准库下面的数据透视表模块，因此需要安装pandas非标准库。按照以往的惯例还是采用pip的方式来进行安装即可。

pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple/

首先，使用传统的excel读取函数read_excel将Excel文件中的数据读取出来，读取数据返回的是Dataframe格式的数据。

import pandas as pd

df = pd.read_excel('C:/test/data.xlsx')

print(df.tail())

1、pivot_table函数index属性

我们通过pandas的read_excel函数已经将Excel数据文件读取并返回DataFrame数据对象。接下来通过数据透视表的方式来进行数据汇总，先来看看使用index属性是如何汇总结果的。

print(pd.pivot_table(df, index=[u'名称']))

上面我们只指定了一个索引’名称’字段，从结果可以看出pivot_table函数自动将名称为’Python 集中营’的值汇总了一下，并且将其他的数字属性的字段全部计算得到了均值。

print(pd.pivot_table(df, index=[u'名称', u'表现']))

若是我们使用了两个或是两个以上的字段作为index的值则实际上会进行两次或两次以上的分组，这里体现为先对’名称’字段进行分组、其次再对’表现’字段进行分组。

2、pivot_table函数values属性

values属性即在使用时将指定的字段显示出来，因为有的情况下并不需要将所有的字段都展示出来往往可能用到的是其中的几个字段的值来参与运算。

print(pd.pivot_table(df, index=[u'表现'], values=[u'班级', u'成绩']))

需要注意的是values属性只能用来指定具有数字属性的字段，可能为了能够更好的实现分组统计的效果吧！

3、pivot_table函数aggfunc属性

aggfunc属性则是对计算方式的设置，也可以同时设置好几种计算方式将结果展示出来。在前面的统计中并没有设置，默认则是使用均值的算法来统计汇总信息的。

下面设置两种的计算方式来统计我们之前的结果，一种还是均值、另一种则是求和的方式将两种计算模式下的结果都统计出来。

print(pd.pivot_table(df, index=[u'名称'], values=[u'年龄', u'成绩'], aggfunc=['mean', 'sum']))

可以发现汇总结果分别汇总出来了年龄和成绩的平均值、总和，效果还是相当理想的。

4、pivot_table函数columns属性

columns属性主要用来显示字符类型的字段的，若是字段对应的所在行没有值时则可以使用fill_value函数来填充默认值使数据变得完整，一般来说columns和fill_value是搭配使用的。

print(pd.pivot_table(df, index=[u'名称'], values=[u'年龄', u'成绩'], aggfunc=['mean', 'sum'], columns=[u'表现'],
                     fill_value=0))

Original: https://blog.csdn.net/chengxuyuan_110/article/details/127032055
Author: Python 集中营
Title: python数据分析透视表，定制你的分析计算需求

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/755714/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Redis数据库 —- 五种数据类型常用命令汇总

❤️ 作者简介：大家好我是小鱼干儿♛是一个热爱编程、热爱算法的大三学生，蓝桥杯国赛二等奖获得者 🐟 个人主页：https://blog.csdn.net/qq_52007481 …

Python 2023年11月5日
0052
【动手学习深度学习】数据预处理知识补充——Pandas库

Pandas 库是最常见的工具，提供了能够便捷地完成选取、重塑、切片、聚合等复杂精细的操作，可以对数据进行读取、选择、整理、描述、分组、分割、合并、变形，处理缺失值、异常值和重复值…

Python 2023年8月18日
0049
python dataframe删除某一列_Python进行数据处理之Pandas的drop函数

删除表中的某一行或者某一列更明智的方法是使用drop，它不改变原有的df中的数据，而是返回另一个dataframe来存放删除后的数据。本文出处主要来源于必备工具书《利用python…

Python 2023年8月7日
0071
Django框架前后端开发之前后台集成超好用ckeditor富文本编辑器超详demo

这几年一直在it行业里摸爬滚打，一路走来，不少总结了一些python行业里的高频面试，看到大部分初入行的新鲜血液，还在为各样的面试题答案或收录有各种困难问题于是乎，我自己开发了一…

Python 2023年8月4日
0062
【机器学习】李宏毅——AE自编码器(Auto-encoder)

1、What 在自编码器中，有两个神经网络，分别为Encoder和Decoder，其任务分别是： Encoder：将读入的原始数据（图像、文字等）转换为一个向量 Decoder：将…

Python 2023年10月11日
0085
pytorch超详细安装教程，Anaconda、PyTorch和PyCharm整套安装流程

本文介绍基于Anaconda环境以及PyCharm软件结合，安装PyTorch深度学习框架。 PyTorch深度学习框架详细安装教程 * – 一、anaconda安装 …

Python 2023年8月1日
0053
Anaconda/pip 更换阿里源，助力 conda create -n 虚拟环境搭建

由于网络和时间的限制，很多的 conda 源，如清华源，中科大源都需要想办法才能创建好虚拟环境（如本人发现的将清华源中的 https:// 改为 http:// 之后效果好很多）…

Python 2023年9月7日
0060
汇编逆向-Qt

Qt源码解析索引汇编逆向— 授权破解示例分析问题模拟运行环境 x64dbg Windows 10 Qt5.12.3 示例代码使用Qt显示当前时间，模拟一般授权软件的时间判…

Python 2023年10月7日
0040
vpython 贞测碰撞_Python碰撞检测

我已经尝试添加碰撞检测一段时间了，但似乎做不到。。在我只是用x，y坐标画地图：from setup import * treeload = “Images/tree….

Python 2023年9月24日
0041
Python学习：len() 函数详解：获取字符串长度或字节数、join()方法：合并字符串

Python中，要想知道一个字符串有多少个字符（获得字符串长度），或者一个字符串占用多少个字节，可以使用len()函数。语法格式： len(string) string 用于指定…

Python 2023年6月9日
0093
图解来啦！机器学习工业部署最佳实践！10分钟上手机器学习部署与大规模扩展 ⛵

💡 作者：韩信子@ShowMeAI📘 机器学习实战系列：https://www.showmeai.tech/tutorials/41📘 深度学习实战系列：https://www.s…

Python 2023年10月24日
0066
Python配置web.py及简单使用

一、安装web.py 本文这里直接是在Pycharm上安装的web.py框架，在终端上，执行如下命令，安装web.py： pip install web.py 安装非常快，web…

Python 2023年8月13日
0039
特征工程之数据预处理-重复值缺失值及异常值处理

#重复值处理 import pandas as pd data=pd….

Python 2023年8月8日
0046
深度理解微服务

🥲 🥸 🤌 🫀 🫁 🥷 🐻‍❄️🦤 🪶 🦭 🪲 🪳 🪰 🪱 🪴 🫐 🫒 🫑 🫓 🫔 🫕 🦤 🪶 🦭 🪲 🪳 🪰 🪱 🐻‍❄️ 🫐 🫒 🫑 🫓 🫔 🫕♔博主昵称：�欢快↑㎡🕍博客主页…

Python 2023年9月15日
0052
【Django学习笔记 – 8】：session的配置和使用、类视图初使用

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

Python 2023年8月4日
0044
pdfplumber模块的简单使用

pdfplumber专注PDF内容提取，例如文本（位置、字体及颜色等）和形状（矩形、直线、曲线），还有解析表格的功能。 1.简介 pdfplumber专注PDF内容提取，例如文本（…

Python 2023年6月11日
00126

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

python数据分析透视表，定制你的分析计算需求

大家都在看