Python – Pandas 数据分组groupby

2023年8月19日上午6:01 • Python • 阅读 62

本文摘要：

; 分组后使用聚合函数统计

df为

单个列groupby，查询所有数据列的统计

df.groupby('A').sum()

返回结果，可见A变成索引列，里面的值进行了分类有bar、foo。因为调用sum函数，B列不是数字，自动忽略。

2. 多列groupby，查询所有数据列的平均数

df.groupby(['A', 'B']).mean()

A、B变成了二级索引

如果不希望A、B变成索引，可以修改as_index参数为False

df.groupby(['A', 'B'], as_index=False).mean()

同时查看多种数据统计结果，这里用到了numpy里的函数

df.groupby('A').agg([np.sum, np.mean, np.std])

列变成了多级索引

4. 查看单列的数据统计结果


df.groupby('A')['C'].agg([np.sum, np.mean, np.std])

df.groupby('A')['C'].max()

不同列使用不同函数

df.groupby('A').agg({'C': np.sum, 'D': np.mean})

获取某个分组的数据

按某一列分组的情况：

g = df.groupby('A')

for name, group in g:
    print(name)
    print(group)
    print()

通过get_group方法获取某个分组的数据

g.get_group('bar')

按多列分组的情况：

g = df.groupby(['A', 'B'])

这里的返回结果name就是一个包含两个元素的元组
所以可以这么获取分组的数据

g.get_group(('foo', 'one'))

此文仅为个人笔记

Original: https://blog.csdn.net/DreamingBetter/article/details/123816046
Author: DreamingBetter
Title: Python – Pandas 数据分组groupby

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/753699/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Java全栈学习路线】最全的Java学习路线及知识清单，Java自学方向指引

前言自学Java怎么学，找对方向很关键！在这里为大家分享最全的架构师级 Java全栈学习&…

Python 2023年9月17日
0049
【数学建模学习笔记【集训十天】之第三天】

数模学习目录 Numpy 学习（续） * – 1-numpy.array 2-numpy.empty 3-numpy.zeros 4-numpy.ones 1 NumP…

Python 2023年8月23日
0055
基于php的简单图书管理系统，登录，注册，退出登录，数据库增删改查，建立sessioon ，建立mysql数据库。

一.建立MySQL数据库二.链接数据库文件（conn.php）三.前端登录页面（log.php）四.登录实现页面（log_ok.php）五.前端注册页面（register….

Python 2023年10月10日
0069
08 Django3的ASGI

Django3的ASGI 1、Web应用程序和web服务器 Web应用程序（Web）是一种能完成web业务逻辑，能让用户基于web浏览器访问的应用程序，它可以是一个实现http请求…

Python 2023年8月4日
0039
同态加密详解

什么是同态加密同态加密（Homomorphic Encryption）是指将原始数据经过同态加密后，对得到的密文进行特定的运算，然后将计算结果再进行同态解密后得到的明文等价于原始…

Python 2023年11月8日
0044
python在工厂中的应用_python – 无法在“运行”模块中找到Flask应用程序或工厂 – 堆栈内存溢出…

我正在尝试运行一个简单的连接REST-API。我已经在run.py上实例化了connexion的实例。 import os import connexion from flask…

Python 2023年8月14日
0066
【赵渝强老师】MySQL的闪回

MySQL DBA或开发人员，有时会误删或者误更新数据，如果是线上环境并且影响较大，就需要能快速回滚。传统恢复方法是利用备份重搭实例，再应用去除错误sql后的binlog来恢复数据…

Python 2023年6月3日
0070
Web Spider NEX XX国际货币经纪 – PDF下载 & 提取关键词（二）

Web Spider NEX XX国际货币经纪 – PDF下载 & 解析 首先声&#x…

Python 2023年9月25日
0061
可爱猫+python3+Flask+aiohttp简单搭建微信机器人

之前一直在研究QQ机器人，最近发现一个微信机器人框架，在办公中来增加工作效率。一、需要环境：可爱猫（http://www.keaimao.com/）python3.8+ fla…

Python 2023年8月9日
0045
python怎样循环等待输入_如何暂停for循环并等待用户输入matplotlib

对不起，我的题目不太容易通读。在这是我的问题。在我正在尝试拍摄一个图片文件并循环遍历每个像素。在我想在每个像素上显示像素文件图像的matplotlib图形(完成) 一旦图形显…

Python 2023年9月7日
0054
Python数据分析三剑客学习笔记Day6——matplotlib包的使用：数据可视化，简单绘制柱状图、曲线图、饼图、频率分布直方图

本文是视频Python数据分析三剑客数学建模基础 numpy、pandas、matplotlib的学习笔记。———————————————————————————————————…

Python 2023年9月5日
0056
python pandas笔记

数据读取可以读取excel，csv等： df = pd.read_excel("Name.xlsx") df = pd.read_csv("Name…

Python 2023年8月16日
0041
python热力图代码_python热力图实现简单方法

在我们想要对不同变量进行判断的时候，会分析其中的之间的联系。这种理念同样也被用在实例生活中，最常见到的是做一个地理的热力图。很多人对画热力图的方法不是很清楚，我们可以先装好相关的工…

Python 2023年8月8日
0044
scrapy框架实战

👨‍💻更多精彩尽在博主首页：i新木优子👀🎉欢迎关注🔍点赞👍收藏⭐留言📝🧚‍♂️寄语:当你将信心放在自己身上时，你将永远充满力量👣✨有任何疑问欢迎评论探讨 什&…

Python 2023年10月1日
0033
将Django项目部署到云服务器

安装项目所需要的库文件：使用 pip install -r requirements.txt（txt文件名按自己的来）将自己项目中的配置信息文件批量安装不知道为什么我在下载库文…

Python 2023年8月5日
0048
ChatGPT通俗笔记：从GPT-N、RL之PPO算法到instructGPT、ChatGPT

写在最前面，为了彻底写清楚ChatGPT背后的所有关键细节，每个月不断深挖，从1月初写到6月底仍未完工，除了本文之外，过程中涉及到多篇文章(RL入门、论文解读、微调实战、代码实现、…

Python 2023年11月5日
0047

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Python – Pandas 数据分组groupby

本文摘要：

; 分组后使用聚合函数统计

获取某个分组的数据

大家都在看