pandas pivote_table透视表

用法

pandas.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All', observed=False, sort=True)

参数介绍

参数介绍data传入的数据,以dataframe形式values需要聚合的列名,单个列名或者列表形式index索引,一个或多个索引columns列名称aggfunc聚合函数,默认为numpy.mean,如果传入的是字典类似agg{‘key’: ‘value’},键为要聚合的列,值为聚合的函数fill_value需要填充的值dropna删空值margin边(这个会在下面使用图来表示)margins_name聚合边的名字

案例

import numpy as np
import pandas as pd
df = pd.DataFrame({"A": ["foo", "foo", "foo", "foo", "foo",
                         "bar", "bar", "bar", "bar"],
                   "B": ["one", "one", "one", "two", "two",
                         "one", "one", "two", "two"],
                   "C": ["small", "large", "large", "small",
                         "small", "large", "small", "small",
                         "large"],
                   "D": [1, 2, 2, 3, 3, 4, 5, 6, 7],
                   "E": [2, 4, 5, 5, 6, 6, 8, 9, 9]})
df

pandas pivote_table透视表

table = pd.pivot_table(df, values='D', index=['A', 'B'], columns=['C'], aggfunc=np.sum)
table

pandas pivote_table透视表
可以看到聚合后会有NaN的值,可以使用fillna进行填充
table = pd.pivot_table(df, values='D', index=['A', 'B'], columns=['C'], aggfunc=np.sum, fill_value=0)
table

pandas pivote_table透视表
对不同的列进行不同的聚合

table = pd.pivot_table(df, values=['D', 'E'], index=['A', 'C'],aggfunc={'D': np.sum,
                                                                        'E': np.mean})
table

pandas pivote_table透视表
也可以对某一列,进行多个函数处置

table = pd.pivot_table(df, values=['D', 'E'], index=['A', 'C'],aggfunc={'D': np.mean,
                                                                        'E': [min, max, np.mean]})
table

pandas pivote_table透视表
接下来讲下 margins这个参数
聚合之后,如上图,也可以进行求总数
table = pd.pivot_table(df, values=['D', 'E'], index=['A', 'C'],aggfunc=sum,margins=True)
table

pandas pivote_table透视表
可以对margins更换名字
使用参数margins_name=
table = pd.pivot_table(df, values=['D', 'E'], index=['A', 'C'],aggfunc=sum,margins=True,margins='Total')
table

pandas pivote_table透视表
pandas pivote_table透视表

columns

df = pd.DataFrame({"A": ["foo", "foo", "foo", "foo", "foo",
                         "bar", "bar", "bar", "bar"],
                   "B": ["one", "one", "one", "two", "two",
                         "one", "one", "two", "two"],
                   "C": ["small", "large", "large", "small",
                         "small", "large", "small", "small",
                         "large"],
                   "D": [1, 2, 2, 3, 3, 4, 5, 6, 7]})
table = pd.pivot_table(df, columns='C',index=['A', 'B'],aggfunc={'D': np.sum},margins=True,margins_name='Total')
table

pandas pivote_table透视表

Original: https://blog.csdn.net/KIKI_ZSH/article/details/123400003
Author: Vergil_Zsh
Title: pandas pivote_table透视表

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/677847/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球