Pandas进阶

1、数据转换

1、apply,applymap应用

Pandas进阶

apply对DataFrame中的某一Series进行操作,上例中将Python中的成绩统一加100,使用的是简单隐式函数。

applymap是DataFrame中专有的,可以同时计算DataFrame中的每一个元素。

Pandas进阶

applymap可以同时将DataFrame中的所有数据进行操作。

2、transform使用

1、对一列执行一种操作

Pandas进阶

2、对一列执行多种操作

Pandas进阶

3、对多列执行不同操作

Pandas进阶

3、重排随机抽样哑变量

Pandas进阶

numpy中的方法permutation用于随机排列十个变量,然后将其赋值为行索引,按照随机排列的索引输出。

Pandas进阶

哑变量,是独热编码,1表示有,0表示没有。示例中,0,1索引有b,所以b在0,1索引下显示为1。

2、数据重塑

.T转置。

Pandas进阶

多层索引pd.MultiIndex.from_product

Pandas进阶

多层列索引。

Pandas进阶

行索引转为列索引,默认最里层调整。

Pandas进阶

列索引转变行索引

Pandas进阶

多层索引运算。

计算个人期中期末的总分数

Pandas进阶

计算各科,期中期末的平均分

Pandas进阶

4、数学和统计方法

1、简单统计指标

Pandas进阶

统计各科60分以下的,60分一下为空数据标记出来。

Pandas进阶

统计非空数据,也就是及格人数。

Pandas进阶

统计中位数。

Pandas进阶

统计最高分。

Pandas进阶

索引标签,获得最大值,最小值位置。

Pandas进阶

5、数据排序

Pandas进阶

当前行索引是一个乱序,根据索引列名排序

Pandas进阶

根据python的属性来排序。

Pandas进阶

先根据Python排序,后根据Keras排序

Pandas进阶

6、分箱操作

指定宽度分箱,将成绩划分为4个等级

Pandas进阶

之前学过的transform和map,apply也有同样功能。

等频分箱

Pandas进阶

6、分组聚合

计算男女各科成绩平均分

Pandas进阶

计算男女个数

Pandas进阶

计算男女在各班的人数

Pandas进阶

获取每个班,男生女生最高分

Pandas进阶

分组聚合agg

通过agg,分类后进行多种统计汇总。

Pandas进阶

Original: https://blog.csdn.net/weixin_55800047/article/details/123174975
Author: Bumblebee972
Title: Pandas进阶

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/697852/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球