1、数据转换
1、apply,applymap应用
apply对DataFrame中的某一Series进行操作,上例中将Python中的成绩统一加100,使用的是简单隐式函数。
applymap是DataFrame中专有的,可以同时计算DataFrame中的每一个元素。
applymap可以同时将DataFrame中的所有数据进行操作。
2、transform使用
1、对一列执行一种操作
2、对一列执行多种操作
3、对多列执行不同操作
3、重排随机抽样哑变量
numpy中的方法permutation用于随机排列十个变量,然后将其赋值为行索引,按照随机排列的索引输出。
哑变量,是独热编码,1表示有,0表示没有。示例中,0,1索引有b,所以b在0,1索引下显示为1。
2、数据重塑
.T转置。
多层索引pd.MultiIndex.from_product
多层列索引。
行索引转为列索引,默认最里层调整。
列索引转变行索引
多层索引运算。
计算个人期中期末的总分数
计算各科,期中期末的平均分
4、数学和统计方法
1、简单统计指标
统计各科60分以下的,60分一下为空数据标记出来。
统计非空数据,也就是及格人数。
统计中位数。
统计最高分。
索引标签,获得最大值,最小值位置。
5、数据排序
当前行索引是一个乱序,根据索引列名排序
根据python的属性来排序。
先根据Python排序,后根据Keras排序
6、分箱操作
指定宽度分箱,将成绩划分为4个等级
之前学过的transform和map,apply也有同样功能。
等频分箱
6、分组聚合
计算男女各科成绩平均分
计算男女个数
计算男女在各班的人数
获取每个班,男生女生最高分
分组聚合agg
通过agg,分类后进行多种统计汇总。
Original: https://blog.csdn.net/weixin_55800047/article/details/123174975
Author: Bumblebee972
Title: Pandas进阶
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/697852/
转载文章受原作者版权保护。转载请注明原作者出处!