Pandas知识点-详解行列级批处理函数apply

2023年8月16日下午6:48 • Python • 阅读 67

Pandas知识点-详解行列级批处理函数apply

在Pandas中，DataFrame和Series等对象需要执行批量处理操作时，可以借用apply()函数来实现。
apply()的核心功能是实现”批量”调度处理，至于批量做什么，由用户传入的函数决定（自定义或现成的函数）。函数传递给apply()，apply()会帮用户在DataFrame和Series等对象中（按行或按列）批量执行传入的函数。
先看一个例子：


import pandas as pd

df = pd.DataFrame({'Col-1': [1, 3, 5], 'Col-2': [2, 4, 6], 'Col-3': [9, 8, 7], 'Col-4': [3, 6, 9]},
                  index=['A', 'B', 'C'])
print(df)
df_new = df.apply(lambda x: x-1)
print('-' * 30, '\n', df_new, sep='')

   Col-1  Col-2  Col-3  Col-4
A      1      2      9      3
B      3      4      8      6
C      5      6      7      9
Col-1    5
Col-2    6
Col-3    9
Col-4    9
dtype: int64
Col-1    1
Col-2    2
Col-3    7
Col-4    3
dtype: int64

def make_ok(s):
    return pd.Series(['{}ok'.format(d) for d in s])

df4 = df.apply(make_ok)
print('-' * 30, '\n', df4, sep='')

   Col-1  Col-2  Col-3  Col-4
0  1ok-列  2ok-列  9ok-列  3ok-列
1  3ok-列  4ok-列  8ok-列  6ok-列
2  5ok-列  6ok-列  7ok-列  9ok-列
   Col-1  Col-2  Col-3  Col-4
A  1-yes  2-yes  9-yes  3-yes
B  3-yes  4-yes  8-yes  6-yes
C  5-yes  6-yes  7-yes  9-yes
   Col-1  Col-2  Col-3  Col-4
0  1-yes  2-yes  9-yes  3-yes
1  3-yes  4-yes  8-yes  6-yes
2  5-yes  6-yes  7-yes  9-yes

在apply()中，func函数的第一个参数默认会传入Series对象，这就是前面说的”将列/行作为Series对象传递给函数”，因此函数func至少要有一个参数，这个参数相当于类方法中的self，不需要在args中传值。如果func没有参数，则不能在apply中使用。
如果func的参数多于一个，则多出来的参数通过args传递，args接收一个元组，args里只有一个值时，需要加上逗号。如果func中有关键字参数，可以传到apply中kwds的位置。
传入多个函数进行聚合**

df10 = df.apply([np.max, np.min])
print('-' * 40, '\n', df10, sep='')
df11 = df.apply({'Col-1': np.mean, 'Col-2': np.min})
print('-' * 40, '\n', df11, sep='')
df12 = df.apply({'Col-1': [np.mean, np.median], 'Col-2': [np.min, np.mean]})
print('-' * 40, '\n', df12, sep='')

Col-1    3.0
Col-2    2.0
dtype: float64
A    3.75
B    5.25
C    6.75
dtype: float64
   Col-1  Col-2  Col-3  Col-4 Col-x
A      1      2      9      3   1ok
B      3      4      8      6   3ok
C      5      6      7      9   5ok
A    2ok
B    4ok
C    6ok
Name: Col-2, dtype: object
a    0ok
b    1ok
c    2ok
d    3ok
e    4ok
dtype: object

DataFrame中的一行或一列都是一个Series，所以用DataFrame的列或行调用apply()就相当于Series调用apply()。
在DataFrame中，apply()将行/列作为Series传给func函数，在Series中，apply()将Series中的每一个值传给func函数。对于这两种情况，func接受的参数类型完全不一样，因此使用时一定要注意func函数的参数类型，否则可能不适用。

s2 = s.apply(np.mean)
print('-' * 20, '\n', s2, sep='')
s3 = np.mean(s)
print('-' * 20, '\n', s3, sep='')

2.0

将Series中的每一个值传给apply()中的函数func，返回的结果仍然是一个Series。将Series作为一个整体传给apply()中的函数func，有些函数返回的结果仍然是Series，如上面的自定义函数，有些函数返回的结果不再是Series，而是一个其他类型的数据，如numpy中的统计运算函数（mean、max、min）等。
因此DataFrame经过apply()批处理后，可能会变成一个Series，这是由apply()中的函数func的返回值决定的，与apply()无关。
以上就是pandas中的apply()函数的用法介绍和分析，希望对你有帮助，想要深入的了解apply()函数的底层原理，可以打个断点，在”Debugger”模式中看运行过程，也可以看源码。如果你有其他的想法或疑问，欢迎加我好友一起交流讨论。

参考文档：
[1] pandas中文网：https://www.pypandas.cn/docs/

Original: https://blog.csdn.net/weixin_43790276/article/details/125532026
Author: 小斌哥ge
Title: Pandas知识点-详解行列级批处理函数apply

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/751394/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

最新最全面的Spring详解（一）——Spring概述与IOC容器

前言本文为【Spring】Spring概述与IOC容器相关知识，下边将对 Spring概述， IOC容&am…

Python 2023年10月7日
0055
元宇宙时空——元宇宙是什么

未来已来的元宇宙，它究竟是什么，将带给我们生活、学习、工作怎样的改变，想必是很多人的好奇和疑惑。通过对元宇宙三部曲的阅读（《元宇宙》《元宇宙通证》《元宇宙大投资》），这些答案慢慢浮…

Python 2023年10月29日
0042
Sublime text 4 + Anaconda3 + conda配置Python开发环境（记录）

一、下载安装sublime text 4 下载地址为 :Sublime Text – Text Editing, Done Right https://www.subl…

Python 2023年9月8日
0066
创建一个Django项目总结

2022-09-25 首先，要安装好虚拟环境，之后要切换到虚拟环境中，使用的命令之后，创建一个Django项目使用的命令：进入到该项目的目录下，创建一个子应用，使用的命令：其…

Python 2023年10月31日
0046
Unity打包WebGL平台如何区别移动端和电脑端

Unity打包WebGL平台如何区别移动端和电脑端完整解决方案前情提要最近有一个项目，其中有一个功能来控制角色移动，电脑端是使用WASD（键盘）控制，手机移动端呢使用虚拟摇杆…

Python 2023年9月29日
0054
简单的Django项目

1，项目展示此次项目是一个 very简陋的Python web项目，是一个青青草原小羊展示系统，感兴趣的话就看下去叭！项目展示如下：用户注册：登录页面：首页：详情页（以懒…

Python 2023年8月2日
0072
Python图像处理丨图像的灰度线性变换

摘要：本文主要讲解灰度线性变换。一.图像灰度线性变换原理图像的灰度线性变换是通过建立灰度映射来调整原始图像的灰度，从而改善图像的质量，凸显图像的细节，提高图像的对比度。灰度线性…

Python 2023年11月1日
0049
Windows11+wsl2+cuda+conda+pytorch安装记录之处处都是坑

由于代码在windows上运行总是抛奇奇怪怪的错误，一怒之下换linux环境运行，win11自带的wsl很方便，在各种博客找了n多教程，历时两天，终于安装好了环境，配置这个环境的目…

Python 2023年9月9日
00120
利用python对数据进行分组统计

SQL经常将聚合函数与GROUP BY进行组合，对数据进行分组统计分析，python在分析数据中也可以实现相同的功能，而且python也是用GROUPBY 首先创建一个数据表 im…

Python 2023年8月20日
0045
python数据可视化-matplotlib入门(6)-从文件中加载数据

前面的文章都是手工输入或随机函数生成的数据。实际上有许多类型的文件，以及许多使用它们来从文件中提取图形数据的方法。 [En] The previous articles are a…

Python 2023年5月24日
0079
【定制项目】【M13】【数据监控 + 数据分析 + 可视化大屏】- 关键技术 python flask + pandas + echarts + excel

目录一、项目需求二、项目架构三、项目源码分析 1、http服务器：Python Flask 框架； http 代码接口解析 2、文件监控：Python win32con 模…

Python 2023年8月14日
0061
年近三十，真的卷不动了

年近三十，真的卷不动了，新技术层出不穷，这个还没摸清门道，那个就已经开始流行使用了。跟其他行业的朋友吐槽，他说你学呀，你们这行不就是终身学习的嘛。我苦笑，平时早上七八点出门工…

Python 2023年10月17日
0036
深度学习-LeNet（第一个卷积神经网络）

文章目录简介数据集模型搭建模型训练模型测试前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。简介 LeNet模型是在1…

Python 2023年10月8日
0046
pygame打包一次通过

2.查看安装的版本信息pyinstaller -v 3.进入需要打包的文件的路径下->pyinstaller -F -w main.py -p game_engine.py …

Python 2023年9月23日
0027
python_matplotlib基础教程

4、使用 xlabel() 和 ylabel() 方法来设置 x 轴和 y 轴的标签。 5、使用 title() 方法来设置标题。 6、使用 pyplot 中的 grid() 方法…

Python 2023年6月16日
0072
JavaScript之数组高阶API—reduce()

一文搞懂JavaScript数组中最难的数组API——reduce() 前面我们讲了数组的一些基本方法，今天给大家讲一下数组的reduce(),它是数组里面非常重要也是比较难的函数…

Python 2023年10月15日
0043

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pandas知识点-详解行列级批处理函数apply

Pandas知识点-详解行列级批处理函数apply

大家都在看