Pandas知识点-详解元素级批处理函数applymap和map
在Pandas中,apply()可以对DataFrame和Series按列或行批处理,applymap()和map()可以分别对DataFrame和Series进行元素级的批处理。
apply()批处理参考:Pandas知识点-详解行列级批处理函数apply
与apply()相同,applymap()和map()只负责”批量”调度处理,批量执行的具体内容,由用户传入的函数决定(自定义或现成的函数)。
1.applymap用法和参数介绍
applymap(self, func, na_action=None, kwargs) :
func: 应用于DataFrame每个元素的函数,这个函数可以是Python内置函数、Pandas或其他库中的函数、自定义函数、匿名函数。但函数必须满足一个参数、一个返回值。(returns a single value from a single value.)
na_action: 批处理时是否处理空值,支持两种设置:{None, ‘ignore’},默认为None,将空值作为np.nan传递给函数。如果将na_action设置为’ignore’,则批处理时跳过空值,不做处理。
kwargs: 传递给函数func的关键字参数,新版本的Pandas中才支持此参数,低版本不一定支持。使用pandas==1.2.1不支持,使用pandas==1.4.1支持。
2.applymap函数使用举例
import pandas as pd
import numpy as np
df = pd.DataFrame({'Col-1': [8, 3, 5], 'Col-2': [2, np.nan, 8], 'Col-3': [9, 8, 7], 'Col-4': [3, 6, 9]},
index=['X', 'Y', 'Z'])
print(df)
df2 = df.applymap(lambda x: x+10)
print('-' * 30, '\n', df2, sep='')
Col-1 Col-2 Col-3 Col-4
X 8 2.0 9 3
Y 3 NaN 8 6
Z 5 8.0 7 9
Col-1 Col-2 Col-3 Col-4
X 8ok 2.0ok 9ok 3ok
Y 3ok nanok 8ok 6ok
Z 5ok 8.0ok 7ok 9ok
Col-1 Col-2 Col-3 Col-4
X 8oooook 2.0oooook 9oooook 3oooook
Y 3oooook NaN 8oooook 6oooook
Z 5oooook 8.0oooook 7oooook 9oooook
applymap()不支持给func传位置参数,所以func必须只有一个位置参数,默认接收DataFrame中的元素。
applymap()不支持设置按列还是按行,因为applymap是对DataFrame的每个元素做处理,无需指定行/列。
applymap()不支持传入多个函数进行聚合处理,也不支持函数名用字符串的方式传入。
3.不使用applymap完成等价效果
df6 = df.applymap(np.square, na_action='ignore')
print('-' * 30, '\n', df6, sep='')
df7 = df ** 2
print('-' * 30, '\n', df7, sep='')
Col-1 Col-2 Col-3 Col-4
X 64 4.0 81 9
Y 9 NaN 64 36
Z 25 64.0 49 81
df8 = df.applymap(lambda x: x*2)
print('-' * 30, '\n', df8, sep='')
df9 = df.add(df)
print('-' * 30, '\n', df9, sep='')
Col-1 Col-2 Col-3 Col-4
X 16 4.0 18 6
Y 6 NaN 16 12
Z 10 16.0 14 18
有些用applymap()进行的批处理操作,用其他方式也可以实现,如直接对DataFrame进行运算或调用其他的函数。
4.map用法和参数介绍
map(self, arg, na_action=None):
arg: 应用于Series每个元素的映射关系(不仅仅是函数),可以传入满足一个参数一个返回值的函数,也可以传入字典或另一个Series。
na_action: 同applymap。
5.map函数使用举例
s = pd.Series(range(2, 11, 2), index=[alpha for alpha in 'abcde'])
print(s)
s1 = s.map(np.sqrt)
print('-' * 20, '\n', s1, sep='')
s2 = s.map(make_ok)
print('-' * 20, '\n', s2, sep='')
s3 = s.map(lambda x: x*3)
print('-' * 20, '\n', s3, sep='')
`txt
a 2
b 4
c 6
d 8
e 10
dtype: int64
a 2ok
b 4ok
c 6ok
d 8ok
e 10ok
dtype: object
a two
b four
c six
d eight
e ten
dtype: object
Col-1 Col-2 Col-3 Col-4
X oohoho8 oohoho2.0 oohoho9 oohoho3
Y oohoho3 oohohonan oohoho8 oohoho6
Z oohoho5 oohoho8.0 oohoho7 oohoho9
Original: https://blog.csdn.net/weixin_43790276/article/details/125732717
Author: 小斌哥ge
Title: Pandas知识点-详解元素级批处理函数applymap和map
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/743798/
转载文章受原作者版权保护。转载请注明原作者出处!