pandas中drop用法_python进行数据清理之pandas中的drop用法

好久好久没有更新博客了,之前自学的估计也都忘记差不多了。由于毕业选择从事的行业与自己的兴趣爱好完全两条路,心情也难过了很久,既然入职了就要好好干,仍要保持自己的兴趣,利用业余时间重拾之前的乐趣。

从基本的数据清理学起吧

讲一下drop函数的用法

删除表中的某一行或者某一列更明智的方法是使用drop,它不改变原有的df中的数据,而是可选择性的返回另一个dataframe来存放删除后的数据。

删除无效项

df[df.isnull()] #返回的是个true或false的Series对象(掩码对象),进而筛选出我们需要的特定数据。

df[df.notnull()]

df.dropna()#将所有含有nan项的row删除

df.dropna(axis=1,thresh=3) #将在列的方向上三个为NaN的项删除

df.dropna(how=’ALL’) #将全部项都是nan的row删除

这里面,print(data.dropna() )和 print(data[data.notnull()] )结果一样

填充空缺项

df.fillna(0)

df.fillna({1:0, 2:0.5}) #对第一列nan值赋0,第二列赋值0.5

df.fillna(method=’ffill’) #在列方向上以前一个值作为值赋给NaN

method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}, default None

pad/ffill:用前一个非缺失值去填充该缺失值

backfill/bfill:用下一个非缺失值填充该缺失值

None:指定一个值去替换缺失值

drop函数的使用:

(1)删除行、列

print(frame.drop([‘a’]))print(frame.drop([‘b’], axis = 1))#drop函数默认删除行,列需要加axis = 1

(2)inplace参数

  1. DF.drop(‘column_name’, axis=1);2. DF.drop(‘column_name’,axis=1, inplace=True)3. DF.drop([DF.columns[[0,1, 3]]], axis=1, inplace=True)

对原数组作出修改并返回一个新数组,往往都有一个 inplace可选参数。如果手动设定为True(默认为False),那么原数组直接就被替换。也就是说,采用inplace=True之后,原数组名对应的内存值直接改变(如2和3情况所示);

而采用inplace=False之后,原数组名对应的内存值并不改变,需要将新的结果赋给一个新的数组或者覆盖原数组的内存位置(如1情况所示)。

DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors=’raise’)

Original: https://blog.csdn.net/weixin_39716044/article/details/113471848
Author: weixin_39716044
Title: pandas中drop用法_python进行数据清理之pandas中的drop用法

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/742223/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球