df.dropna() 过滤数据中的缺失数据

2023年7月7日上午2:50 • 人工智能 • 阅读 107

DataFrame.dropna&#xFF08;axis = 0&#xFF0C;how = 'any'&#xFF0C;thresh = None&#xFF0C;subset = None&#xFF0C;inplace = False&#xFF09;

参数：

axis：{0 or ‘index’, 1 or ‘columns’}, default 0，确定是否删除包含缺失值的行或列，在1.0.0版中进行了更改：将元组或列表传递到多个轴上。只允许一个轴。

how：{‘any’, ‘all’}, default ‘any’，当我们有至少一个NA或全部NA时，确定是否从DataFrame中删除行或列，’any’：如果存在任何NA值，则删除该行或列，’all’：如果所有值均为NA，则删除该行或列。

thresh：int, optional，需要许多非NA值。

subset：array-like, optional，要考虑的其他轴上的标签，例如，如果要删除行，这些标签将是要包括的列的列表。

inplace：bool, 默认为False。

官网案例

代码：

df = pd.DataFrame({"name": ['Alfred', 'Batman', 'Catwoman'],
                   "toy": [np.nan, 'Batmobile', 'Bullwhip'],
                   "born": [pd.NaT, pd.Timestamp("1940-04-25"),
                            pd.NaT]})
df

输出：

       name        toy       born
0    Alfred        NaN        NaT
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

过滤掉有缺失数据

代码：

df.dropna()

输出：

     name        toy       born
1  Batman  Batmobile 1940-04-25

但此时df的值是，没有更改，因为inplace=False：

       name        toy       born
0    Alfred        NaN        NaT
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

剩下几个参数

df.dropna(axis='columns')          #&#x5220;&#x9664;&#x6709;&#x7F3A;&#x5931;&#x503C;&#x7684;&#x5217;
df.dropna(how='all')               #&#x5C06;&#x6240;&#x6709;&#x5143;&#x7D20;&#x90FD;&#x7F3A;&#x5931;&#x7684;&#x884C;&#x5220;&#x9664;
df.dropna(thresh=2)                #&#x4EC5;&#x4FDD;&#x7559;&#x81F3;&#x5C11;&#x5177;&#x6709;2&#x4E2A;&#x975E;NA&#x503C;&#x7684;&#x884C;
df.dropna(subset=['name', 'born']) #&#x5728;name&#x548C;born&#x5217;&#x4E2D;&#x67E5;&#x627E;&#x7F3A;&#x5931;&#x503C;&#xFF0C;&#x4E00;&#x65E6;&#x6709;&#x7F3A;&#x5931;&#x503C;&#x5C31;&#x5220;&#x9664;&#x884C;
df.dropna(inplace=True)            #&#x786E;&#x8BA4;&#x8986;&#x76D6;&#x539F;&#x6570;&#x636E;

对缺失值的类型解释一下

缺失值类型说明NoneNoneTypeNone不同于空列表和空字符串，是一种单独的格式NaNFloatNaN是numpy\pandas下的，不是Python原生的，Not a Number的简称。Null-在Python中没有这个NULL，NULL主要是在C语言中，在Python中对应的就是NoneNaTDatatime非时间空值，Not a Time””str空字符串

Original: https://blog.csdn.net/qq_44721834/article/details/121948192
Author: 一只山
Title: df.dropna() 过滤数据中的缺失数据

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/675321/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【深度学习】分类卷积神经网络·参数分离的自定义数据集训练

地址：https://gitee.com/MrDreamQ/custom-classification 文章目录 * – 库结构 – 环境准备 &#8211…

人工智能 2023年7月1日
0085
计算机视觉算法面试必备知识点（2022）

去年面试字节的时候，准备了一些算法常用的面试知识点，事实证明，准备的还不错。现在分享给大家，希望自己求职路也顺利些。目录优化算法，Adam, Momentum, Adagard…

人工智能 2023年5月26日
00120
coco数据集解析及读取方法

1.coco数据集格式 MC COCO2017年主要包含以下四个任务：目标检测与分割、图像描述、人体关键点检测，如下所示： annotations: 对&am…

人工智能 2023年6月23日
0088
【AI】Windows下的环境搭建（Tensorflow-gpu、CUDA&cuDNN、Opencv）

硬件平台：windows10、NVIDIA GeForce GTX 1050 软件平台：Pycharm、Anaconda3、Tensorflows 实现功能基础平台搭建一、安装…

人工智能 2023年5月24日
0090
MINIST手写数字数据集–神经网络（mini-batch）

1.1 数据集介绍 MNIST 数据集主要由一些手写数字的图片和相应的标签组成，图片一共有10 类，分别对应从0～9 ，共10 个阿拉伯数字。 1.2 思路介绍导入数据集对导入…

人工智能 2023年7月26日
0055
Xavier参数初始化方法

目录 1 梯度消失与梯度爆炸 2 Xavier方法 1 梯度消失与梯度爆炸这是一个深度学习领域遇到的老问题了，即使是现在，任何一个新提出的模型，无论是MLP、CNN…

人工智能 2023年6月16日
00128
协同过滤算法如何解决推荐系统中的系统偏差问题

详细介绍在推荐系统中，协同过滤算法被广泛用于根据用户的历史行为数据来预测用户的兴趣并进行推荐。然而，协同过滤算法在某些情况下可能存在系统偏差问题，即倾向于推荐热门或普遍受欢迎的物…

人工智能 2024年1月2日
0051
架构师之路9. 创业 – 坚持

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月30日
00101
Python 数据处理数据挖掘（七）：K-Means聚类算法

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

人工智能 2023年6月3日
0092
有哪些适合男生的蓝牙耳机？520情人节适合送男生的蓝牙耳机推荐

随着各大厂商的智能手机都逐渐取消了耳机孔，再加上蓝牙耳机市场的不断完善，使得市面上蓝牙耳机的数量也是越来越多，恰好是市面上如此多的蓝牙耳机，让消费者们挑花了眼，为了让大家在挑选蓝牙…

人工智能 2023年5月25日
0098
Agens Graph常用语法总结

1、创建一个被称作网络的图形，并将其设置为当前图形（在数据库中，其中的”feng”和Postgre数据库的模式为同一级别，而标签和Postgre数据库的表为…

人工智能 2023年6月10日
0085
mysql误删数据后快速恢复的办法

手抖不小心把表里的数据删除或修改错误怎么办？该如何快速恢复呢？遇到这样的问题怎么办？希望下面这篇文章能够帮助到你！第一步：保证mysql已经开启binlog，查看命令：查看bi…

人工智能 2023年7月30日
0073
30个Python小游戏，上班摸鱼我能玩一天【内附源码】

大家好，我是辣条。今天给大家带来30个py小游戏，一定要收藏！目录有手就行 1、吃金币 2、打乒乓 3、滑雪 4、并夕夕版飞机大战 5、打地鼠简简单单 6、小恐龙 7、消消…

人工智能 2023年7月3日
0075
第二章 | 分类问题 | F1-score | ROC曲线 | 精准率召回率 | tensorflow2.6+sklearn | 学习笔记

目录 1. 学习目标 2. 数据集介绍 3. 二元分类案例 * 3.1 加载数据 3.2 随机梯度下降(SGD)模型 3.3 评估分类器 3.4 混淆矩阵 3.5 精准率和召回率 …

人工智能 2023年7月2日
00120
Python数据分析入门（十九）：绘制散点图

散点图散点图也叫 X-Y 图，它将所有的数据以点的形式展现在直角坐标系上，以显示变量之间的相互影响程度，点的位置由变量的数值决定。通过观察散点图上数据点的分布情况，我们可以推断…

人工智能 2023年6月11日
0082
2022-2028年中国脱汞行业市场规模及发展前景分析报告

【报告类型】产业研究【出版时间】即时更新（交付时间约3个工作日）【发布机构】智研瞻产业研究院【报告格式】PDF版本报告介绍了脱汞行业相关概述、中国脱汞行业运行环境、分析了中…

人工智能 2023年6月11日
0078

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

df.dropna() 过滤数据中的缺失数据

参数：

官网案例

过滤掉有缺失数据

剩下几个参数

对缺失值的类型解释一下

大家都在看