函数下午茶(2):数据检测与缺失值处理~

会返回DataFrame相同形状的布尔对象,指示是否有⽆空值。是⼀个⽆参数函数。

1 df = pd.DataFrame(dict(age=[5, 6, np.NaN],
2 born=[pd.NaT, pd.Timestamp('1939-05-27'),
3   pd.Timestamp('1940-04-25')],
4 name=['Alfred', 'Batman', ''],
5 toy=[None, 'Batmobile', 'Joker']))
6 df.isull()
7 >>    age born    name    toy
8 0 False   True    False   True
9 1 False   False   False   False
10 True False   False   False

该函数⼀般⽤来填充缺失值,基本使⽤⽅法如下

pandas.DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None)

参数介绍

参数介绍value接受Series和DataFrame。填充值处理对象。method{‘backfill’, ‘bfill’, ‘pad’, ‘ffill’,None},填充的⽅法。axis{0 or ‘index’, 1 or ‘columns’}, 填充缺失值inplacebool值,默认False。是否替换原数据。limitint型,默认None。填充值限定个数。

1 df = pd.DataFrame([[np.nan, 2, np.nan, 0],
2 [3, 4, np.nan, 1],
3 [np.nan, np.nan, np.nan, 5],
4 [np.nan, 3, np.nan, 4]],
5 columns=list('ABCD'))
6 df
7 >> A B C D
8 0 NaN 2.0 NaN 0
9 1 3.0 4.0 NaN 1
10 2 NaN NaN NaN 5
11 3 NaN 3.0 NaN 4
12
13
14 df.fillna(0)
15 >>   A   B   C   D
16 0    0.0 2.0 0.0 0
17 1    3.0 4.0 0.0 1
18 2    0.0 0.0 0.0 5
19 3    0.0 3.0 0.0 4

20
21
22  values = {'A': 0, 'B': 1, 'C': 2, 'D': 3}
23  df.fillna(value=values)
24 >>   A   B   C   D
25 0    0.0 2.0 2.0 0
26 1    3.0 4.0 2.0 1
27 2 0.0 1.0 2.0 5
28 3 0.0 3.0 2.0 4

移除缺失的值。

pandas.DataFrame.dropna(self,axis=0,how='any', thresh=None, subset=None, inplace=False)

参数说明

参数介绍axis接收0或1。表示轴向,0为删除观测记录(⾏),1为删除特征(列)。默认为0。how接收特定string。表示删除的形式。any表示只要有缺失值存在就执⾏删除操作。all表示当且仅当全部为缺失值时执⾏删除操 作。默认为any。subset接收类array数据。表示进⾏去重的列∕⾏。默认为None,表示所有列/⾏。inplace接收boolean。表示是否在原表上进⾏操作。默认为False。

便捷的删除缺失值函数,有多种删除缺失值⽅式。

1  df = pd.DataFrame({"name": ['Alfred', 'Batman', 'Catwoman'],
2       "toy": [np.nan, 'Batmobile', 'Bullwhip'],
3       "born": [pd.NaT, pd.Timestamp("1940-04-25"),
4       pd.NaT]})
5
6 df
7 >>    name    toy born
8 0 Alfred NaN NaT
9 1 Batman Batmobile 1940-04-25
10 2 Catwoman Bullwhip NaT
11
12 df.dropna()
13 >> name toy born
14 1 Batman Batmobile 1940-04-25
15
16 df.dropna(how='all')
17 >> name toy born
18 0 Alfred NaN NaT
19 1 Batman Batmobile 1940-04-25
20 2 Catwoman Bullwhip NaT
21
22 df.dropna(subset=['name', 'toy'])
23 >> name toy born
24 1 Batman Batmobile 1940-04-25
25 2 Catwoman Bullwhip NaT

Original: https://blog.csdn.net/qq_45473330/article/details/112838369
Author: 陈希瑞
Title: 函数下午茶(2):数据检测与缺失值处理~

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/755877/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • scrapy 异步存储mysql大量数据_scrapy爬取的数据异步存储至MySQL

    以scrapy爬虫爬取简书中全部的页面详情数据为例: 1.cmd执行scrapy 创建完爬虫项目后最好为其创建一个脚本启动文件start.py 文件在项目根目录即可 from sc…

    Python 2023年10月6日
    041
  • PySpark数据分析基础:PySpark Pandas创建、转换、查询、转置、排序操作详解

    目录 前言 一、Pandas数据结构 1.Series 2.DataFrame 3.Time-Series 4.Panel 5.Panel4D 6.PanelND 二、Pyspar…

    Python 2023年8月7日
    0195
  • python捕获键盘按键_Python中捕获键盘的方式详解

    python中捕获键盘操作一共有两种方法 第一种方法: 使用pygame中event方法 使用方式如下:使用键盘右键为例 if event.type = pygame.KEYDOW…

    Python 2023年9月20日
    038
  • 微信小程序 | 小程序WXSS-WXML-WXS

    🖥️ 微信小程序 专栏:小程序WXSS-WXML-WXS🧑‍💼 个人简介:一个不甘平庸的平凡人🍬✨ 个人主页:CoderHing的个人主页🍀 格言: ☀️ 路漫漫其修远兮,吾将上下…

    Python 2023年10月7日
    047
  • Django(ORM-基本操作)

    基本草操作包括增删改查操作:核心–>模型类.管理器对象 创建数据: Django ORM使用一种直观的方式把数据库中的数据表示成python对象 创建数据中每一条…

    Python 2023年8月3日
    056
  • Pycharm5个非常有用的技巧

    PyCharm 是一款非常强大的编写 python 代码的工具。掌握一些小技巧能成倍的提升写代码的效率,本篇介绍几个经常使用的小技巧。 一、分屏展示 当你想同时看到多个文件的时候:…

    Python 2023年6月11日
    085
  • python读取csv表格的数据并用matplotlib画曲线图

    前言 python读取csv表格的数据并用matplotlib回曲线图 1、导入相关库 import matplotlib.pyplot as plt import pandas …

    Python 2023年9月1日
    073
  • 和ChatGPT 比一比谁更懂Kubernetes?

    有时,很难得到关于云原生世界中棘手话题的明确答案。哪个是最好的服务网格?平台工程只是devops的另一个标签吗?多云是一种风险吗? 如果你无法从一个人那里得到直截了当的答案——为什…

    Python 2023年11月4日
    059
  • 新的系列(一步步学习Python)

    一些想说的话: 我在之前发表过一些游戏之类的文章,我觉得写的并不怎么好,我决定在后面的文章里多写一点基础的,通俗易懂的文章. 说起Python的数据分析让我不由得觉得Python的…

    Python 2023年8月30日
    048
  • 关于numpy中的一维行向量、列向量的理解

    许久以来都有一个疑问,numpy中的一维向量究竟是行向量还是列向量呢? 今天得空,测试一下。 思路 思路很简单,利用点乘两个向量维度要对应的特性测试。 1.创建一个4*2矩阵a和一…

    Python 2023年8月24日
    087
  • fixture

    fixture的基本使用 前置后置条件 @pytest.fixture # setup,teardown def init(): print(" 作用域为测试函数的 **…

    Python 2023年9月14日
    038
  • 太空射击 第07课: 添加图形

    太空射击 第07课: 添加图形 在本课中,我们将讨论如何在游戏中使用预先绘制的图形。 视频 在这里可以观看本教程的视频 选择图形 我们谈到了 Opengameart.org,这是免…

    Python 2023年9月20日
    068
  • Python虚拟环境(pipenv、venv、conda一网打尽)

    Python虚拟环境详解 一、什么是虚拟环境 * 1. 什么是Python环境 2. 什么是虚拟环境 3. 常用工具 二、pipenv * 1. 安装pipenv 2. 命令概览 …

    Python 2023年9月8日
    082
  • Matplotlib3.5.2 快速入门

    Matplotlib是什么? Matplotlib是一个全面的库,用于在Python中创建静态,动画和交互式的可视化图像。 目前(22年6月)最新稳定版是3.5.2 安装: 使用p…

    Python 2023年9月6日
    066
  • Matplotlib绘图

    Matplotlib绘图 Matplotlib简介 * 复式折线图 散点图 条形图 Matplotlib简介 Matplotlib是一个易于使用的低级数据可视化库,是Python中…

    Python 2023年9月2日
    046
  • Matplotlib支持中文显示的两种方法

    在默认情况下,Matplotlib在设置title和标注text时如果使用中文,会出现尴尬的框框。 使用以下两种方法可以轻松化解尴尬,让您在使用Matplotlib绘图时展露愉悦笑…

    Python 2023年8月31日
    046
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球