pyhton_Pandas教程

Pandas 是 Python 语言的一个扩展程序库,用于数据分析。

Pandas 是一个开放源码、BSD 许可的库,提供高性能、易于使用的数据结构和数据分析工具。

Pandas 名字衍生自术语 “panel data”(面板数据)和 “Python data analysis”(Python 数据分析)。

Pandas 一个强大的分析结构化数据的工具集,基础是 numpy(提供高性能的矩阵运算)。

Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据。

Pandas 可以对各种数据进行运算操作,比如归并、再成形、选择,还有数据清洗和数据加工特征。

数据结构

Series 是一种类似于一维数组的对象,它由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)组成。

DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。

查看pandas的版本

pandas.Series( data, index, dtype, name, copy)
data:一组数据(ndarray 类型)。
index:数据索引标签,如果不指定,默认从 0 开始。
dtype:数据类型,默认会自己判断。
name:设置名称。
copy:拷贝数据,默认为 False。

pandas.DataFrame( data, index, columns, dtype, copy)
data:一组数据(ndarray、series, map, lists, dict 等类型)。
index:索引值,或者可以称为行标签。
columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
dtype:数据类型。
copy:拷贝数据,默认为 False。

四、Pandas CSV 文件

1、read_csv() 将csv()文件导入,存在Dataframe对象中

2、to_csv() 将 DataFrame 存储为 csv 文件

3、to_string() 用于返回 DataFrame 类型的数据,如果不使用该函数,则输出结果为数据的前面 5 行和末尾 5 行,中间部分以 ... 代替。
1、JSON 对象与 Python 字典具有相同的格式,所以我们可以直接将 Python 字典转化为 DataFrame 数据:

以上实例输出结果为:

2、从 URL 中读取 JSON 数据:

数据清理是对一些无用数据进行处理的过程。

[En]

Data cleaning is the process of dealing with some useless data.

许多数据集缺少数据、数据格式不正确、数据不正确或数据重复。如果你想让数据分析更准确,你需要处理这些无用的数据。

[En]

Many datasets have missing data, incorrect data format, incorrect data, or duplicate data. If you want to make the data analysis more accurate, you need to deal with these useless data.

在这个教程中,我们将利用 Pandas包来进行数据清洗。

1、 Pandas 清洗空值

如果我们要删除包含空字段的行,可以使用 dropna() 方法,语法格式如下:

1.1、添加na_values属性指定的某些数据修改为空数据(NaN)

1.2、 dropna() 方法 返回一个新的 DataFrame,不会修改源数据。

1.3、 fillna()方法 来替换一些空字段

1.4、使用 mean() 方法计算列的均值并替换空单元格

1.5、使用 median() 方法计算列的中位数并替换空单元格:

1.6、使用 mode() 方法计算列的众数并替换空单元格

2、Pandas 清洗格式错误数据

3、Pandas 清洗错误数据

4、Pandas 清洗重复数据

Original: https://www.cnblogs.com/komorebiZjh/p/16213317.html
Author: 搁浅的小鲸鱼
Title: pyhton_Pandas教程

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/499684/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球