Python数据分析—pandas类库常用方法

2023年8月22日上午7:20 • Python • 阅读 41

一.pandas

Pandas是用于数据操纵和分析，建立在Numpy之上的。Pandas为Python带来了两种新的数据结构：Pandas Series和Pandas DataFrame，借助这两种数据结构，我们能够轻松直观地处理带标签数据和关系数据。

Pandas功能：

允许为行和列设定标签
可以针对时间序列数据计算滚动统计学指标
轻松处理NaN值
能够将不同的数据集合并在一起
与Numpy和Matplotlib集成

二.常用方法

1，df.reset_index(drop=True) 重置索引，会创建一个新对象。默认保留原来索引，加上drop=True删除原来索引。

2，df.set_index() 设置一列索引。

3，df.drop() 删除指定行值或列值（axis = 1 列 axis = 0 行，默认为行）。

df.drop(index=df[df[“价格”].isnull()].index, inplace=True) #例如：删除价格为空的所有行

4，del df[“列”] 删除一列值。

5，df.dropna() 删除指定的行或者列为空的值。

6，df.drop_duplicated() 删除重复值，可指定列，指定保留第一行，或者最后一行。

7，df.loc[“行”,”列”] 通过标签定位数据，df.iloc[:] 通过索引定位数据。

8，df.sort_values(“列”,axis=0, ascending=True) 排序。Series不需要参数列，ascending默认True升序。

9，df.describe() 快速列出数据的概要，多个维度的汇总统计。

10，df.info() 索引，数据类型，内存信息等。

11，df.unique() 返回一个Series里面唯一值组成的数组。

12，df.sum() 计算一列的和。

13，df.count() 计算非NaN值的总量。

14，df.mean() 计算一列的平均值。

15，df.median() 计算一列的中位数。

16，df.mode() 计算一列的众数。

17，df.var() 计算一列的方差。

18，df.std() 计算一列的标准差。

19，df.min() 计算一列的最小值。

20，df.max() 计算一列的最大值。

21，df.value_counts() 计算一列中数据出现的频率。

22，df.groupby() 分组。

23，df.head() 取出数据的前几行。

24，df.tail() 取出数据的后几行。

25，read_csv()，read_excel()，read_sql()，read_json()，read_html() 等…. pandas提供的读取数据方法。

26，to_excel() 写入excel文件，可以用pd.ExcelWriter()申明对象存储多个sheet。

27，pd.contact() ，pd.append() 行数据合并拼接，只在axis = 0上操作。

28，pd.merge() 数据关联操作，类sql,可以设置关联方向：left, right,inner,outer。 join()类merge，但是只能在索引关联。

29，pd.rename(columns={“原名”:”修改名”}, inplace = True) 修改列名。

30，df[“列”].fillna(0) 把一列里面为空的赋值为0.

31，df[“列”].astype(int) 转换一列数据类型。

32，df.agg() 指定列或者行上一个或者多个操作数据聚合。

Original: https://blog.csdn.net/study28/article/details/120771731
Author: study28
Title: Python数据分析—pandas类库常用方法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/756446/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

关于Python中不同文件夹的函数相互调用的问题

前言博主最近在弄Python相关的东西，想将YOLOv3部署到flask上做个小demo，结果在flask调用yolo函数时频繁出现问题。百度上找了好多博客还是感觉没搞清楚就自己…

Python 2023年8月10日
0029
pytest系列(二) — fixture详解

声明：参考B站视频，自学成长记录https://www.bilibili.com/video/BV1u5411A7Um?p=9 一、pytest默认实现前 / 后置条件 setup…

Python 2023年9月11日
0057
python教程：函数的return语句运用

return语句用于退出函数，向调用方返回一个表达式。 return在不带参数的情况下（或者没有写return语句），默认返回None。 None是一个特殊的值，它的数据类型是No…

Python 2023年11月3日
0079
旅游推荐系统- python- Django

旅游推荐系统 详细功能可见下方视频链接视频演示 …

Python 2023年8月4日
0050
Python词频分析

Python词频分析在日常工作或者生活中，有时候会遇到词频分析的场景。如果是要进行词频分析，那么首先需要对句子进行分词，将句子中的单词进行切割并按照词性进行归类。在Python中…

Python 2023年11月1日
0091
pytest 学习 1 – 安装及使用

安装 pip install pytest 查看版本 pytest –version 编写规则测试文件以 test 开头（或以 test 结尾也可以）测试类以 Test 开头…

Python 2023年9月14日
0052
设计模式-生产者消费者模式

e.g. 5个厨师做包子，三秒一个，10个食客吃包子，1秒一个，食客吃的又快人又多 import queue import threading import time q = qu…

Python 2023年11月2日
0028
openshift 3.11离线安装

本次基于redhat官方的rpm包安装，并导入提前下载好的docker镜像 master节点：10.157.27.117infra节点：10.157.27.118node 节点：1…

Python 2023年6月16日
0081
制作淘宝客微信公众号（一）

制作淘宝客微信公众号（一）这篇文章主要是记录开发淘宝客微信公众号机器人的主要准备过程。（作者研究生在读，学业繁忙，所以不考虑帮人做公众号，只提供制作思路） 1.淘宝客介绍淘宝客…

Python 2023年8月10日
0054
Python IO文件管理

文件操作我们可以使用python来操作文件，比如读取文件内容、写入新的内容等，因为任何计算机文件的本质都是一些有不同后缀的字符组成的。 python文件操作的两种模式打开模式 …

Python 2023年11月9日
0039
python中scrapy是什么_python中Scrapy数据流是什么

python中Scrapy数据流是什么发布时间：2020-11-17 09:25:56 来源：亿速云阅读：72 作者：小新这篇文章主要介绍了python中Scrapy数据流是…

Python 2023年10月6日
0031
【毕业设计】深度学习试卷批改系统 – opencv python 机器视觉

文章目录 0 简介 1 项目背景 2 项目目的 3 系统设计 * 3.1 目标对象 3.2 系统架构 3.3 软件设计方案 4 图像预处理 * 4.1 灰度二值化 4.2 形态学处…

Python 2023年8月1日
0066
pytest 之重运行机制与测试报告

pytest 之重运行机制与测试报告 * – + 重运行机制 + * 插件安装 * 使用方式 * – 命令行参数形式 – pycharm编辑器…

Python 2023年9月13日
0048
pytest之allure报告的标记装饰器的使用

allure的标记装饰器 BDD样式的标记装饰器优先级（严重程度）标记装饰器自定义标记装饰器使用方法参数值参数说明 @allure.epic() epic描述敏捷里面的…

Python 2023年9月10日
0045
java dataframe agg_DataFrame对象groupby.agg方法总结

源自官方实例 DataFrame数据： df = pd.DataFrame({‘A’: [1, 1, 2, 2], … ‘B&#82…

Python 2023年8月22日
0041
【Kotlin】接口和抽象类 ( 接口属性和方法定义 | 接口默认方法实现 | 抽象类 )

一、接口属性和方法定义 Kotlin 中使用 interface 关键字定义接口 , 接口中的所有属性和函数默认都是 open 的 , 在接口实现类中 , 必须使…

Python 2023年11月7日
0042

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Python数据分析—pandas类库常用方法

一.pandas

二.常用方法

大家都在看