Pandas基本用法(详细2.0)

2023年8月18日下午9:44 • Python • 阅读 55

Pandas 是 Python 语言的一个扩展程序库，用于数据分析。
Pandas 是一个开放源码、BSD 许可的库，提供高性能、易于使用的数据结构和数据分析工具。
Pandas 名字衍生自术语 “panel data”（面板数据）和 “Python data analysis”（Python 数据分析）。
Pandas 一个强大的分析结构化数据的工具集，基础是 Numpy（提供高性能的矩阵运算）。
Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据。
Pandas 可以对各种数据进行运算操作，比如归并、再成形、选择，还有数据清洗和数据加工特征。

Series是一种类似于字典(dict-like)的一维数组(array-like)的对象，由下面两个部分组成：

values：一组数据（ndarray类型）
index：相关的数据索引标签

pandas.Series(data=None,index=None)

ndarray 构造Series

1) From ndarray 使用ndarray构造 # 是一个 引用对象(共用一个内存数据,数据变更相互影响)

List 构造Series

2) From List 使用列表构造# 是一个副本对象(copy一个新内容，数据变更互不影响)

Dict 构造Series

3) From dict 使用字典构造 # 一般不用指定index，因为 dict中的key做为Series的显示索引低于index的优先级值会显示NaN

value 构造 Series

4) From scalar value 使用value构造 # 使用一个标量（常量或变量）构造时，必须指定index，标量会被重复匹配到每一个index

1.1 Series属性

name 返回Series对象的名字# name表示列名
shape 返回Series对象的形状# shape表示形状维度
size 返回Series对象的元素个数# size表示元素个数
index 返回Series对象的显示索引# index返回所有索引
values 返回Sereis对象的所有元素值# values返回所有值

1.2 Series的数学运算

Series对大多数NumPy的函数都是兼容的

1) 与非pandas对象运算

服从广播机制原则

2) NumPy functions

3) Series之间运算

索引对齐原则
对不齐补空值，使用add\sub\mul\div函数处理空值

DataFrame是一个二维的表格型数据结构，可以看做是由Series组成的字典（共用同一个索引）。
DataFrame由按一定顺序排列的【多列】数据组成，每一列的数据类型可能不同。
设计初衷是将Series的使用场景从一维拓展到多维。DataFrame既有行索引，也有列索引。

行索引：index
列索引：columns
值：values（numpy的二维数组）

2.1 DataFrame 构造

pandas.DataFrame() #data=None 用于构造DataFrame数据;index=None;columns=None, 行列索引;dtype=None, 数据类型;copy=False,当data参数是dict字典类型时，需要指定index数值，因为dict无序列，也可以在dict外加 [ ] 列表解决

1) From dict of Series or dicts使用一个由Series构造的字典或一个字典构造

2) From dict of ndarrays / lists 使用一个由列表或ndarray构造的字典构造ndarrays必须长度保持一致

3) From a list of dicts 使用一个由字典构成的列表构造

4) DataFrame.from_dict() 函数构造

names = [‘张三’,’李四’,’王五’,’赵六’,’老王’]
yuwen = np.random.randint(0, 100, size=5)
shuxue = np.random.randint(0, 100, size=5)

display(names, yuwen, shuxue)

dictionary = {
‘names’:names,
‘语文’:yuwen,
‘数学’:shuxue
}

score = pd.DataFrame(data=dictionary)

2.2 DataFrame属性

dtypes
values
index
columns

df.dtypes # 表示查看df内各列类型

df.values # 表示查看所有数据值

df.index # 查看行标签

df.columns # 查看列标签

2.3 DataFrame运算

DataFrame和Series运算，默认就是列索引对齐原则

1) 与非pandas对象运算 # 序列必须相同

2) 与Series对象运算 # DataFrame和Series运算，默认就是列索引对齐原则

3) 与DataFrame对象运算

索引对齐原则（row\co

Original: https://blog.csdn.net/weixin_45632886/article/details/123437364
Author: Cody Jun
Title: Pandas基本用法(详细2.0)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/753403/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Transformer前沿——语义分割

Transformer 进军语义分割进军方向 SETR: Rethinking Semantic Segmentation from a Sequence-to-Sequence…

Python 2023年9月30日
0068
第5章 pandas入门

整述：pandas是有使数据清洗和分析工作变得更快更简单的数据结构和操作工具。pandas经常和其它工具⼀同使用，如数值计算工具NumPy和SciPy，分析库statsmodels…

Python 2023年8月6日
0066
Idea常用快捷键（MacOS和Win平台）持续更新ing～

小名在刚换MacOS系统时总结的一些Idea快捷键，这里小名把Win的对比快捷键和功能都列出来，方便像小名这样”肌肉记忆”的小伙伴顺利过渡～当然，这些都是…

Python 2023年11月7日
0043
2022年安徽最新交安安全员考试模拟题及答案

百分百题库提供交安安全员考试试题、交安安全员考试真题、交安安全员证考试题库等，提供在线做题刷题，在线模拟考试，助你考试轻松过关。 15.为防止电焊弧光伤害眼睛，应采…

Python 2023年9月27日
0039
奥运金牌追逐战，可视化动态图表炫酷展示

东京奥运会已经圆满结束，中国金牌榜惜居第二，与美国只有一步之遥。今年奥运是特殊的一年，中美日三方之间的关系不言而喻，从结果就可以隐隐看出，中美金牌之间的争斗非常激烈。于是顺手做了…

Python 2023年9月5日
0064
Pandas之Series和DataFrame

Pandas的数据结构分析 Pandas中有两个主要的数据结构： Series 和 DataFrame，其中 Series 是一维的数据结构， DataFrame 是二维的、表格性…

Python 2023年8月7日
0066
requests请求报字符编码异常信息

requests请求报字符编码异常信息原创 CorwinPC2022-07-18 17:46:48博主文章分类：Python ©著作权文章标签 python 字符编码搜索 i…

Python 2023年5月25日
0058
2.数据及其预处理

数据样本矩阵一般数据集的构造形式：一行一样本，一列一特征，以下为一个示例姓名年龄性别工作经验月薪 A 22 男 2 5000 B 23 女 3 6000 C 25 男…

Python 2023年10月25日
0037
python数据分析基础005 -pandas详解_pandas入门这一篇就足够了

文章目录 🌸前言 🌔（一）pandas基础介绍 * 🍸1.什么是pandas 🍹2.为什么要学习pandas 🍻3.pandas的安装 🥂4.导入pandas库 🌖（二）panda…

Python 2023年8月15日
0055
Matplotlib箭头风格与标注文本连接|plt.annotate函数与connectionstyle参数的使用与案例代码

如果你认为下面的图比较美观，尤其是标注文本与箭头的连接部分，理论上阅读本文会有所得。 ; 一 Plt.annotate函数参考官网：https://matplotlib.org/…

Python 2023年9月2日
0052
Flask web开发实战之基础篇 Flask-数据库

基础篇第五章 Flask数据库前言 5. 数据库 * 5.1 数据库的分类 – 5.1.1 SQL 5.1.2 NoSQL 5.1.3 如何选择？ 5.2 ORM魔…

Python 2023年8月9日
0058
对DataFrame各行列累乘：prod()函数

【小白从小学Python、C、Java】【Python-计算机等级考试二级】【Python-数据分析】对DataFrame各行列累乘prod()函数选择题下列说法错误的是? im…

Python 2023年8月8日
0056
Flask入门教程(二十五)接收多文件

环境 windows 10 64bit anaconda3 with python 3.7 flask 1.1.2 前言 web后端接收多文件，在实际项目中也算是个常见的需求，本文…

Python 2023年8月12日
0058
python dataframe新增一列

1、直接在后面新增一列指明列名，并赋值即可：data[‘addlist’]=[1,2]2、在指定位置新增一列用insert()函数，data.insert(…

Python 2023年8月2日
0032
9.使用groupby对数据分组和计算组内统计量(不完善)

经常会遇到这样的场景：首先把数据分组，然后处理下组内数据，最后把处理结果组合起来。groupby就可以满足需求。 9.1 分组只要提供一个分组依据，groupby就可以对数据分组…

Python 2023年8月20日
0083
在图片不被裁剪时opencv绕图片中任意点旋转任意角度

opencv绕图片中任意角度旋转任意角度最近在做项目需要把把图片绕图片中任意点旋转任意角度，考虑到自己旋转需要编写插值算法，所以想到了用opencv，但是网上都是围绕图片中点旋转…

Python 2023年10月20日
0047

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31