Pandas数据结构分析

1、pandas中有两个主要的数据结构,分别是:Series和DataFrame。

2、Series:它是一个类似一维数组的对象,它能够保存任何类型的数据,主要由一组数据(各种Numpy数据类型)和与之相关的数据标签(索引)两部分构成。仅由一组数据也可以产生简单的Series对象。注意:Series的索引位于左边,数据位于右边,且索引值可以重复。

Pandas数据结构分析

3.算术运算与数据对齐
Pandas执行算术运算时,会先按照索引进行对齐,对齐以后再进行相应的运算,没有对齐的位置会用NaN进行补齐。

如果希望不使用NAN填充缺失数据,则可以在调用add方法时提供fill_value参数的值,fill_value将会使用对象中存在的数据进行补充。

执行加法运算,补充缺失值
obj_one.add(obj_two, fill_value = 0)

4.数据排序
Pandas中按索引排序使用的是sort_index()方法,该方法可以用行索引或者列索引进行排序。

axis:轴索引,0表示index(按行),1表示columns(按列)。

level:若不为None,则对指定索引级别的值进行排序。

ascending:是否升序排列,默认为True表示升序。

sort_index(axis = 0,level = None,ascending = True,inplace = False,kind =’ quicksort ‘,na_position =’last’,sort_remaining = True )

按索引对Series进行分别排序

ser_obj = pd.Series(range(10, 15), index=[5, 3, 1, 3, 2])
按索引进行升

Original: https://blog.csdn.net/qq_67731406/article/details/123315232
Author: qq_67731406
Title: Pandas数据结构分析

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/762869/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球