数据分析03pandas

Pandas

功能在于筛选清洗和处理

Series

中文叫做序列,pandas模块的一种数据类型,是一个一维的、带索引的数组对象,Series就像排行榜。
左侧是索引(index) 右侧是值(values) 下面是values的数据类型
除了直接通过inde访问外,还能通过0,1,2这样的位置进行访问。
series构造函数

data = [80855, 77388, 68024, 47251, 40471]
city = ['GD','JS','SD','ZJ','HN']

GDP = pd.Series(data,index = city)

print(GDP)

传入列表list来指定数据
如果不传入数据,会产生一个空的series
index 在传入数据后还可以通过index参数,来定义Series中的索引

DataFrame

DataFrame中文叫数据框,是pandas模块中最常用的数据类型,是一个二维的矩阵数据表。
一个DataFrame是由3部分组成,行索引,可以用来定位到具体的某一行,列索引,用来定位某一列,通过index和columns可以定位到一个值,能快速进行数据的筛选和定位。

数据分析03pandas
DataFrame是一个二维的数据结构,因此它有一个新的属性轴
0轴是垂直方向的 1轴是水平方向的
import pandas as pd

data= {'rank':[1, 2, 3, 4],'GDP':[80855, 77388, 68024, 47251]}
city= ['GD','JS','SD','ZJ']

df= pd.DataFrame(data, index=city)

print(df)

字典是keys是对象 values是对应的列表 且列表中的元素个数相同
字典中的keys,就成为了DataFrame中的列索引columns
字典中的values就成为了DataFrame中的值values

数据分析03pandas
和index属性一样,我们可以直接范文Series对象的.values属性
访问一个DataFrame对象的.values属性
获取到的Series和DataFrame的values 其实是一个数组。
因此Series和DataFrame的values可以像数组一样直接进行批量计算

Original: https://blog.csdn.net/weixin_45696295/article/details/122709503
Author: weixin_45696295
Title: 数据分析03pandas

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/699468/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球