Pandas
功能在于筛选清洗和处理
Series
中文叫做序列,pandas模块的一种数据类型,是一个一维的、带索引的数组对象,Series就像排行榜。
左侧是索引(index) 右侧是值(values) 下面是values的数据类型
除了直接通过inde访问外,还能通过0,1,2这样的位置进行访问。
series构造函数
data = [80855, 77388, 68024, 47251, 40471]
city = ['GD','JS','SD','ZJ','HN']
GDP = pd.Series(data,index = city)
print(GDP)
传入列表list来指定数据
如果不传入数据,会产生一个空的series
index 在传入数据后还可以通过index参数,来定义Series中的索引
DataFrame
DataFrame中文叫数据框,是pandas模块中最常用的数据类型,是一个二维的矩阵数据表。
一个DataFrame是由3部分组成,行索引,可以用来定位到具体的某一行,列索引,用来定位某一列,通过index和columns可以定位到一个值,能快速进行数据的筛选和定位。
DataFrame是一个二维的数据结构,因此它有一个新的属性轴
0轴是垂直方向的 1轴是水平方向的
import pandas as pd
data= {'rank':[1, 2, 3, 4],'GDP':[80855, 77388, 68024, 47251]}
city= ['GD','JS','SD','ZJ']
df= pd.DataFrame(data, index=city)
print(df)
字典是keys是对象 values是对应的列表 且列表中的元素个数相同
字典中的keys,就成为了DataFrame中的列索引columns
字典中的values就成为了DataFrame中的值values
和index属性一样,我们可以直接范文Series对象的.values属性
访问一个DataFrame对象的.values属性
获取到的Series和DataFrame的values 其实是一个数组。
因此Series和DataFrame的values可以像数组一样直接进行批量计算
Original: https://blog.csdn.net/weixin_45696295/article/details/122709503
Author: weixin_45696295
Title: 数据分析03pandas
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/699468/
转载文章受原作者版权保护。转载请注明原作者出处!