DataFrame的基础功能,以后要查询就得看这里!
功能清单
df2.index
df2.columns
df2.axes
df2.T
df2.info()
df2.head(i)
df2.tail(i)
df2.describe()
首先随机创建一个DataFrame
利用 numpy 的随机函数建立一个 DataFrame
df = DataFrame(np.random.rand(50,5))
运行结果
是5行50列的一个二维数组
这里为了加深印象,我添加了一个字典,增加对比,如下
data = {'state':['Ohino','Ohino','Ohino','Nevada','Nevada'],
'year':[2000,2001,2002,2001,2002],
'pop':[1.5,1.7,3.6,2.4,2.9]}
dic_df = DataFrame(data,index=['one','two','three','four','five'],
columns=['year','state','pop','debt'])
print(df)
运行结果
重点来了,以后查的时候就用下边
df.index
求行
df.indexdic_df.index
df运行结果
RangeIndex(start=0, stop=50, step=1)
#意思是从0开始,50结束,步长为1
dic_df的运行结果
Index(['one', 'two', 'three', 'four', 'five'], dtype='object')
df.columns求列
print(df.columns)
print(dic_df.columns)
运行结果
df.axes
print(df.axes)
print(dic_df.axes)
运行结果
就是返回两个”边”。
df.T
index 跟 columns 对调
print(dic_df)
print(dic_df.T)
运行结果
df.info()打印二维数组的信息
print(df.info())
print('\n')
print(dic_df.info()
运行结果
这里显示的信息都是以列为单位(columns)
df.head(i)显示前头几行数据,以行为单位,index
print(df.head(4))
print('\n')
print(dic_df.head(2))
运行结果
df.tail(i)
从后头显示几条信息
print(df.tail(4))
print('\n')
print(dic_df.tail(1))
运行结果
df.describe()
查看数据值列的汇总统计
可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数等相关信息
print(dic_df.describe().T)
print('\n')
print(dic_df.describe())
运行结果
Original: https://www.cnblogs.com/PYlog/p/9141136.html
Author: 人无远虑
Title: Pandas DataFrame的基本属性
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/559953/
转载文章受原作者版权保护。转载请注明原作者出处!