【Pandas】DataFrame查询数据

DataFrame查询数据

加载数据

import pandas as pd

df = pd.read_excel('demo.xlsx', sheet_name=0)

index = ['index_' + str(tmp) for tmp in df.index]

df.index = index
print('df:\n', df)

修改索引的方法参见:https://blog.csdn.net/weixin_45760274/article/details/123459130

【Pandas】DataFrame查询数据

; 通过索引查询

通过索引查询数据时可以使用 行列的 下标名称,查询多行多列数据时还可以配合 切片进行查询 连续的 数据。
需要注意的是在查询 非连续的 多行多列数据时,需要传入列表组成 列表嵌套

查询某(几)列

索引方式:先操作列,再去操作行


print('获取单列数据:\n', df['B'])
print('数据类型:\n', type(df['B']))
print('*' * 100)

print('获取多列数据:\n', df[['B', 'C', 'D']])
print('数据类型:\n', type(df[['B', 'C', 'D']]))

【Pandas】DataFrame查询数据

查询一列 的 某(几)行


print('获取其中的一列的前5行:\n', df['B'][:5])
print('获取其中的一列的前5行:\n', df['B'][:'index_4'])
print('获取其中的一列的前5行:\n', df['B'][[0, 1, 2, 3, 4]])
print('获取其中的一列的前5行:\n', df['B'][['index_0', 'index_1', 'index_2', 'index_3', 'index_4']])
print('获取其中的一列的前5行:\n', df['B'].head(5))

上述输出结果都为:

【Pandas】DataFrame查询数据
print('获取其中的一列的后5行:\n', df['B'].tail(5))

【Pandas】DataFrame查询数据

查询多列 的 某(几)行

print('获取其中的多列的前n行:\n', df[['B', 'C', 'D']][:5])
print('获取其中的多列的前n行:\n', df[['B', 'C', 'D']][:'index_4'])
print('获取其中的多列的前n行:\n', df[['B', 'C', 'D']].head(5))
print('获取其中的多列的后n行:\n', df[['B', 'C', 'D']].tail(5))

"""
报错的原因是因为 df[['B', 'C', 'D']] 查询出的是多列数据,
后面的[[0, 1, 2, 3]]被当作是在前面的基础上继续查询列,而不是查询行
"""

【Pandas】DataFrame查询数据

使用loc和iloc方法查询

同时操作DataFrame的行和列,可以借助 loc 和 iloc 的方法

注意: loc只能使用 名称iloc只能使用 下标 。—-不能混用!

DataFrame.loc[“行名称”, “列名称”]
DataFrame.iloc[行索引, 列索引]

print('获取其中的一列:\n', df.loc[:, 'B'])
print('获取其中的一列:\n', df.iloc[:, 5])

print('获取其中的多列:\n', df.loc[:, ['A', 'B', 'D']])
print('获取其中的多列:\n', df.iloc[:, [2, 5, -2]])

print('获取其中的多列:\n', df.loc[:, 'A':'C'])
print('获取其中的多列:\n', df.iloc[:, 0:3])

print('获取多列的指定行:\n', df.loc['index_0':'index_4', ['A', 'B', 'D']])
print('获取多列的指定行:\n', df.iloc[0:5, 0:3])

【Pandas】DataFrame查询数据

从效率上来说—直接索引效率高,执行速度快,loc和iloc会稍微慢一点
从应用的广泛性来说—loc和iloc在工作中使用较多!

使用bool-series索引

boolList = [True,True,False,True,False,False,True,True,True,False,]
print("bool数组索引:\n",df.loc[boolList,:])

【Pandas】DataFrame查询数据

Original: https://blog.csdn.net/weixin_45760274/article/details/123448770
Author: 胡桃の壶
Title: 【Pandas】DataFrame查询数据

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/639248/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球