Pandas中的五种数据查询方法–【数值,列表,区间,条件,函数查询】

Pandas查询数据

Pandas查询数据的几种方法

1.df.loc方法,根据行、列的标签值查询

  1. df.iloc方法,根据行、列的数字位置查询

  2. df.where方法

  3. df.query方法

.loc既能查询,又能覆盖写入,强烈推荐!

Pandas使用df.loc查询数据的方法

1.使用单个label值查询数据

2.使用值列表批量查询

3.使用数值区间进行范围查询

4.使用条件表达式查询

5.调用函数查询

·以上查询方法,既适用于行,也适用于列·注意观察降维dataFrame>Series>值

import pandas as pd

1、读取数据

北京2018年全年天气预报

df=pd.read_csv('./datas/beijing_tianqi/beijing_tianqi_2018.csv',index_col='ymd')
df.head()
df.index

Pandas中的五种数据查询方法--【数值,列表,区间,条件,函数查询】

设置索引为日期,方便按日期筛选
inplace=True 表示直接在原存储空间上进行更改,不是重新开辟一块空间进行更改

#设置索引为日期,方便按日期筛选
#inplace=True 表示直接在原存储空间上进行更改,不是重新开辟一块空间进行更改
df.set_index('ymd',inplace=True)
df.head()

Pandas中的五种数据查询方法--【数值,列表,区间,条件,函数查询】

替换掉温度后的℃
其实还是使用切片操作,首先筛选出所有的行,在筛选出yWendu中一列,带着类型replace修改完之后,在对修改后的类型进行转换

df.loc[:,'bWendu']=df['bWendu'].str.replace('℃','').astype('int32')
df.loc[:,'yWendu']=df['yWendu'].str.replace('℃','').astype('int32')
df.head()
df.dtypes

Pandas中的五种数据查询方法--【数值,列表,区间,条件,函数查询】

值得注意的是:

AttributeError: Can only use .str accessor with string values!这种错误一般都是修改完之后了,不能在进行修改,说明已经修改过了

1、使用单个label值查询数据

行或列,都可以只传入单个值,实现精确匹配

查询一个单元格,只会返回一个数字值

#查询一个单元格,只会返回一个数字值
df.loc['2018-01-01','bWendu']

对于列的筛选,会产生一列,得到一个Series

#对于列的筛选,会产生一列,得到一个Series
df.loc['2018-01-01',['bWendu','yWendu']]

Pandas中的五种数据查询方法--【数值,列表,区间,条件,函数查询】

2、使用值列表批量查询

得到Series

#得到Series
df.loc[['2018-01-02','2018-01-03','2018-01-04'],'bWendu']

得到DataFrame

#得到DataFrame
df.loc[['2018-01-02','2018-01-03','2018-01-04'],['bWendu','yWendu']]

Pandas中的五种数据查询方法--【数值,列表,区间,条件,函数查询】

3、使用数值区间进行范围查询

注意:区间既包括开始,也包括结束

行index按区间,切片操作的时候不用加双【】

列index按区间

行和列都按区间查询

#行index按区间,切片操作的时候不用加双【】
df.loc['2018-01-03':'2018-01-05','bWendu']
#列index按区间
df.loc['2018-01-03','bWendu':'fengxiang']
#行和列都按区间查询
df.loc['2018-01-03':'2018-01-05','bWendu':'fengxiang']

Pandas中的五种数据查询方法--【数值,列表,区间,条件,函数查询】

4、使用条件表达式查询

bool列表的长度等于行数或者列数

简单条件查询,最低温度低于-10度的列表

#简单条件查询,最低温度低于-10度的列表
df.loc[df['yWendu']<-10,:]< code></-10,:]<>

观察这里的boolean条件

#&#x89C2;&#x5BDF;&#x8FD9;&#x91CC;&#x7684;boolean&#x6761;&#x4EF6;
df['yWendu']<-10< code></-10<>

Pandas中的五种数据查询方法--【数值,列表,区间,条件,函数查询】

复杂条件查询,查完美天气

注意,组合条件&符号合并,每个条件判断都得带括号

查询最高温度小于30度,最低温度大于15度,晴天,天气为优的数据

#&#x67E5;&#x8BE2;&#x6700;&#x9AD8;&#x6E29;&#x5EA6;&#x5C0F;&#x4E8E;30&#x5EA6;&#xFF0C;&#x6700;&#x4F4E;&#x6E29;&#x5EA6;&#x5927;&#x4E8E;15&#x5EA6;&#xFF0C;&#x6674;&#x5929;&#xFF0C;&#x5929;&#x6C14;&#x4E3A;&#x4F18;&#x7684;&#x6570;&#x636E;
df.loc[(df['bWendu']<=30) & (df['ywendu']>=15) & (df['tianqi']=='&#x6674;') & (df['aqiLevel']==1),:]</=30)>

观察这里boolean的条件

#&#x89C2;&#x5BDF;&#x8FD9;&#x91CC;boolean&#x7684;&#x6761;&#x4EF6;
(df['bWendu']<=30) & (df['ywendu']>=15) & (df['tianqi']=='&#x6674;') & (df['aqiLevel']==1)</=30)>

Pandas中的五种数据查询方法--【数值,列表,区间,条件,函数查询】

5、调用函数查询

直接写lambda表达式

&#x76F4;&#x63A5;&#x5199;lambda&#x8868;&#x8FBE;&#x5F0F;
df.loc[lambda df :(df['bWendu']<=30)&(df['ywendu']>=15),:]</=30)&(df['ywendu']>

直接编写函数,查询9月份,空气质量好的数据

#&#x76F4;&#x63A5;&#x7F16;&#x5199;&#x51FD;&#x6570;&#xFF0C;&#x67E5;&#x8BE2;9&#x6708;&#x4EFD;&#xFF0C;&#x7A7A;&#x6C14;&#x8D28;&#x91CF;&#x597D;&#x7684;&#x6570;&#x636E;
def query_mydata(df):
    return df.index.str.startswith('2018-09')&df['aqiLevel']==1
df.loc[query_mydata]

Pandas中的五种数据查询方法--【数值,列表,区间,条件,函数查询】

Pandas中的五种数据查询方法--【数值,列表,区间,条件,函数查询】

注意:

函数式编程的本质: 函数自身可以像变量一样传递

Original: https://blog.csdn.net/qq_46044325/article/details/126804288
Author: 编程贝多芬
Title: Pandas中的五种数据查询方法–【数值,列表,区间,条件,函数查询】

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/751087/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球