pandas实现筛选功能方式

2023年8月6日下午3:52 • Python • 阅读 71

1 筛选出数据的指定几行数据

data=df.loc[2:5]
#&#x8FD9;&#x91CC;&#x7684;[2:5]&#x8868;&#x793A;&#x7B2C;3&#x884C;&#x5230;&#x7B2C;5&#x884C;&#x5185;&#x5BB9;&#xFF0C;[]&#x7B2C;&#x4E00;&#x4E2A;&#x8D77;&#x59CB;&#x662F;0&#xFF0C;&#x8868;&#x793A;&#x6570;&#x636E;&#x7684;&#x7B2C;&#x4E00;&#x884C;

2 筛选出数据某列为某值的所有数据记录

data = df[(df['列名']== 列值1)]
多条件匹配时
data_many=df[(df['列名1']== 列值1)&(df['列名2']==列值2)]
data_many1=df[(df['列名']== 19920812)|(df['date']==19920811)]

多值匹配时
data_many2=df[df['列名'].isin([19920807,19920814]) ]

3 模式匹配

开头包含某值的模式匹配
cond=df['列名'].str.startswith('值')
$ 中间包含某值的模式匹配
cond=df['列名'].str.contains('值')

4 范围区间值筛选

筛选出基于两个值之间的数据：
cond=df[(df['列名1']>'列值1')&(df['列名1']

5 获取某一行某一列的某个值

print(ridership_df.loc['05-05-11','R003'])
或者
print(ridership_df.iloc[4,0])

结果:
1608

6 获取原始的numpy二维数组

print(df.values)

7 根据条件得到某行元素所在的位置

import pandas as pd

df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]},index=[10,20,30,40,50])
print(df)
a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist()
b = df[(df.BoolCol==3)&(df.attr==22)].index[0]
c = df[(df.BoolCol==3)&(df.attr==22)].index.values
print(a)

8 元素位置筛选

print(date_frame)               # 打印完整显示的效果
print(date_frame.shape)         # 获取df的行数、列数元祖
print(date_frame.head(2))       # 前2行
print(date_frame.tail(2))       # 后2行

print(date_frame.index.tolist())        # 只获取df的索引列表
print(date_frame.columns.tolist())      # 只获取df的列名列表
print(date_frame.values.tolist())       # 只获取df的所有值的列表（二维列表）

9. 删除多行/多列

&#x4F7F;&#x7528;&#x7684;&#x524D;&#x63D0;&#x662F;&#xFF0C;dataframe&#x7684;index&#x548C;columns&#x7528;&#x7684;&#x662F;&#x6570;&#x5B57;&#xFF0C;&#x5229;&#x7528;&#x4E86;drop&#xFF08;&#xFF09;&#x548C;range()&#x51FD;&#x6570;&#x3002;

DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')

axis = 0&#xFF0C;&#x8868;&#x793A;&#x5220;&#x9664;&#x884C;&#xFF1B; axis = 1 &#x8868;&#x793A;&#x5220;&#x9664;&#x5217;&#x3002;

&#x60F3;&#x5220;&#x9664;&#x591A;&#x884C;/&#x5217;&#xFF0C;&#x7528;range&#x5373;&#x53EF;&#xFF0C;&#x6BD4;&#x5982;&#x8981;&#x5220;&#x9664;&#x524D;3&#x884C;&#xFF0C;drop(range(0,3)&#xFF0C;axis = 0(&#x9ED8;&#x8BA4;&#x4E3A;&#x96F6;&#xFF0C;&#x53EF;&#x4E0D;&#x5199;))&#x5373;&#x53EF;&#x3002;

10 to_datetime将字符串格式转化为日期格式

import datetime
import pandas as pd

dictDate = {'date': ['2019-11-01 19:30', '2019-11-30 19:00']}
df = pd.DataFrame(dictDate)
df['datetime'] = pd.to_datetime(df['date'])
df['today'] = df['datetime'].apply(lambda x: x.strftime('%Y%m%d'))
df['tomorrow'] = (df['datetime'] + datetime.timedelta(days=1)).dt.strftime('%Y%m%d')

11 `apply()` 函数

pandas &#x7684; apply() &#x51FD;&#x6570;&#x53EF;&#x4EE5;&#x4F5C;&#x7528;&#x4E8E; Series &#x6216;&#x8005;&#x6574;&#x4E2A; DataFrame&#xFF0C;&#x529F;&#x80FD;&#x4E5F;&#x662F;&#x81EA;&#x52A8;&#x904D;&#x5386;&#x6574;&#x4E2A; Series &#x6216;&#x8005; DataFrame, &#x5BF9;&#x6BCF;&#x4E00;&#x4E2A;&#x5143;&#x7D20;&#x8FD0;&#x884C;&#x6307;&#x5B9A;&#x7684;&#x51FD;&#x6570;&#x3002;
def add_extra(nationality, extra):
    if nationality != "&#x6C49;":
        return extra
    else:
        return 0

df['ExtraScore'] = df.Nationality.apply(add_extra, args=(5,))
df['ExtraScore'] = df.Nationality.apply(add_extra, extra=5)
df['Extra'] = df.Nationality.apply(lambda n, extra : extra if n == '&#x6C49;' else 0, args=(5,))

def add_extra2(nationaltiy, **kwargs):
    return kwargs[nationaltiy]

df['Extra'] = df.Nationality.apply(add_extra2, &#x6C49;=0, &#x56DE;=10, &#x85CF;=5)

12 `map()` 函数

import datetime
import pandas as pd
def f(x):
    x = str(x)[:8]
    if x !='n':
        gf = datetime.datetime.strptime(x, "%Y%m%d")
        x = gf.strftime("%Y-%m-%d")
    return x

def f2(x):
    if str(x) not in [' ', 'nan']:
        dd = datetime.datetime.strptime(str(x), "%Y/%m/%d")
        x = dd.strftime("%Y-%m-%d")
    return x

def test():
    df = pd.DataFrame()
    df1 = pd.read_csv("600694_gf.csv")
    df2=pd.read_csv("600694.csv")
    df['date1'] =df2['DateTime'].map(f2)
    df['date2'] =df1['date'].map(f)
    df.to_csv('map.csv')

参考

Original: https://blog.csdn.net/weixin_42322206/article/details/123607271
Author: 王同学加油
Title: pandas实现筛选功能方式

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/737877/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

利用python爬取城市公交站点

利用python爬取城市公交站点页面分析 https://guiyang.8684.cn/line1 爬虫我们利用requests请求，利用BeautifulSoup来解析，获…

Python 2023年5月24日
0060
python-pandas

pandas 一、创建series * 1.头文件 2.创建series、自定义索引 3.字典创建series 4.series的切片和索引二、DateFrame和Series的…

Python 2023年8月27日
0038
成功解决：AttributeError: ‘NoneType‘ object has no attribute ‘twophase‘

描述：AttributeError: ‘NoneType’ object has no attribute ‘twophase’我写…

Python 2023年8月15日
0033
pandas中drop用法_python进行数据清理之pandas中的drop用法

好久好久没有更新博客了，之前自学的估计也都忘记差不多了。由于毕业选择从事的行业与自己的兴趣爱好完全两条路，心情也难过了很久，既然入职了就要好好干，仍要保持自己的兴趣，利用业余时间重…

Python 2023年8月20日
0075
Python+Selenium+Pytest+Allure自动化测试框架实战实例（示例为我司网盘产品）

前言应公司要求，组织员工培训自动化测试，所以也趁此机会把我所学习的自动化框架整理一下，虽说不是很完美，但也有所收获。环境准备序号库、插件、工具版本号1Python3.112P…

Python 2023年9月14日
0058
MySQL数据库面试题总结（2022最新版）

🐶 程序猿周周⌨️ 短视频小厂BUG攻城狮🤺 如果文章对你有帮助，记得关注、点赞、收藏，一键三连哦，你的支持将成为我最大的动力本文是《后端面试小册子》系列的第 1️⃣ 篇文章，该…

Python 2023年11月5日
0037
Dockerfile中创建并激活conda环境

在写Dockerfile的时候我们希望自动安装Miniconda，并且创建一个叫做torch的环境，并且安装相应的包，下面是我写的Dockerfile文件第一个Dockerfil…

Python 2023年9月8日
0074
java实现根据先序遍历和中序遍历结果复原二叉树（剑指offer）

思路前序遍历序列为根左右顺序，中序遍历序列为左根右。首先根据前序遍历序列确定根节点，然后在中序遍历序列寻找根节点位置，考虑到当前序列在中序遍历序列的开始位置从而在中序遍历序列中…

Python 2023年6月12日
0065
数据分析 — Pandas③

目录表格合并 * 纵向合并横向合并数据清洗 * 删除缺失数据行数据填充统一数据格式去除重复数据 pandas 中很实用的方法——apply() 方法附：匿名函数表格…

Python 2023年8月7日
0062
表弟打把王者的时间，我就用python写了个自动玩贪吃蛇的程序

我的表弟最近放假了，没有做作业。我气得差点想给他买三年的高考和五年的模拟。 [En] My cousin recently had a holiday and didn&#8217…

Python 2023年5月24日
0052
Django使用sqlite3数据库（呕心沥血终于成功了）

首先，Django默认使用的就是sqlite3，而大多数人一上来就是使用MySQL，配置更加复杂，搞了一两个小时也没弄好（我太菜了，，，）对于小的网站项目，使用sqlite3足以。…

Python 2023年8月5日
00272
嵌入式系统测试思路

随着物联网的发展，嵌入式测试又重新回到大众视线。嵌入式测试也好，游戏测试也好，软件测试也好，在大方向上来说，没有特别大的区别。但是需要注意的是，嵌入式系统比纯粹的软件系统链路会…

Python 2023年6月11日
0076
Python赚钱千万不能有加法思维

大家好，我是一行很多读者都知道我是做科研的时候接触到python，但当时想的更多的是这玩意学会是不是可以赚钱～但我做着做着就陷入了深深的质疑，一直在做的就是求职和接单，怎么像跪…

Python 2023年8月5日
0061
pytorch中.numpy()、.item()、.cpu()、.detach()及.data的使用

目录 * – + .numpy() + .item() + .cpu() + .detach()和.data（重点） .numpy() Tensor.numpy()将T…

Python 2023年8月22日
0045
python read_excel 参数_对Python 2.7 pandas 中的read_excel详解

对Python 2.7 pandas 中的read_excel详解发布时间：2020-08-28 03:32:56 来源：脚本之家阅读：106 作者：G_66_hero 导入p…

Python 2023年8月17日
0046
linux conda python命令总结（长期）

目录Linux ubuntu 命令总结 1Python命令总结 2安装虚拟机 3Anaconda 3程序中遇到的问题 4 Linux ubuntu 命令总结打开命令窗口：采用快捷键…

Python 2023年9月9日
0047

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pandas实现筛选功能方式

1 筛选出数据的指定几行数据

2 筛选出数据某列为某值的所有数据记录

3 模式匹配

4 范围区间值筛选

5 获取某一行某一列的某个值

6 获取原始的numpy二维数组

7 根据条件得到某行元素所在的位置

8 元素位置筛选

9. 删除多行/多列

10 to_datetime将字符串格式转化为日期格式

11 apply() 函数

12 map() 函数

参考

大家都在看

11 `apply()` 函数

12 `map()` 函数