Pandas中loc和iloc函数用法总结，以及如何在groupBy后提取分组的指定行数据

2023年7月8日下午3:57 • 人工智能 • 阅读 50

loc函数：通过 行索引 “Index” 中的具体值来取行数据（如取”Index”为”A”的行）

iloc函数： 通过行号来取行数据（如取第二行的数据）

import numpy as np
import pandas as pd

data=pd.DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('ABCD'))

In[1]: data
Out[1]:
    A   B   C   D
a   0   1   2   3
b   4   5   6   7
c   8   9  10  11
d  12  13  14  15

In[2]: data.loc['a']
Out[2]:
A    0
B    1
C    2
D    3

In[3]: data.iloc[0]
Out[3]:
A    0
B    1
C    2
D    3

In[4]:data.loc[:,['A']]
Out[4]:
    A
a   0
b   4
c   8
d  12

In[5]:data.iloc[:,[0]]
Out[5]:
    A
a   0
b   4
c   8
d  12

In[6]:data.loc[['a','b'],['A','B']]
Out[6]:
   A  B
a  0  1
b  4  5

In[7]:data.iloc[[0,1],[0,1]]
Out[7]:
   A  B
a  0  1
b  4  5

In[8]:data.loc[:,:]
Out[8]:
    A   B   C   D
a   0   1   2   3
b   4   5   6   7
c   8   9  10  11
d  12  13  14  15

In[9]:data.iloc[:,:]
Out[9]:
    A   B   C   D
a   0   1   2   3
b   4   5   6   7
c   8   9  10  11
d  12  13  14  15

In[10]: data.loc[data['A']==0]
Out[10]:
   A  B  C  D
a  0  1  2  3

In[11]: data.loc[(data['A']==0)&(data['B']==1)]
Out[11]:
   A  B  C  D
a  0  1  2  3

同时，以下几种写法也可提取数据所在的行，与第五种用法类似。

In[12]: data[data['A']==0]
In[13]: data[data['A'].isin([0])]
In[14]: data[(data['A']==0)&(data['B']==1)]
In[15]: data[(data['A'].isin([0]))&(data['B'].isin([1]))]

Out[15]:
   A  B  C  D
a  0  1  2  3

利用loc函数的时候，当index相同时，会将相同的Index全部提取出来，优点是：如果index是人名，数据框为所有人的数据，那么我可以将某个人的多条数据提取出来分析；缺点是：如果index不具有特定意义，而且重复，那么提取的数据需要进一步处理,可用.reset_index()函数重置index

接下来是总结iloc在特殊场景下的用法：

：取每个user同一subject排倒数第二得成绩

In[16]:
df = pd.DataFrame({'user': ['A', 'B', 'A','D'], 'subject': [11, 12, 11, 13], 'score': [90, 99, 89, 90]})
df
Out[16]:
    user    subject     score
0   A   11  90
1   B   12  99
2   A   11  89
3   D   13  90

In[17]:
grouped_data = df.sort_values(by='score').groupby(['user', 'subject'])['score'].apply(lambda i:i.iloc[-2] if len(i)> 1 else i.iloc[-1])
grouped_data
Out[17]:
user  subject
A     11       89
B     12       99
D     13       90
Name: score, dtype: int64

Original: https://blog.csdn.net/qq_39657585/article/details/114778969
Author: Demi 丫
Title: Pandas中loc和iloc函数用法总结，以及如何在groupBy后提取分组的指定行数据

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/678813/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python调用win32api 拉起wps问题排查解决方案

系列文章【毕业设计】基于mqtt+vue+Thinkphp实现校园云打印小程序（暂未完成更新）文章目录系列文章前言问题排查 * 第一个问题，pywintypes.com_…

人工智能 2023年6月28日
0091
YOLOv7快速复现【demo演示】YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object

2022年7月6日周三 YOLOv7发布目录 0 相关资源 1 论文简叙 * 1.1 Title 1.2 Abstract 2 Hugging Face 3 GPU平台 4 yo…

人工智能 2023年6月25日
0094
python–基于三层神经网络实现手写数字分类

背景知识一个完整的神经网络通常由多个基本的网络层堆叠而成。本实验中的三层神经网络由三个全连接层构成，在每两个全连接层之间会插入ReLU激活函数引入非线性变换，最后使用Softma…

人工智能 2023年7月3日
0077
随机森林可视化

今天看到别人的文章，说到了随机森林可视化，于是尝试了下。 window安装 windows版本安装:1.在下面去下载window的exe安装包，安装graphviz。 http:/…

人工智能 2023年6月28日
0058
【数学建模】聚类分析——python实现

目录一、储备知识（1）何为聚类分析：（2）分类方法：二、聚类分析的一般步骤三、聚类实操——python实现四、代码总结一、储备知识（1）何为聚类分析：聚类分析又称…

人工智能 2023年7月5日
0071
【活动报名】11月19日 | AI GC 的技术与应用构建

2022/11/19 Apps Everywhere 系列活动-上海站 AI GC 的技术与应用构建 “Apps Everywhere” 是亚马逊云科技 U…

人工智能 2023年6月27日
0092
两个音轨合并_怎么合并音频文件两个音频合并成一个

怎么将两个音频合成一个音频文件，嗯~ o(￣▽￣)o ，又是一个老生常谈的话题，但既然是提到了自然是再给大伙演示一下，那就使用一个比较简单的音频合成软件/音频视频合成软件合并不同格…

人工智能 2023年5月27日
0082
机器学习之线性回归算法Linear Regression（python代码实现）

线性回归（Linear Regression）是一种非常简单、用处非常广泛、含义也非常容易理解的一类经典的算法，非常合适作为机器学习的入门算法。线性回归就是拟合出一个线性组合关系…

人工智能 2023年7月4日
0078
异常检测论文（一）：CutPaste

CutPaste: Self-Supervised Learning for Anomaly Detection and Localization （基于自监督学习的图像异常检测的…

人工智能 2023年7月9日
0070
抖音大火的AI虚拟人，画的猫为啥这么丑？

金磊发自凹非寺量子位 | 公众号 QbitAI 谁能想到，本以为无所不能的 AI虚拟人，竟也能让人哭笑不得。事情这样的。最近一个叫做 “小堂妹”…

人工智能 2023年6月24日
00170
大数据与人工智能方向基础 —– K近邻回归模型

目录前言一、回归模型的一般描述二、K近邻回归算法的描述三、K近邻回归的预测规则方式一、等权平均 — 传统的K近邻决策方式方式二、基于距离的加权平均前言有…

人工智能 2023年6月17日
0064
【动手学深度学习PyTorch版】2 线性回归

参考视频按特定轴求和_哔哩哔哩_bilibili 目录一、自动求导 ◼ 相关知识 # 计算图 # 反向累积 ◼ 自动求导代码实现二、线性回归 ◼ 举例：房价预测 # 线性回归模…

人工智能 2023年7月22日
00112
【论文笔记】Semi-Supervised Active Learning with Temporal Output Discrepancy(ICCV 2021)

论文：Semi-Supervised Active Learning with Temporal Output Discrepancy代码：https://github.com/s…

人工智能 2023年7月14日
0070
python快速实现10种聚类算法

文章目录什么是聚类？什么是聚类算法？ * 安装库创建一个测试二分类数据集亲和力传播算法AP 聚合聚类 BIRCH DBSCAN K均值 Mini-Batch K-均值均值…

人工智能 2023年5月31日
0073
Kaldi在线搭建语音识别系统-李健

Kaldi数据准备：需要准备四个文件 wav.scp [utt-id] [wav-path] e.g. sen_1 /home/train01_data/sen_1.wav te…

人工智能 2023年5月25日
0059
Docker使用GPU

一、docker使用宿主机硬件设备的三种方式使用–privileged=true选项，以特权模式开启容器使用–device选项使用容器卷挂载-v选项 …

人工智能 2023年6月17日
0077

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Pandas中loc和iloc函数用法总结， 以及如何在groupBy后提取分组的指定行数据

大家都在看

Pandas中loc和iloc函数用法总结，以及如何在groupBy后提取分组的指定行数据