pandas行和列的获取

2023年7月7日上午12:39 • 人工智能 • 阅读 45

DataFrame的行和列：df[‘行’, ‘列’]

DataFrame行和列的获取分三个维度

行和列选取：df[]，一次只能选取行或列
区域选取：df.loc[], df.iloc[], df.ix[]，可以同时为行或列设置筛选条件
单元格选取：df.at[], df.iat[]，准确选取某个单元格

先随机生成一个dataframe

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.randn(10,5), index=list('abcdefghij'), columns=list('ABCDE'))

       A            B          C            D           E
a   0.299206    -0.383297   -0.931467   -0.591609   -1.131105
b   0.074351    0.791849    1.637467    -1.408712   -1.376527
c   -0.359802   -2.049489   -0.615742   -1.953994   0.685243
d   0.232557    1.768284    -0.447015   2.373358    1.220536
e   -0.997380   -0.447236   0.632368    -0.352590   -0.064736
f   -1.220178   -0.314304   1.202184    0.018326    1.072153
g   -1.508916   0.380466    0.359506    -0.742657   -0.373764
h   1.031420    -3.236676   0.444769    1.396802    -0.405590
i   0.166133    -0.051614   -0.146943   0.609431    -0.351814
j   1.857521    -0.159101   0.899745    1.108722    -0.615379

1.1 根据索引获取行

获取前3行数据

df[:3]

       A            B          C            D           E
a   0.299206    -0.383297   -0.931467   -0.591609   -1.131105
b   0.074351    0.791849    1.637467    -1.408712   -1.376527
c   -0.359802   -2.049489   -0.615742   -1.953994   0.685243

获取第2到3行数据

df[1:3]
df['b':'c']

       A            B          C            D           E
b   0.074351    0.791849    1.637467    -1.408712   -1.376527
c   -0.359802   -2.049489   -0.615742   -1.953994   0.685243

获取特定行数据


df[[True,False,True,False,False,False, True, True, False, True]]

       A            B          C            D           E
a   0.299206    -0.383297   -0.931467   -0.591609   -1.131105
c   -0.359802   -2.049489   -0.615742   -1.953994   0.685243
g   -1.508916   0.380466    0.359506    -0.742657   -0.373764
h   1.031420    -3.236676   0.444769    1.396802    -0.405590
j   1.857521    -0.159101   0.899745    1.108722    -0.615379

1.2 根据条件获取行

获取A列大于0的行

df[df.A > 0]

       A            B          C            D           E
a   0.299206    -0.383297   -0.931467   -0.591609   -1.131105
b   0.074351    0.791849    1.637467    -1.408712   -1.376527
d   0.232557    1.768284    -0.447015   2.373358    1.220536
h   1.031420    -3.236676   0.444769    1.396802    -0.405590
i   0.166133    -0.051614   -0.146943   0.609431    -0.351814
j   1.857521    -0.159101   0.899745    1.108722    -0.615379

获取A列和B列大于0的行

df[(df.A > 0) & (df.B > 0)]

       A            B          C            D           E
b   0.074351    0.791849    1.637467    -1.408712   -1.376527
d   0.232557    1.768284    -0.447015   2.373358    1.220536

获取A列或列大于0的行

df[(df.A > 0) | (df.B > 0)]

       A            B          C            D           E
a   0.299206    -0.383297   -0.931467   -0.591609   -1.131105
b   0.074351    0.791849    1.637467    -1.408712   -1.376527
d   0.232557    1.768284    -0.447015   2.373358    1.220536
g   -1.508916   0.380466    0.359506    -0.742657   -0.373764
h   1.031420    -3.236676   0.444769    1.396802    -0.405590
i   0.166133    -0.051614   -0.146943   0.609431    -0.351814
j   1.857521    -0.159101   0.899745    1.108722    -0.615379

1.3 获取列


df['A']
df[['A']]

df[['A', 'B']]
df[df.columns[0:2]]

df.loc[] 只能使用标签索引，不能使用整数索引，通过便签索引切边进行筛选时，前闭后闭。
df.iloc[] 只能使用整数索引，不能使用标签索引，通过整数索引切边进行筛选时，前闭后开。
df.ix[]既可以使用标签索引，也可以使用整数索引。

2.1 df.loc[]

获取a行


df.loc['a']
df.loc['a', :]

A    0.299206
B   -0.383297
C   -0.931467
D   -0.591609
E   -1.131105
Name: a, dtype: float64

df.loc[['a']]
df.loc[['a'], :]

       A            B          C            D           E
a   0.299206    -0.383297   -0.931467   -0.591609   -1.131105

获取a, b, d行


df.loc[['a', 'b', 'd']]
df.loc[['a', 'b', 'd'], :]

df[[True, True, False, True, False, False, False, True, False, True]]

       A            B          C            D           E
a   0.299206    -0.383297   -0.931467   -0.591609   -1.131105
b   0.074351    0.791849    1.637467    -1.408712   -1.376527
d   0.232557    1.768284    -0.447015   2.373358    1.220536

获取a到d行

df.loc['a':'d', :]

       A            B          C            D           E
a   0.299206    -0.383297   -0.931467   -0.591609   -1.131105
b   0.074351    0.791849    1.637467    -1.408712   -1.376527
c   -0.359802   -2.049489   -0.615742   -1.953994   0.685243
d   0.232557    1.768284    -0.447015   2.373358    1.220536

选取A列大于0的行

df.loc[df.A > 0]
df.loc[df.A > 0, :]

       A            B          C            D           E
a   0.299206    -0.383297   -0.931467   -0.591609   -1.131105
b   0.074351    0.791849    1.637467    -1.408712   -1.376527
d   0.232557    1.768284    -0.447015   2.373358    1.220536
h   1.031420    -3.236676   0.444769    1.396802    -0.405590
i   0.166133    -0.051614   -0.146943   0.609431    -0.351814
j   1.857521    -0.159101   0.899745    1.108722    -0.615379


df.loc[:, 'A']

df.loc[:, ['A', 'C']]

df.loc[:, 'A':'C']


df.loc['c', 'B']

df.loc[((df.A > 0) & (df.B > 0)), ['C', 'D']]


df.loc['a', :] = 10

df.loc[:, 'B'] = 50

df.loc[['b', 'c'], 'C':'F'] = 30

df.loc[df.C < 0] = 0

Example

tuples = [
   ('cobra', 'mark i'), ('cobra', 'mark ii'),
   ('sidewinder', 'mark i'), ('sidewinder', 'mark ii'),
   ('viper', 'mark ii'), ('viper', 'mark iii')
]
index = pd.MultiIndex.from_tuples(tuples)
values = [[12, 2], [0, 4], [10, 20],
        [1, 4], [7, 1], [16, 36]]

df = pd.DataFrame(values, columns=['max_speed', 'shield'], index=index)

df
                     max_speed  shield
cobra      mark i           12       2
           mark ii           0       4
sidewinder mark i           10      20
           mark ii           1       4
viper      mark ii           7       1
           mark iii         16      36

df.loc['cobra']
         max_speed  shield
mark i          12       2
mark ii          0       4


df.loc[('cobra', 'mark ii')]
max_speed    0
shield       4
Name: (cobra, mark ii), dtype: int64

df.loc[[('cobra', 'mark ii')]]
               max_speed  shield
cobra mark ii          0       4


df.loc['cobra', 'mark i']
max_speed    12
shield        2
Name: (cobra, mark i), dtype: int64

df.loc[('cobra', 'mark i'), 'shield']
2

df.loc[('cobra', 'mark i'):'viper']
                     max_speed  shield
cobra      mark i           12       2
           mark ii           0       4
sidewinder mark i           10      20
           mark ii           1       4
viper      mark ii           7       1
           mark iii         16      36

df.loc[('cobra', 'mark i'):('viper', 'mark ii')]
                    max_speed  shield
cobra      mark i          12       2
           mark ii          0       4
sidewinder mark i          10      20
           mark ii          1       4
viper      mark ii          7       1

2.2 df.iloc[ ]

选取第二行


df.iloc[1]
df.iloc[1, :]

df.iloc[[1]]
df.iloc[[1], :]

选取前三行

df.iloc[:3, :]
df.iloc[:3]

选取第一、三、五行

df.iloc[[1, 3, 5]]
df.iloc[[1, 3, 5], :]

选取第二列

df.iloc[:, 1]

选取前三列

df.iloc[:, 0:3]
df.iloc[:,:3]

选取第一三四列

df.iloc[:, [0, 2, 3]]

选取第一行第二列的值

df.iloc[0, 1]

选取第二三行的第二到四列

df.iloc[[1,2], 1:4]

2.3 df.ix[ ]

可以混合标签索引和整数索引

However, when an axis is integer based, ONLY label based access and not positional access is supported. Thus, in such cases, it’s usually better to be explicit and use .iloc or .loc.

df.at[ ] 只能使用 标签索引
df.iat[ ] 只能使用 *整数索引

3.1 df.at[]

获取c行C列的值

df.at['c', 'C']

把c行C列赋值为10

df.at['c', 'C'] = 10

3.2 df.iat[]

获取第三行第三列的值

df.iat[2, 2]

把第三行第三列赋值为10

df.iat[2, 2] = 10

Original: https://blog.csdn.net/weixin_46599926/article/details/122795057
Author: 羊羊猪
Title: pandas行和列的获取

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/675117/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【opencv】基于opencv实现人脸识别，原理&代码部分

上一部分我们解决了环境问题，这一部分我们可以开始上代码，环境没有配好的可以参照上一篇博客：环境搭建解决：下面先说一下原理：一.原理部分本文基于opencv来实现人脸识别，大致…

人工智能 2023年6月24日
00132
r语言面板数据回归_R语言之回归分析

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月18日
0057
OpenCV综合练习2——扑克牌(文本)校正

图像处理综合练习2——多角度扑克牌校正这是我刚开始学习图像处理时在B站上所接触的一个文本校正小练习，但是视频中的场景角度单一，只能校正固定视角下的文本，相对简单，但对于初学者来说…

人工智能 2023年6月22日
00132
2D人体姿势估计论文合集

文章目录前言什么是人体姿势估计？为什么难？二维人体姿态估计的不同方法 * 经典方法基于深度学习的方法 2018 * Simple Baselines for Human …

人工智能 2023年7月24日
0053
jdk线程池ThreadPoolExecutor工作原理解析（自己动手实现线程池）

线程池介绍在日常开发中经常会遇到需要使用其它线程将大量任务异步处理的场景（异步化以及提升系统的吞吐量），而在使用线程的过程中却存在着两个痛点。而线程池正是为解决上述痛点而生的，…

人工智能 2023年6月28日
0066
Spark DataFrame列的合并与拆分

版本说明：Spark-2.3.0 使用Spark SQL在对数据进行处理的过程中，可能会遇到对一列数据拆分为多列，或者把多列数据合并为一列。这里记录一下目前想到的对DataFram…

人工智能 2023年7月4日
0063
CVPR18 – 不需要指定超参数的无监督聚类《Efficient Parameter-free Clustering Using First Neighbor Relations》

文章目录 * – 原文地址 – 初识 – 相知 – 回顾原文地址 https://arxiv.org/abs/1902.11266…

人工智能 2023年6月2日
00107
SLAM【十】回环检测

SLAM【十】回环检测回环检测的作用及意义 * 作用意义回环检测方法 * 准确率和召回率词袋模型字典 * 字典的结构字典的创建相似度计算相似度评分的处理关键帧的处…

人工智能 2023年6月15日
0093
GIN：图同构网络

论文标题：How Powerful are Graph Neural Networks? 论文链接：https://arxiv.org/abs/1810.00826 论文来源：IC…

人工智能 2023年7月12日
0078
Ubuntu20.04下深度学习环境配置（持续维护）

Ubuntu20.04下深度学习环境配置 Ubuntu20.04下深度学习环境配置 * 一、换国内源二、gpu驱动三、Anaconda安装四、pytorch-cpu版本安装 …

人工智能 2023年6月17日
0083
pandas数据清洗之处理缺失、重复、异常数据

在数据分析和建模的过程中，有相当多的时间要用在数据准备上：加载、清理、转换以及重塑。这些工作会占到分析师时间的80%或更多。幸运的是pandas和内置的Python标准库提供了高效…

人工智能 2023年6月15日
0083
图像分类（AlexNet）：代码笔记

文章目录（零）AlexNet前言知识 * 0.1 常用公式 0.2 深度学习的宏观框架 0.3 ImageNet数据集 AlexNet的历史意义 AlexNet完整结构图论文中…

人工智能 2023年7月1日
0093
【自动驾驶-感知-红绿灯】红绿灯识别知识点

红绿灯识别是自动驾驶中最为基础的功能，识别方法主要有两种，一种基于视觉图像识别，一种基于v2x。 v2x，即通过红绿灯自己实时发送信号状态，再由车辆低延迟接收信号。该方法要对红绿灯…

人工智能 2023年6月2日
00284
Raki的读paper小记：DualNet: Continual Learning, Fast and Slow

Abstract & Introduction & Related Work 研究任务持续学习已有方法和相关工作面临挑战虽然无监督和元训练在简单的数据集如M…

人工智能 2023年5月28日
0064
day1-机器学习-回归问题

1、机器学习，通过算法使得机器能从大量的数据中学习规律，并利用规律对未知数据进行预测。 2、回归，是对一个或多个自变量和因变量之间的关系进行建模，求解的一种统计方法。（注：预测的…

人工智能 2023年6月18日
0070
OpenCV的图像直角坐标系转极坐标系的函数warpPolar()详解,并附自己写的实现直角坐标系转极坐标系的MATLAB代码

【草稿】详解OpenCV实现图像直角坐标系转极坐标系的函数warpPolar(),并附自己写的实现直角坐标系转极坐标系的MATLAB代码有些时候我们需要把图像或矩阵从直角坐标系(…

人工智能 2023年7月18日
0075

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31