Pandas模块之DataFrame：02-索引与切片

2023年8月16日下午12:05 • Python • 阅读 48

Dataframe既有行索引也有列索引，可以被看做由Series组成的字典。

df = pd.DataFrame(np.random.randint(100,size =12).reshape(3,4),
                   index = ['one','two','three'],
                   columns = ['a','b','c','d'])
print(df)
============================
        a   b   c   d
one    35  35  17  50
two    53   4  51  23
three  82  12  51  97

data1 = df['a']
data2 = df[['a','c']]
print(data1,type(data1))
print(data2,type(data2))
============================
one      35
two      53
three    82
Name: a, dtype: int32 <class 'pandas.core.series.Series'>
        a   c
one    35  17
two    53  51
three  82  51 <class 'pandas.core.frame.DataFrame'>

data3 = df.loc['one']
data4 = df.loc[['one','two']]
print(data3,type(data3))
print(data4,type(data4))
============================
a    35
b    35
c    17
d    50
Name: one, dtype: int32 <class 'pandas.core.series.Series'>
      a   b   c   d
one  35  35  17  50
two  53   4  51  23 <class 'pandas.core.frame.DataFrame'>

df[ ]默认选择列，[ ]中写列名（所以一般数据colunms都会单独制定，不会用默认数字列名，以免和index冲突）。单选列结果为Series，多选列结果为Dataframe。选取列名不能超出源数据列名，不然报错

data1 = df['a']
data2 = df[['b','c']]
print(data1)
print(data2)
============================
one      35
two      53
three    82
Name: a, dtype: int32
        b   c
one    35  17
two     4  51
three  12  51

df[]中为数字时，默认选择行，且只能进行切片操作，不能单独选择（df[0]）,输出结果为Dataframe，即便只选择一行。df[]不能通过索引标签名来选择行(df[‘one’])

data3 = df[:1]
print(data3,type(data3))
============================
      a   b   c   d
one  35  35  17  50 <class 'pandas.core.frame.DataFrame'>

df1 = pd.DataFrame(np.random.randint(100,size = 16).reshape(4,4),
                   index = ['one','two','three','four'],
                   columns = ['a','b','c','d'])
print(df1)
============================
        a   b   c   d
one    81  16  59  87
two    16   7  66  70
three  18  28  68  59
four   50  87  98  73

df1.loc[['one','three'],['a','b']]
============================
        a   b
one     81  16
three   18  28

如果索引的标签不存在，结果则会用NaN代替。

df1.loc[['one','two','five'],['a','b','x']]
============================
         a     b   x
one   81.0  16.0 NaN
two   16.0   7.0 NaN
five   NaN   NaN NaN

切片：
loc用作 切片索引的时候，是左右包含的，在参数写法上没有列表的方括号，示例如下:

df1.loc['one':'three','a':'c']
============================
        a   b   c
one    81  16  59
two    16   7  66
three  18  28  68

与df.loc[ ]用法不同的是，该方法通过行列的位置来定位，从0开始计,左闭右开，在用法思路上和loc方法类似。

选取：

df1 = pd.DataFrame(np.random.randint(100,size = 16).reshape(4,4),
                   index = ['one','two','three','four'],
                   columns = ['a','b','c','d'])
print(df1)
============================
        a   b   c   d
one    81  16  59  87
two    16   7  66  70
three  18  28  68  59
four   50  87  98  73

df1.iloc[[1,2],[1,2]]
        b   c
two    69  36
three  35  45

选取索引和列表类似，也可以用负数索引

df1.iloc[:,-1]
============================
one      29
two      72
three    37
four     99
Name: d, dtype: int32

切片：
采用切片操作的时候，表示行列位置的数字要求在行列范围内，不能越界。而且切片遵循的是左闭右开。

df1.iloc[1:2,1:2]
============================
        b   c
two    69  36
three  35  45

print(df1.iloc[::2])
============================
        a   b   c   d
one    40  19  37  29
three  74  35  45  37

布尔型索引的用法与Series结构中的用法类似。示例：

df = pd.DataFrame(np.random.randint(100,size = 16).reshape(4,4),
                   index = ['one','two','three','four'],
                   columns = ['a','b','c','d'])
print(df)
============================
        a   b   c   d
one     3  94  79  46
two    43  46  79  60
three  54  56  77  24
four   85  24  59  73

df > 50
==============================
           a      b     c      d
one    False   True  True  False
two    False  False  True   True
three   True   True  True  False
four    True  False  True   True

df[df > 50]
==============================
          a     b   c     d
one     NaN  94.0  79   NaN
two     NaN   NaN  79  60.0
three  54.0  56.0  77   NaN
four   85.0   NaN  59  73.0

可以看出，对整个DataFrame采用布尔索引操作时，如果判断为True则返回原数据，False返回值为NaN。
也可以对具体的行列采用布尔索引，示例如下：

df[df['a'] > 50]
==============================
        a   b   c   d
three  54  56  77  24
four   85  24  59  73

df.loc[['one','three']] > 50
==============================
           a     b     c      d
one    False  True  True  False
three   True  True  True  False

df[df.loc[['one','three']] > 50]
==============================
          a     b     c   d
one     NaN  94.0  79.0 NaN
two     NaN   NaN   NaN NaN
three  54.0  56.0  77.0 NaN
four    NaN   NaN   NaN NaN

创建Dataframe（4 * 4,值为0-100的随机数),通过索引得到部分值
① 索引得到b，c列的所有值
② 索引得到第三第四行的数据
③ 按顺序索引得到two，one行的值
④ 索引得到大于50的值

data = np.random.randint(100, size = 16).reshape((4,4))
inx = ['one','two','three','four']
col = list('abcd')
df = pd.DataFrame(data,index=inx,columns=col)
print(df)
print('-'*10)
print(df[['b','c']])
print('-'*10)
print(df.iloc[2:4])
print('-'*10)
print(df.loc[['two','one']])
print('-'*10)
b = df > 50
print(df[b])

==============================
  a   b   c   d
one    20  23  74  94
two    39  32   7  39
three  84   6  32  75
four   53  47  46  25
        a   b   c   d
three  84   6  32  75
four   53  47  46  25
          a   b     c     d
one     NaN NaN  74.0  94.0
two     NaN NaN   NaN   NaN
three  84.0 NaN   NaN  75.0
four   53.0 NaN   NaN   NaN

Original: https://blog.csdn.net/wuzhiyao1210/article/details/113942323
Author: wuzhiyao1210
Title: Pandas模块之DataFrame：02-索引与切片

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/751121/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

03_Linux基础-文件类型-主辅提示符-第1提示符-Linux命令-内外部命令-快捷键-改为英文编码-3个时间-stat-其他基础命令

03_Linux基础-文件类型-主辅提示符-第1提示符-Linux命令-内外部命令-快捷键-改为英文编码-3个时间-stat-{1..100}-du-cd-cp-file-mv-e…

Python 2023年6月15日
0087
对python爬虫中scrapy框架代码学习理解

经过对scrapy框架的简单学习后，对其编码过程进行如下简单的梳理，以便于自己今后的复习。与大多数爬虫编写过程基本一致，主要过程如下： 1、首先创建工程文件：scrapy star…

Python 2023年10月5日
0040
python自动化办公

一，xlwings的安装与使用 1，xlwings是什么在日常生活中我们或多或少的都会跟Excel打交道，比如做销售统计，人力的考勤，学生的考试成绩等等，甚至在某些领域会涉及到批…

Python 2023年5月23日
0098
selenium+pytest自动化测试框架FAQ

欢迎进行接口(httprunner)、UI自动化(pytest)交流，博主微信：jiaotengfei1016 【解题的思路是关键，不然浪费时间精力】（1）先自己百度，没百度到，只…

Python 2023年9月12日
0042
Python操作Mysql数据库

文章目录使用PyMySQL连接数据库并执行SQL语句 * 安装PyMySQL模块连接数据库并执行语句插入多条数据查询数据删除数据完整项目在Flask项目中连接数据库 …

Python 2023年8月10日
0082
【Python】笛卡尔心形线——数学家的浪漫（花式哄小女友第一天）

文章目录简介演示安装方程 * 参数方程极坐标方程源码拓展仓库其它参考简介用 python的 matplotlib库绘制心形线。演示心-直角坐标心-极坐标…

Python 2023年9月2日
0049
普通程序员看k8s的账户管理

一、知识准备 ● 账户管理分为：userAccount与serviceAccount● userAccount：通常是给人设计使用的，并且userAccount不在k8s集群内管理…

Python 2023年6月10日
0064
【疑难杂症】两DataFrame的时间索引反向/求差集，查找缺失时间数据

两DataFrame的时间索引反向/求差集，查找缺失时间数据 1 构造两个时间DataFrame数据 2 目的 3 实现方式 * 3.1 方式一 3.2 方式二 3.3 方式三手…

Python 2023年8月8日
0071
Pandas 速查手册

关键缩写和包导入在这个速查手册中，我们使用如下缩写： df：任意的 Pandas Data…

Python 2023年8月20日
0053
pandas常用功能_2：数据合并merge

python有多种数据合并的方法，在不同的场合我们可以使用不用的方法 merge可能是我们最熟悉，也最常用的一个方法，因为它的用法与mysql的连接（join）非常类似。函数介绍…

Python 2023年8月22日
0042
Flask系列文章-01Flask基础

Flask基础 Flask安装学习一个框架，肯定是要先安装一下这个框架的。这里Flask的安装很简单，只需要有Python，然后使用pip就可以对其进行安装。 pip insta…

Python 2023年8月13日
0051
Python标准库笔记(7) — copy模块

copy-对象拷贝模块；提供了浅拷贝和深拷贝复制对象的功能, 分别对应模块中的两个函数 copy() 和 deepcopy()。 1.浅拷贝(Shallow Copies) cop…

Python 2023年6月3日
0068
新创建的Django项目Django administration用户名和密码配置

目录背景信息解决办法执行python manage.py createsuperuser 执行python manage.py migrate 再次执行python mana…

Python 2023年8月4日
00146
记一次进程阻塞诊断

本文来自博客园，作者：T-BARBARIANS，博文严禁转载，转载必究！前言进程在运行过程中会在执行，阻塞，就绪状态下来回切换。简单介绍下各个状态的切换原因吧。从执行-&g…

Python 2023年10月23日
0052
C 语言 struct 第一个成员变量的妙用

一、双重身份如下定义了一个 School 结构体： typedef struct School { int a; int b; }SCHOOL_S; SCHOOL_S stSch…

Python 2023年10月22日
0032
在python中读取和写入CSV文件（你真的会吗？）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

Python 2023年7月31日
0059

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pandas模块之DataFrame：02-索引与切片

大家都在看