pandas中的索引和多层索引

2023年7月6日下午7:09 • 人工智能 • 阅读 70

索引分类

Index；单层索引；
MultiIndex；多层索引；

举例：

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(4, 4))*10//1
print(df)

输出结果为：

     0    1    2    3
0  7.0  9.0  6.0  1.0
1  9.0  0.0  2.0  2.0
2  3.0  7.0  8.0  4.0
3  7.0  6.0  8.0  4.0

单层索引

创建dataframe时，如果没有指定index和columns参数，pandas将会自动生成对应的索引；
默认的行列标签皆为一个RangeIndex对象，属于Index中的一种形式；
- 比如：

print(df.index)

输出结果为：

RangeIndex(start=0, stop=4, step=1)

Index是更通用的函数，通过Index函数可以创建Index对象，更改dataframe的索引；

Index_A = df.index = pd.Index(list('ABCD'))
df.columns = pd.Index(list('abcd'))

print(df)
print(Index_A)

输出结果为：

     a    b    c    d
A  8.0  8.0  6.0  5.0
B  1.0  4.0  4.0  4.0
C  3.0  9.0  8.0  6.0
D  3.0  1.0  0.0  0.0
Index(['A', 'B', 'C', 'D'], dtype='object')

index对象包含以下属性：
- 值构成的数组：

Index_A.array

输出为：

<pandasarray>
['A', 'B', 'C', 'D']
Length: 4, dtype: object
</pandasarray>

+ 数据类型：

Index_A.dtype

输出为：

dtype('O')

+ level个数：

Index_A.nlevels

输出为：

+ 维度：

Index_A.ndim

输出为：

+ 尺寸：

Index_A.shape

输出为：

(4,)

+ 个数：

Index_A.size

输出为：

+ 值：

Index_A.values

输出为：

array(['A', 'B', 'C', 'D'], dtype=object)

索引操作

获取索引index；

df.index

访问当前数据的索引；
指定索引

df.index = ['x', 'y']

重新设置索引

df.reindex(list('abcde'))

指定某一列作为索引

df.set_index('column_name', drop=False)

返回索引的唯一值

df.set_index('column_name').index.unique()

特殊索引类型

NumericIndex，数值索引；
浮点数索引：

pd.Float64Index([1, 2, 3, 4])

输出为：

[1.0, 2.0, 3.0, 4.0]

整数；Int64Index
无符号整数；UInt64Index
等差序列；

pd.RangeIndex(start=1,stop=8,step=2)

CategoricalIndex，范围索引；
约束可选值的范围，超过范围的值强制变为NaN；

df.index = pd.CategoricalIndex(list('ABCD'), categories=['A', 'B', 'C'])

则D的位置显示NaN
* IntervalIndex，区间索引；
– 索引的值为一个区间，通过interval_range函数创建；

df.index = pd.interval_range(start=0, end=4)

此时索引的形式：

(0, 1]
(1, 2]
&#x2026;&#x2026;

DatetimeIndex，时间索引；
PeriodIndex
和DatetimeIndex类似，值为日期和时间的格式化结果
TimedeltaIndex；
将时间间隔转换为时间戳；

多层索引（复合索引）

当多个单层的索引结合在一起时，就形成了多层索引；
适用于多种分类标准的场景，极大增强了数据处理的灵活性；

设置方式

使用set_index()函数；
举例：

df_1 = pd.DataFrame({"a":range(4), "b":range(4, 0, -1), "c":['one', 'two', 'one', 'two'], "d":list("asdf")})
df_2 = df_1.set_index(["c", "d"])
print(df_2)

输出结果为：

       a  b
c   d
one a  0  4
two s  1  3
one d  2  2
two f  3  1

可以使用数组、元组、DataFrame创建；
使用from_product函数创建；

多层索引操作

替换索引层次；

df_1.swaplevel()

取值时，从外层向内层逐层取值，有时需要交换次序才能取值；
取出特定位置值：

df_1.loc["one"].loc["a"]

区别于dataframe，在series中直接在方括号中写索引即可取值；

Original: https://blog.csdn.net/weixin_47844457/article/details/124655731
Author: 世澈
Title: pandas中的索引和多层索引

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/674590/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

目标检测算法——YOLOv5/YOLOv7改进之结合RepVGG（速度飙升）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月28日
0072
【环境配置】在Vscode终端中使用Anaconda3中配置的环境

【环境配置】在Vscode终端中使用Anaconda3中配置的环境 0 前景提要 1 安装Python插件 2 选择anconda中的环境 3 运行py文件 4 参考文献 0 前景…

人工智能 2023年5月23日
0061
网络层——IP协议

网络层网络层概述网络层主要考虑数据传输的路上问题，在复杂的网络环境中确定一个合适的路径。网络层设计要尽量简单，向上层只提供简单灵活的、无连接的、不保证可靠性的数据报服务。网络层…

人工智能 2023年6月16日
0081
Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!

问题描述：这类问题属于tensor关于内存的问题，就是说进行运算的tensor放在了不同的设备上。注意，也有其他的错误表达： Input type (torch.FloatT…

人工智能 2023年7月25日
0091
【图像修复】论文阅读笔记 —– 《Image inpainting based on deep learning: A review》

文章目录 * – 原文下载地址 – 概述 – 单阶段修复 – + 单结果修复 + 多元修复方法 – 渐进图像修复 &#8…

人工智能 2023年6月24日
0085
Pytorch框架训练时的数据预处理、数据集以及导入、加载数据

前言目前刚刚接触深度学习方向，也在学习pytorch框架。本文是我在尝试相关网络的pytorch框架时遇到的一些问题以及认为有必要总结一下的内容。此内容主要参考了以下博客：ht…

人工智能 2023年6月16日
0071
npm包开发（whale-makelink）

whale-makelink是一个npm工具，是强业务的工具，可以将当前工程目录下的项目文件夹，在README中生成项目的链接地址。Demo。一、npm init 使用npm i…

人工智能 2023年6月4日
0077
3.3 柔顺控制代码实现

本文隶属于工程机械臂末端柔顺控制（Ros+Gazebo仿真实现） 0 前言之前写了一个UR5的运动学库，参考3.2 写一个UR机器人运动学库，发现该运动学库需要补充一部分内容，主…

人工智能 2023年6月16日
0072
loc和iloc用法辨析

在使用pandas对DataFrame对象进行列和行的选取的时候，经常会使用这样两种方法，他们分别是loc[]和iloc[]。首先，说明它们的具体用法： df.loc[] 只能使…

人工智能 2023年7月7日
0075
OpenCV.高斯模糊

高斯模糊均值模糊系 kernal系数均相等情况下，实际上还存在着在空间上由于相对位置不同而引起 kernal中每个系数有不同的权重的模糊，称之为高斯模糊。高斯模糊的每个系数的权重…

人工智能 2023年7月20日
0052
Python监督学习之分类算法的概述

当然，我可以帮你写一个 _Python_深度学习分类的算法。首先，我们需要导入必要的库，比如TensorFlow和Keras。然后，我们可以使用Keras提供的Sequential…

人工智能 2023年7月3日
0088
如何处理不同大小的输入数据

问题背景处理不同大小的输入数据是在数据分析和机器学习任务中常常遇到的问题。通常情况下，输入数据的大小会对算法的性能和效果产生影响。因此，我们需要选择适当的处理方法来处理不同大小的…

人工智能 2023年12月31日
0034
年末巨制：知识图谱嵌入方法研究总结

泽宇对自己的研究方向也就是知识图谱嵌入（KG Embedding）技术进行了总结，并制作了一套slides，力求让大家只看slides就可以理解并掌握知识图谱嵌入的相关知识和最新研…

人工智能 2023年6月1日
00103
设置jupyter notebook文件保存位置

默认位置在安装完jupyter notebook后，新建文件一般会默认存储在C盘某个位置，此时可以通过os模块来查看新建的文件保存路径，具体如下:首先新建一个.ipynb文件，然…

人工智能 2023年7月6日
0087
3D Object Detection经典论文整理【分类/下载/代码/笔记】

3D Object Detection经典论文整理【分类/下载/代码/笔记】 W.P. Xiao, Visual group, SHUSV 版本更新时间更新内容作者1V 1.020…

人工智能 2023年7月9日
0059
【摸鱼神器】基于python的BOSS识别系统

【摸鱼神器】基于python的BOSS识别系统前言一、整体设计二、调用摄像头三、人脸识别 * 1. 构建白名单库 2. 人脸匹配四、切换屏幕五、完整代码写在最后前言…

人工智能 2023年7月5日
0063

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

pandas中的索引和多层索引

索引分类

单层索引

索引操作

特殊索引类型

多层索引（复合索引）

设置方式

多层索引操作

大家都在看