pandas入门-层次化索引

2023年8月22日下午2:15 • Python • 阅读 51

本文是对pandas的层次化索引的一个回顾性总结。

层次化索引（hierarchical indexing）它使你能在一个轴上拥有多个（两个以上）索引级别。抽象点说，它使你能以低维度形式处理高维度数据。
例子

data = Series(np.random.randn(10),  index=[['a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'd', 'd'], [1, 2, 3, 1, 2, 3, 1, 2, 2, 3]]) # 这里面即有两级
print(data)
print(data.index) # 可以看到为multi.index有两级，levels是外层的，labels是里层的

a 1 0.274992
2 0.228913
3 1.352917
b 1 0.886429
2 -2.001637
3 -0.371843
c 1 1.669025
2 -0.438570
d 2 -0.539741
3 0.476985
dtype: float64
MultiIndex(levels=[[u’a’, u’b’, u’c’, u’d’], [1, 2, 3]],
labels=[[0, 0, 0, 1, 1, 1, 2, 2, 3, 3], [0, 1, 2, 0, 1, 2, 0, 1, 1, 2]])
注意 :data[:,2] # 第一个值为第一级索引(此为:表示全部），第二个表示第二级索引(此为表示索引值都为2的)，而并不是值列2
输出
a -1.860761
b -1.265934
c 0.332883
d -2.359419
dtype: float64

层次化索引在数据重塑和基于分组的操作（如透视表生成）中扮演着重要的角色。例如，可以通过unstack方法将这段数据重新安排到一个DataFrame中：例子
print(data.unstack()) # 通过unstack将上面含有多级索引的Series data 转换成一个DataFrame中去。
输出
1 2 3
a -1.541996 -0.970736 -1.307030
b 0.286350 0.377984 -0.753887
c 0.331286 1.349742 NaN
d NaN 0.069877 0.246674

unstack的逆运算是stack：
例子
data.unstack().stack() #stack方法将一个DataFrame转换为一个多级索引的Series,为unstack的逆运算
输出
a 1 0.246674
2 -0.011862
3 1.004812
b 1 1.327195
2 -0.919262
3 -1.549106
c 1 0.022185
2 0.758363
d 2 -0.660524
3 0.862580
dtype: float64

这个参见
https://wizardforcel.gitbooks.io/pyda-2e/content/8.html
主要是在里面指定 level的值
如frame.sum(level=’key2′)

参考与鸣谢：

《利用python进行数据分析》

https://wizardforcel.gitbooks.io/pyda-2e/content/8.html

Original: https://blog.csdn.net/wangwangstone/article/details/117459933
Author: 旺仔的算法coding笔记
Title: pandas入门-层次化索引

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/756715/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Flask03_路由传参

encoding=utf-8“””1、@app.route(“/路由匹配/”)：代表资源在服务器上的位置（1）路由：Fl…

Python 2023年8月15日
0039
如何用【Python】写了一个水果忍者小游戏，玩过之后爱不释手

Original: https://www.cnblogs.com/123456feng/p/16140011.htmlAuthor: 蚂蚁ailingTitle: 如何用【Pyt…

Python 2023年5月24日
00121
Python可变与不可变数据、深拷贝与浅拷贝

当一个数据的值发生变化，如果它的内存地址没有发生变化，就说明这是一个可变数据。反之就是一个不可变数据。也就是说，不可变数据的值进行修改，其在内存上的变化就是重新开辟一个新的内存空间…

Python 2023年5月24日
0061
机器学习——果蔬分类

一、选题的背景为了实现对水果和蔬菜的分类识别，收集了香蕉、苹果、梨、葡萄、橙子、猕猴桃、西瓜、石榴、菠萝、芒果、黄瓜、胡萝卜、辣椒、洋葱、马铃薯、柠檬、番茄、萝卜、甜菜根、卷心菜…

Python 2023年10月30日
0040
Python-Django 项目模块-年级模块开发（七）

Python-django 自定义模块开发-列表展示第四章 Django 自定义模块-年级模块开发过程前言这一系列文章是通过一个简单的学校项目进行演示的，项目中遇到的问题将一…

Python 2023年5月25日
0062
两本让你在游戏中就可以学会Python的书籍

都说学编程是一个无聊且漫长艰辛的过程，很多小伙伴学着学着就放弃了，实在枯燥无味还不易懂。现在很多年轻的同学无论是手游还是端游都会玩一点吧。还在整天打游戏吗？？有时间不如去学一下游戏…

Python 2023年9月21日
0048
Pytest测试框架（三）：pytest fixture 用法

xUnit style 结构的 fixture用于初始化测试函数， pytest fixture是对传统的 xUnit 架构的setup/teardown功能的改进。pytest …

Python 2023年9月13日
0060
Python pytest-allure下载、安装、配置，pycharm首次配置运行

1、下载allure： 1、allure官网下载入口https://repo.maven.apache.org/maven2/io/qameta/allure/allure-com…

Python 2023年9月9日
0047
计算机网络子网划分

一、默认子网掩码 # A类网络的默认子网掩码为255.0.0.0B类网络的默认子网掩码为255.255.0.0C类网络的默认子网掩码为255.255.255.0 二、CIDR # …

Python 2023年6月12日
0086
python Numpy 的基础用法以及 matplotlib 基础图形绘制

python Numpy 的基础用法以及 matplotlib 基础图形绘制 1. 环境搭建 1.1 Anaconda anaconda 集成了数据分析，科学计算相关的所有常用…

Python 2023年8月31日
0078
几亿人都在玩的谷歌小恐龙游戏，全世界最高分是 99999？你呢？

前言 “越努力越幸运鸭💦💦，记得每天进步一点点哦！” ——Python是世界上最好的语言 Everybody 大家好~（也不清楚我的开头的单词写错没，懒.j…

Python 2023年9月19日
0057
CSDN官方猿如意工具体验

2022年注定是不平凡的一年，2022再见，2023你好！2023愿我们发财，被爱，一路好运常在！愿所念之人平安喜乐，所想之事顺心如意，岁岁常欢喜，万事皆胜意！猿如意工具是CSD…

Python 2023年11月4日
0037
一个有趣的nginx HTTP 400响应问题分析

对于query参数带空格&…

Python 2023年10月13日
0063
机器学习入门实战加州房价预测

目录 1 快速搭建运行环境 2 快速构建项目 * 2.1 导入训练集 2.2 安装函数库 – 2.2.1 安装numpy 2.2.2 安装pandas 2.3 构建特征…

Python 2023年9月30日
0051
matplotlib之pyplot模块——绘制一组有限长度的垂直/水平线（vlines/hlines）

概述 vlines函数作用是根据 x轴的位置绘制一组可设置 y轴方向起始值和终止值的垂直线。 hines函数作用与 vlines函数类似，根据 y轴的位置绘制一组可设置 x轴方向起…

Python 2023年9月6日
0073
对python的理解

python是一种解释性语言，python解释器主流版本由c语言编写；python 比较注重格式，包丰富，效率方面低于java，是一种高级语言；python功能丰富，轮子多，不用自…

Python 2023年9月20日
0044

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pandas入门-层次化索引

大家都在看