Pandas-数据结构-DataFrame（二）：设置索引【①创建DataFrame时添加行、列索引；②修改行/列索引值；③重设新下标索引；④以某列值设置为新的索引】

2023年7月9日上午5:35 • 人工智能 • 阅读 76

DataFrame索引

修改的时候,需要进行全局修改
对象.reset_index()
对象.set_index(keys)

创建学生成绩表


score = np.random.randint(40, 100, (10, 5))

array([[92, 55, 78, 50, 50],
       [71, 76, 50, 48, 96],
       [45, 84, 78, 51, 68],
       [81, 91, 56, 54, 76],
       [86, 66, 77, 67, 95],
       [46, 86, 56, 61, 99],
       [46, 95, 44, 46, 56],
       [80, 50, 45, 65, 57],
       [41, 93, 90, 41, 97],
       [65, 83, 57, 57, 40]])

但是这样的数据形式很难看到存储的是什么的样的数据，可读性比较差！！

问题：如何让数据更有意义的显示？


score_df = pd.DataFrame(score)

Pandas-数据结构-DataFrame（二）：设置索引【①创建DataFrame时添加行、列索引；②修改行/列索引值；③重设新下标索引；④以某列值设置为新的索引】

给分数数据增加行列索引,显示效果更佳

效果：

一、创建DataFrame时添加行、列索引

import numpy as np
import pandas as pd

score = np.random.randint(40, 100, (10, 5))
print("score = \n", score)
print("-" * 100)

subjects = ["语文", "数学", "英语", "政治", "体育"]

stu = ['同学' + str(i) for i in range(score.shape[0])]

data = pd.DataFrame(score, columns=subjects, index=stu)

print("data = \n", data)

打印结果：

score =
 [[56 73 50 49 77]
 [52 61 71 90 67]
 [78 90 63 70 50]
 [83 42 74 77 71]
 [86 63 97 77 72]
 [80 40 42 62 75]
 [86 95 62 74 89]
 [55 97 49 61 78]
 [68 45 71 74 66]
 [59 49 47 95 68]]
data =
      语文  数学  英语  政治  体育
同学0  74  90  98  59  98
同学1  88  67  57  42  55
同学2  98  90  84  47  96
同学3  62  71  66  42  59
同学4  92  40  46  84  53
同学5  66  46  86  79  80
同学6  93  76  91  66  49
同学7  93  99  82  88  63
同学8  45  58  85  49  50
同学9  60  72  53  76  62
data =
      语文  数学  英语  政治  体育
同学0  47  53  73  81  42
同学1  82  98  77  95  51
同学2  55  59  64  76  65
同学3  51  67  77  61  71
同学4  83  53  50  97  69
同学5  67  69  92  69  55
同学6  55  81  87  68  43
同学7  74  45  51  43  53
同学8  54  51  71  63  82
同学9  52  88  57  64  69
df1 =
        year  sale
month
1      2012    55
4      2014    40
7      2013    84
10     2014    31

Process finished with exit code 0

设置多个索引，以年和月份

注：通过刚才的设置，这样DataFrame就变成了一个具有MultiIndex的DataFrame。

Original: https://blog.csdn.net/u013250861/article/details/124028065
Author: u013250861
Title: Pandas-数据结构-DataFrame（二）：设置索引【①创建DataFrame时添加行、列索引；②修改行/列索引值；③重设新下标索引；④以某列值设置为新的索引】

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/680092/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

面了一个31岁的哥们，一看就背了很多面试题，一问三不知,还自认为很牛逼…

最近看了很多简历，很多候选人年限不小，但是做的都是一些非常传统的项目，想着也不能通过简历就直接否定一个人，何况现在大环境越来越难，大家找工作也不容易，于是就打算见一见。在沟通中…

人工智能 2023年7月3日
0075
WT588F34B语音芯片单曲更换语音功能的实现与应用

开发背景：产品需要改变的语音内容可以一直存在于生产端，但不能实现产品在使用终端替换语音，从而实现产品的迭代升级。 [En] The product needs to change…

人工智能 2023年5月27日
0096
大数据项目实战——基于某招聘网站进行数据采集及数据分析（一）

大数据项目实战第一章项目概述文章目录大数据项目实战第一章项目概述学习目标一、项目需求和目标二、预备知识三、项目架构设计及技术选取四、开发环境和开发工具介绍五…

人工智能 2023年7月14日
00145
线性回归的四个假设 The Four Assumptions of Linear Regression

线性回归是一种常用的统计方法，我们可以用它来理解两个变量 x 和 y 之间的关系。但是，在进行线性回归之前，首先要确保满足四个假设： 1.线性关系：自变量x和因变量y之间存在线性…

人工智能 2023年7月15日
0091
【入门向】k-means聚类函数详解（基于鸢尾花数据集）【MATLAB】

这是一个目录 k-means聚类函数 * 先放例程分段解析 – PART1——载入数据集 PART2——画出数据集分布图 PART3——kmeans对数据集聚类 PA…

人工智能 2023年5月31日
0095
文献翻译|Design of True Random Number Generator Based on Multi-stage Feedback Ring Oscillator（基于多级反馈环形振荡器的真随机数发生器设计）

基于多级反馈环形振荡器的真随机数发生器设计摘要真随机数生成器(trng)在加密系统中起着重要的作用。本文提出了一种在现场可编程门阵列(FPGA)上生成真随机数的新方法，该方法以…

人工智能 2023年6月6日
0084
Excel数据分析实战之开宗明义: Excel与数据分析实战

大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多…

人工智能 2023年7月14日
0042
K210学习笔记——语音识别

语音识别技术，也被称为自动语音识别Automatic Speech Recogntion(ASR)，是通过计算机自动将人类的语音内容转换为相应文字的技术。通俗来讲，语音识别就是机器…

人工智能 2023年5月27日
00118
Git代码仓库管理系统的配置方法之：Gitlab

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月28日
0077
R语言生成数据及其95%置信区间数据（或者其它区间）、使用geom_ribbon函数为ggplot2图像手动添加置信区间的阴影区域using geom_ribbon to create shaded

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月16日
0076
PID控制器的介绍

PID 控制算法介绍在工程实际中，应用最为广泛的调节器控制规律为比例、积分、微分控制，简称 PID 控制，又称 PID 调节。PID 控制器问世至今已有近 70 年历史，它以其结…

人工智能 2023年6月10日
0081
python 图片倾斜校正

前言进行图片校正是将拍照倾斜的图片恢复水平状态，大致思路为：用canny算子检测出图像中的边缘轮廓线；用霍夫线变换检测出图像中的所有直线；筛选出接近水平方向上的直线，求出他…

人工智能 2023年6月18日
0095
python练习题四

题目解析第四期来了，通过将一道一道题目的深度刨析，让我们一起培养我们的算法思维吧！💕💕💕预告，本例题包含对矩阵的螺旋输出操作、逆鞍点的寻找等… 文章目录 * &#821…

人工智能 2023年7月29日
0042
流批一体？实时数据处理场景化应用实例~

什么是数据实时处理？有哪些典型应用场景？实时数据处理的意义是？下文围绕实时数据应用的产品特性和场景，一一解答。 01 什么是实时数据处理以实时数据平台 flashflow 举例，…

人工智能 2023年6月19日
0078
研究性论文_基于层次聚类方法的流量异常检测

流量格式转换在网络中捕获的流量数据包的初始格式通常为pcap格式，内容表现形式为 16进制的数据为了将其转化为安全分析人员熟知的IP、端口等内容，需要将pcap格式转换成netf…

人工智能 2023年5月31日
0089
Pytorch中torch.repeat_interleave（）函数解析

一. torch.repeat_interleave（）函数解析 1.函数说明官网：torch.repeat_interleave()，函数说明如下图所示： ; 2. 函数原型 …

人工智能 2023年7月6日
0093

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pandas-数据结构-DataFrame（二）：设置索引【①创建DataFrame时添加行、列索引；②修改行/列索引值；③重设新下标索引；④以某列值设置为新的索引】

大家都在看