【Pandas库】(5) 索引操作–增、删

2023年7月8日上午8:21 • 人工智能 • 阅读 105

各位同学好，今天我向大家介绍一下pandas库中的索引操作–增、删。

1. 增加

1.1 对series操作

方法一：在原有数据上增加，改变原有数据。

Series名[新标签名] = 新标签名对应的值

创建Series类型数据ps1，它的标签为’a’到’e’，对应的值为0到4，原标签不存在’g’，使用ps1[‘g’]=9，在原数组的最后追加一个标签’g’，以及它对应的值9。

import pandas as pd
创建一个Series类型数据，标签为'a'到'e'，对应的值为0到4
ps1 = pd.Series(range(5),index=["a","b","c","d","e"])
新标签'g'，对应的值为9
ps1["g"] = 9

方法二：增加数据并赋值给新变量，不影响原来的数据

新变量 = Series名.append(Series类型数据)

创建一个Series类型数据ps1，使用字典创建一个被追加的Series数据，append()函数不会对原数据修改，需要用一个新变量来接收这个追加后的结果。

import pandas as pd
创建一个Series类型数据
ps1 = pd.Series(range(5),index=["a","b","c","d","e"])
利用字典创建一个需要添加的Series类型数据
s1 = pd.Series({'f':999})
将s1追加到ps1后面
ps2 = ps1.append(s1)

1.2 对DataFrame操作

（1）对列操作

在最后一列后面追加一列：

变量名.[新标签] = 新标签对应的值

该方法会直接对原数据修改。如下，使用numpy创建一个1到9的一维数组，使用shape(行数,列数)函数变成3行3列的二维数组，再转换成DataFrame类型。pd1[4]=9，追加一列的新列标签名是4，这一列的值都是9。注意的是， 此处的列标签名4是int类型，而pd1中的’A’、’B’等都是str类型。

import pandas as pd
import numpy as np
在最后一列后面追加一列
pd1 = pd.DataFrame(np.arange(1,10).reshape(3,3),index=["a","b","c"],columns=["A","B","C"])
追加一列的列标签名是4，这一列的值都是9
pd1[4] = 9
追加一列的列标签名是4，这一列的值与列表对应
pd1[4] = [11,12,13]

在指定位置插入一列：

变量名.insert(下标索引位置前, 索引名, 列数据)

该方法会直接对原数据修改。首先下标索引位置是指位置索引标签，即0、1、2等。 插入的索引名和值是插在自己指定的下标位置索引前面一列。如下，我指定位置索引是0，即我想在第1列前面插入一列。我定义的插入的一列的列索引名是’E’。

import pandas as pd
import numpy as np
在指定位置插入一列
pd1 = pd.DataFrame(np.arange(1,10).reshape(3,3),index=["a","b","c"],columns=["A","B","C"])
插入一列的列位置索引号是0，在0前插入标签E
pd1.insert(0,"E",[100,100,100])

（2）对行操作

在最后一行的后面追加一行，方法一：

变量名.loc[标签名] = 行数据

利用 标签索引loc操作，涉及高级索引，后续章节会详述。 该方法会直接对原数据修改。loc指定行，在原数据最后一行后面，新增行标签’k’，及其对应的行数据。

import pandas as pd
在最后一行追加一行
pd1 = pd.DataFrame(np.arange(1,10).reshape(3,3),index=["a","b","c"],columns=["A","B","C"])
pd1.loc["k"] = [77,88,99]

在最后一行的后面追加一行，方法二：

新变量 = 变量名.append(字典, ignore_index = True)

该方法不会直接对原数据修改，需使用新变量接收。如下，我有一行数据想追加到DataFrame后面，但是直接追加的话，字典的key和dataframe的列标签名不对应，无法直接追加，此时使参数 ignore_index = True，使字典的key和dataframe的列标签自动匹配进行追加。

import pandas as pd
import numpy as np
在最后一行追加一行
pd1 = pd.DataFrame(np.arange(1,10).reshape(3,3),index=["a","b","c"],columns=["A","B","C"])
创建一个字典，字典的key和pd1的列标签不对应，需要调整位置
row = {"B":0,"A":6,"C":7}
使字典的key和列标签自动匹配进行追加
pd2 = pd1.append(row,ignore_index=True)

2. 删除

2.1 对Series操作

（1）在原始数据上删除：

del Series名[索引名]

删除索引名所对应的一行数据

import pandas as pd
删除一行数据
ps1 = pd.Series(range(5),index=["a","b","c","d","e"])
del ps1['c']  #删除c所在的一行

（2）不影响原始数据的删除：

新变量 = series名.drop(索引名1, 索引名2)

需要一个新变量来接收结果。可以删除多行，自行输入需要删除的行索引名。

import pandas as pd
ps1 = pd.Series(range(5),index=["a","b","c","d","e"])  #创建一个series类型
删除'a'所在的一行
ps2 = ps1.drop('a')

2.2 对DataFrame操作

（1）删除一行：

新变量 = 变量名.drop(行索引名)

（2）删除多行

新变量 = 变量名.drop([行索引名1, 行索引名2])

import pandas as pd
import numpy as np
pd1 = pd.DataFrame(np.arange(1,26).reshape(5,5),index=["a","b","c","d","e"],columns=["A","B","C","D","E"])
删除一行
pd_d1 = pd1.drop('a')
删除多行
pd_d2 = pd1.drop(['a','c'])

（3）删除一列：

新变量 = 变量名.drop(索引名, axis = 1)

新变量 = 变量名.drop(索引名, axis = ‘columns’)

（4）删除多列：

新变量 = 变量名.drop([索引名1,索引名2], axis = 1)

新变量 = 变量名.drop( [索引名1,索引名2] , axis = ‘columns’)

该方法需要有变量接收返回值。对列操作需要指定轴axis，axis=1代表列方向，axis=0代表行方向。

import pandas as pd
import numpy as np
pd1 = pd.DataFrame(np.arange(1,16).reshape(3,5),index=["a","b","c"],columns=["A","B","C","D","E"])
删除一行
pd2 = pd1.drop("A",axis=1)
删除多行
pd3 = pd1.drop(["A","C"],axis='columns')

（5）inplace属性：

变量名.drop(行索引名, inplace=True)

可直接在原数据上修改，不需要新变量来接收返回结果。

import pandas as pd
import numpy as np
pd1 = pd.DataFrame(np.arange(1,13).reshape(4,3),index=["a","b","c","d"],columns=["A","B","C"])
删除一行
pd1.drop("a",inplace=True)

Original: https://blog.csdn.net/dgvv4/article/details/121308419
Author: 立Sir
Title: 【Pandas库】(5) 索引操作–增、删

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/678113/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

封装好的散点图拟合八大函数回归模型(逆、幂函、对数、S、复合、生长、指数、线性函数，)

一.知识给定一些散点，拟合函数去分析其自变量和因变量变动关系，这时候可以选择多种函数去进行拟合例如excel里面会有添加趋势线这种工具，里面可以选择不同的工具，spss里面有不…

人工智能 2023年6月17日
0054
pandas进行数据处理

pandas读取多列选择表格中的’w’、’z’列 data[[‘w’,’z’]] …

人工智能 2023年7月7日
00106
【python技能树】python编码规范

想要写好python代码，必须了解python相关编码规范，有了这个的加持，编写的代码不仅可以实现相应的功能，而且简单易读，逻辑清晰。本节技能树主要分享相应的python编码规范，…

人工智能 2023年7月4日
0092
UE4如何接入科大讯飞的语音识别

本文用的是UE4 4.27测试安卓版测试链接：链接：https://pan.baidu.com/s/1CsdJecfyMTdxNd6XfSECQQ 提取码：m122B站视频连接：…

人工智能 2023年5月27日
0087
微生物多样性数据分析（16S）

微生物多样性数据分析（16S） OTU(operational taxonomic units) 是在系统发生学研究或群体遗传学研究中，为了便于进行分析，人为给某一个分类单元（品系…

人工智能 2023年7月15日
00129
CVF2020邻域自适应/语义分割：FDA: Fourier Domain Adaptation for Semantic SegmentationFDA：用于语义分割的傅立叶域自适应算法

邻域自适应/语义分割：FDA: Fourier Domain Adaptation for Semantic Segmentation FDA：用于语义分割的傅立叶域自适应算法 0…

人工智能 2023年7月13日
0061
OpenCV图像处理学习十六，解析图像卷积运算原理并应用Sobel算子，Scharr算子和拉普拉斯算子（Laplance）的应用

一.卷积核的概念卷积核，通常也叫算子。用一个设定数值模板去处理一张输入图片，进行卷积运算。目的是使目标与目标之间的差距变得更大。卷积在数字图像处理中最常见的应用为锐化和边缘提取。…

人工智能 2023年7月19日
0079
数据分析-pandas（dataframe）

DataFrame选取列 data={‘Name’:[‘关羽’,’刘备’,’张飞’,’曹操’],’Age’:[28,34,29,42]} index=["rank1&qu…

人工智能 2023年7月7日
0055
机器学习图像特征提取—SIFT特征提取原理及代码实现

1 SIFT简介 2 SIFT原理及特点 2.1 SIFT算法特点 2.2 SIFT特征检测 3 SIFT代码实现 SIFT，即尺度不变特征变换（Scale-invariant f…

人工智能 2023年6月18日
0070
标签、画像设计与模型落地

标签的本质就是对实体某个维度特征的描述。用户标签就是对用户某个维度特征的描述，例如：对用户生命周期的标签（生命周期主题）：”参与这个活动的老用户和新用户各有多少&#…

人工智能 2023年7月17日
0072
全面解析Kmeans聚类算法（Python）

Clustering (聚类) 是常见的unsupervised learning (无监督学习)方法，简单地说就是把相似的数据样本分到一组（簇），聚类的过程. 我们并不清楚某一类…

人工智能 2023年5月31日
00146
在有监督学习算法中，有哪些常用的分类算法

问题背景在机器学习领域中，监督学习是一种常见的学习方式。其基本思想是从已知的数据集中学习一个函数，该函数能够将输入数据映射到预定的输出。在监督学习问题中，我们需要将输入数据分为不…

人工智能 2024年1月2日
0041
QT添加OpenCV库

Qtcreator Qt5.12.1 Windows10 64位系统 cmake3.13.2 opencv3.4.16 下载地址QT: http://download.qt.io/…

人工智能 2023年7月19日
0052
【问题解决】训练和验证准确率很高，但测试准确率很低

前情提要：采用ResNet50预训练模型训练自己的图像分类模型。训练和验证阶段准确率很高，但随机输入一张图片时，大多数情况下依旧预测得不准确。 (于是开始搜索各种”验…

人工智能 2023年6月15日
0089
Graph Contrastive Clustering：图对比聚类

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月2日
0082
2020港中文PPG代码复现细节: CODE-SWITCHED SPEECH SYNTHESIS USING BILINGUAL PHONETIC POSTERIORGRAM

说明具体有三个PPG-TTS的版本: 港中文的论文模型细节我实现的细节(sch, lh, zhaoxt) 阿里达摩院2020InterSpeech的结构细节目的是: 达到论文…

人工智能 2023年5月27日
0089

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31