DataFrame数据的查询和编辑

2023年7月7日下午1:34 • 人工智能 • 阅读 87

（不少于4个代码案例，选取行，选取列，增加行，删除行）

查询【一般都是通过索引来操作的】

1. 选取列

通过列索引标签或者属性的方式可以单独获取 DataFrame 的列数据，返回数据类型为 Series 。在选取列时不能使用切片的方式，超过一个列名用 df[[‘ 列名 1′,’ 列名 2′]]

选取列
import pandas as pd
import numpy as np
data = {
    'name':[杨大润','李玉芳','马庆显'],
    'age':[21,19,23],
    'address':['兰州','上海','北京']
}
df = pd.DataFrame(data)
print(df)
w1 = df['name']
print("以列名取一列数据:\n", w1)
w2 = df[['name','age']]
print("以列名取两份数据：\n", w2)

2.选取行

通过行索引或者行索引位置切片形式获取行数据【从0 开始的，左闭右开】。 DataFrame 提供的 head 【开头开始】和 tail 【结尾】可以取连续多行数据， sample 可以随机抽取并显示数据

取行  从0开始的
import pandas as pd
data = {
    'name':['杨大润','李玉芳','马庆显'],
    'age':[21,19,23],
    'address':['贵州','上海','北京']
}
df = pd.DataFrame(data)
print(df)
print('显示前两行：\n', df[:2])
print('显示2行：\n', df[1:2])
head从第一行取，默认前五行
print(df.head())
print(df.head(1))
tail默认最后五行   可以带数字取最后的
print(df.tail())
print(df.tail(1))
sample随机抽取n行显示
print(df.sample(1))

3 .读取行和列

切片选取行限制比较大，取单独的几行数据可以采用Pandas提供的iloc 和loc 方法实现。

用法：DataFrame.loc(行索引位置,列索引位置)

DataFrame.loc(行索引名称或条件,列索引名称)

loc
import pandas as pd
import numpy as np
data = {
   'name':['杨将军（大润）', '李女将（玉芳）', '马（军师）庆显', '韦女将（思妍）', '徐大将（佳宇）'],
   'location':['游走', '下路', '打野', '中单', '上单'],
   'dynasty':['蜀', '蜀', '战国', '汉', '蜀'],
   'year':[1999, 2000, 2020, 2050, 3030]
}
df1 = pd.DataFrame(data, columns=['name','location','dynasty','address','year'],index=['a','b','c','d','e'])
df2 = df1.set_index('dynasty')
print(df2)
print("取name和year两列的数据:\n",df2.loc[:,['name','year']])
print("取汉，战国行中name，year的数据：\n",df2.loc[['汉','战国'],['name','year']])

4.增加数据

增加一行通过append 方法传入字典结构数据即可，增加列时为增加的列赋值即可创建一个新的列，具体给值要对应，不然会报错

#插入一行数据append
#加列并赋值
import pandas as pd
import numpy as np
data = {
    'name':['杨将军（大润）', '李女将（玉芳）', '马（军师）庆显', '韦女将（思妍）', '徐大将（佳宇）'],
    'location':['游走', '下路', '打野', '中单', '上单'],
    'dynasty':['蜀', '蜀', '战国', '汉', '蜀'],
    'year':[1999, 2000, 2020, 2050, 3030]
}
df1 = pd.DataFrame(data, columns=['name','location','dynasty','address','year'],index=['0','1','2','3','4'])

df1['C'] = 10
df1['age'] = [24,33,19,40,80]

data1 = {
    'name':'吴医师（宗蔚）',
    'location':'打野',
    'dynasty':'唐',
    'year':1909
}
df1.append(data1,ignore_index=True)

print(df1)
print(df1.append(data1,ignore_index=True))

5.删除行和列

删除数据直接用drop 方法，行列数据通过axis 参数设置默认为0 删除行，1 删除列。默认数据删除不修改原数据，如果在原数据上删除加入参数inplace=True 即可！

import numpy as np
import pandas as pd

df = pd.DataFrame(data=[['杨大润', '男', 22], ['李玉芳', '女', 18], ['韦思妍', '女', 18],
                        ['马庆显', '男', 23], ['徐佳宇', '女', 18], ['吴宗蔚', '女', 21]], index=[1, 2, 3, 4, 5, 6],
                  columns=['name', 'sex', 'age'])
测试数据。
print(df)

h=df.drop([1,3],axis = 0,inplace = False)         #删除index值为1和3的两行，
print(h)

l=df.drop(['name'],axis = 1,inplace = False)   #删除name列。
print(l)

Original: https://blog.csdn.net/qq_63756815/article/details/126984475
Author: 瑞雪兆丰年（润）
Title: DataFrame数据的查询和编辑

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/676354/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【转】自然语言系列学习之表示学习与知识获取（三）知识图谱

分布式表示可以非常好的建立跨领域跨对象的知识迁移。有非常多的工作是去学习不同语言的各种词汇在同一个空间里统一的表示，这种表示对构建跨语言的知识迁移或者进行机器翻译都是非常重要的。此…

人工智能 2023年6月10日
0075
第十五课.K均值算法

目录 K均值算法原理 K均值算法的改进：K-means++ numpy实现K-means K均值算法原理 K均值（K-means）算法属于无监督学习中的聚类算法；聚类是根据样本特征…

人工智能 2023年6月3日
00115
用Python来表白，把情书写进她的照片里

前言这不已经十一月了，22年马上就过完了，各位兄弟有对象了吗，现在就是缺钱还缺对象退一步来说，有心仪的人吗啊，如果有的话，看看这篇程序员的表白小妙招吧 ; 实现步骤想要实现…

人工智能 2023年7月19日
0079
python xarray 简单介绍

xr.Dataset：装入多个变量的信息，可以对每个变量进行定义不同的维度信息。主要包含以下三部分： xarray.Dataset(*data_vars=None*, *coor…

人工智能 2023年6月16日
00146
数字系统的信息表示

数字系统的信息表示 * – + 1、什么是信息 + 2、数字系统是如何表示一个连续值的信息 + 3、使用数字信号的优势 + 4、将模拟信号表示成数字信号形式过程 + 5…

人工智能 2023年5月27日
00104
图解机器学习算法(5) | 朴素贝叶斯算法详解（机器学习通关指南·完结）

作者：韩信子@ShowMeAI 教程地址：https://www.showmeai.tech/tutorials/34 本文地址：https://www.showmeai.tech…

人工智能 2023年6月15日
0050
【项目实战课】基于Pytorch的Pix2Pix黑白图片上色实战

欢迎大家来到我们的项目实战课，本期内容是《基于Pytorch的黑白图像上色实战》。所谓项目实战课，就是以简单的原理回顾+详细的项目实战的模式，针对具体的某一个主题，进行代码级的实战…

人工智能 2023年7月14日
0068
【第十七届智能车】智能车图像处理（5）-元素识别（斑马线、车库）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月25日
0076
（记录深度学习）关于解决torch not compiled with CUDA enabled报错问题

pov：电脑是暗影精灵3，显卡1050ti，跟着csdn大佬教程在conda上安装cuda和CUDNN以及pytorch，出现Torch not compiled with CUD…

人工智能 2023年7月20日
0085
训练集Loss收敛，但是测试集Loss震荡的厉害？

今天在调试模型的时候发现训练集上Loss已经收敛了，但是在验证集上Loss震荡的比较厉害，如下图所示：查阅网上各种博客后发现验证集Loss震荡的原因可能有如下：数据问题，比如…

人工智能 2023年6月16日
0069
Pytorch—猫狗分类实战

本案例使用 jupyter notebook 实现数据集来源 https://www.kaggle.com/biaiscience/dogs-vs-cats 查看数据集数据集共…

人工智能 2023年7月1日
0052
优化算法SGD与Adam

说来惭愧，一直在用的两个经典的优化器，几行代码就完成了参数更新，但是却一直没有深入的了解其中的原理。 improt torch … optimizer = torch.opti…

人工智能 2023年6月15日
0068
基于Tensorflow2的卷积神经网络MNIST手写数字识别

1. 导包 import numpy as np import tensorflow as tf import tensorflow.keras.datasets.mnist as…

人工智能 2023年7月1日
0073
pandas数据处理

pandas数据处理目录 pandas数据处理 * 1.处理丢失数据 2.处理空值操作 4.处理重复数据 5. 处理异常数据 – 6. 随机查看5条数据 1.处理丢失…

人工智能 2023年7月7日
0047
数字图像处理（2）—OPENCV–学习笔记（颜色，色域，控制条）

文章目录前言一、数字图像处理—–色彩空间？二、图形绘制，RGB等色域 1.颜色空间转化 2.mat 数据结构，ndarray,深浅拷贝 3.颜色通道分…

人工智能 2023年6月22日
0088
kmeans聚类分析结果怎么看_【Stata与机器学习】物以类聚-KMeans算法应用案例介绍…

古语有云：物以类聚，人以群分。 KMeans是无监督机器学习中的聚类算法中最简单的一种——基于特征对样本进行归为不同的类，很好地阐述了’物以类聚’这句话的精…

人工智能 2023年6月3日
0065

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

DataFrame数据的查询和编辑

大家都在看