pandas3 DataFrame数据的查询编辑

2023年8月18日下午6:21 • Python • 阅读 44

3.DataFrame数据的查询和编辑

通过列索引标签或者属性的方式可以单独获取DataFrame的列数据，返回数据类型为Series。 在选取列时不能使用切片的方式，超过一个列名用 df[['列名1','列名2']]


import pandas as pd
import numpy as np
data = {
    'name':['张三','李四','王麻子'],
    'age':[21,19,23],
    'address':['兰州','上海','北京']
}
df = pd.DataFrame(data)
print(df)
w1 = df['name']
print("以列名取一列数据:\n", w1)
w2 = df[['name','age']]
print("以列名取两份数据：\n", w2)

name  age address
0   张三   21      兰州
1   李四   19      上海
2  王麻子   23      北京
以列名取一列数据:
 0     张三
1     李四
2    王麻子
Name: name, dtype: object
以列名取两份数据：
   name  age
0   张三   21
1   李四   19
2  王麻子   23

通过行索引或者行索引位置切片形式获取行数据【从0开始的，左闭右开】。 DataFrame提供的head【开头开始】和tail【结尾】可以取连续多行数据，sample可以随机抽取并显示数据


print('显示前两行：\n', df[:2])
print('显示2行：\n', df[1:2])

print(df.head())
print(df.head(1))

print(df.tail())
print(df.tail(1))

print(df.sample(2))
显示前两行：
   name  age address
0   张三   21      兰州
1   李四   19      上海
显示2行：
   name  age address
1   李四   19      上海
  name  age address
0   张三   21      兰州
1   李四   19      上海
2  王麻子   23      北京
  name  age address
0   张三   21      兰州
  name  age address
0   张三   21      兰州
1   李四   19      上海
2  王麻子   23      北京
  name  age address
2  王麻子   23      北京
  name  age address
2  王麻子   23      北京
1   李四   19      上海

切片选取行限制比较大，取单独的几行数据可以采用Pandas提供的iloc和loc方法实现。

用法：DataFrame.loc(行索引位置, 列索引位置)

DataFrame.loc(行索引名称或条件, 列索引名称)


data = {
    'name':['张飞', '孙尚香', '韩信', '貂蝉', '马超'],
    'location':['游走', '下路', '打野', '中单', '上单'],
    'dynasty':['蜀', '蜀', '战国', '汉', '蜀'],
    'year':[1999, 2000, 2020, 2050, 3030]
}
df1 = pd.DataFrame(data, columns=['name','location','dynasty','address','year'],index=['a','b','c','d','e'])
df2 = df1.set_index('dynasty')
print(df2)
print("取name和year两列的数据:\n",df2.loc[:,['name','year']])
print("取汉，战国行中name，year的数据：\n",df2.loc[['汉','战国'],['name','year']])
        name location address  year
dynasty
蜀         张飞       游走     NaN  1999
蜀        孙尚香       下路     NaN  2000
战国        韩信       打野     NaN  2020
汉         貂蝉       中单     NaN  2050
蜀         马超       上单     NaN  3030
取name和year两列的数据:
         name  year
dynasty
蜀         张飞  1999
蜀        孙尚香  2000
战国        韩信  2020
汉         貂蝉  2050
蜀         马超  3030
取汉，战国行中name，year的数据：
         name  year
dynasty
汉         貂蝉  2050
战国        韩信  2020


print("显示前两列：\n", df2.iloc[:, 2])
print("显示第1和第3行的第2列：\n", df2.iloc[[1,3],[0]])
显示前两列：
 dynasty
蜀     1999
蜀     2000
战国    2020
汉     2050
蜀     3030
Name: year, dtype: int64
显示第1和第3行的第二列：
         name
dynasty
蜀        孙尚香
汉         貂蝉

也可以使用ix方法实现行和列的选择，同时支持索引标签和索引位置取值。

用选择符不等于(!=)、与(&)、或(|)

df3 = df2[df2['year'] == 3030]
print(df3,type(df3))
df2['name']=='孙尚香'
        name location  year
dynasty
蜀         马超       上单  3030 <class 'pandas.core.frame.DataFrame'>

dynasty
蜀     False
蜀      True
战国    False
汉     False
蜀     False
Name: name, dtype: bool

增加一行通过append方法传入字典结构数据即可，增加列时为增加的列赋值即可创建一个新的列，具体给值要对应，不然会报错


df1['C'] = 10
df1['age'] = [24,33,19,40,80]

data1 = {
    'name':'李白',
    'location':'打野',
    'dynasty':'唐',
    'year':'1909'
}
df1.append(data1,ignore_index=True)
  name location dynasty  year   C  age
0   张飞       游走       蜀  1999  10   24
1  孙尚香       下路       蜀  2000  10   33
2   韩信       打野      战国  2020  10   19
3   貂蝉       中单       汉  2050  10   40
4   马超       上单       蜀  3030  10   80

name    location    dynasty year    C   age
0   张飞  游走  蜀   1999    10.0    24.0
1   孙尚香 下路  蜀   2000    10.0    33.0
2   韩信  打野  战国  2020    10.0    19.0
3   貂蝉  中单  汉   2050    10.0    40.0
4   马超  上单  蜀   3030    10.0    80.0
5   李白  打野  唐   1909    NaN

删除数据直接用drop方法，行列数据通过axis参数设置默认为0删除行，1删除列。默认数据删除不修改原数据，如果在原数据上删除加入参数inplace=True即可。


df1.drop('C',axis=1)
print(df1)
  name location dynasty  year   C  age
0   张飞       游走       蜀  1999  10   24
1  孙尚香       下路       蜀  2000  10   33
2   韩信       打野      战国  2020  10   19
3   貂蝉       中单       汉  2050  10   40
4   马超       上单       蜀  3030  10   80

df1.drop('C',axis=1,inplace=True)
print(df1)

  name location dynasty  year  age
0   张飞       游走       蜀  1999   24
1  孙尚香       下路       蜀  2000   33
2   韩信       打野      战国  2020   19
3   貂蝉       中单       汉  2050   40
4   马超       上单       蜀  3030   80

对选择的数据进行赋值就可以了。修改数据是对DataFrame值的修改，无法撤销。如新列赋值。

Original: https://blog.csdn.net/qq_43636709/article/details/115819887
Author: bigdata7
Title: pandas3 DataFrame数据的查询编辑

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/753283/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

如何在 Matplotlib 中绘制垂直线

介绍 Matplotlib是Python中使用最广泛的数据可视化库之一。Matplotlib的受欢迎程度大部分来自其自定义选项。您可以调整其对象层次结构中的几乎任何元素。在本教程…

Python 2023年8月28日
0058
【Python – 基础】基础是一切升华的根本

以下仅是对相关知识的简要介绍，更深入的了解和研究，敬请参考资料或留言。 [En] The following is only a brief description of the …

Python 2023年5月24日
0055
解决 net core 3.x 跨域问题

跨域：指的是浏览器不能执行其他网站的脚本。它是由浏览器的同源策略造成的，是浏览器对javascript施加的安全限制。以下几种情况是造成跨域的原因： 1. 域名相同，端口不同域…

Python 2023年10月15日
0058
mac终端 python scrapy爬虫 zsh: no matches found

在学习Python爬虫时，进行到scrapy板块，执行genspider命令输入scrapy genspider tongcheng https://bj.58.com/sou/…

Python 2023年10月1日
0032
python pandas 分类汇总用法_Python pandas用法最全整理

1、首先导入pandas库，一般都会用到numpy库，所以我们先导入备用： import numpy as npimport pandas as pd 2、导入CSV或者xlsx文…

Python 2023年8月16日
0032
问题解决：Jupyter Notebook中找不到torch、matplotlib模块

PyTorch和Jupyter Notebook使用中的一些问题和解决方法记录文章目录 * – 问题1. No module named ‘torch&#…

Python 2023年9月3日
0020
源码级深度理解 Java SPI

作者：vivo 互联网服务器团队- Zhang Peng SPI 是一种用于动态加载服务的机制。它的核心思想就是解耦，属于典型的微内核架构模式。SPI 在 Java 世界应用非常广…

Python 2023年10月15日
0035
hw-2 李宏毅2022年作业2 phoneme识别单strong-hmm详细解释。

目录系列文章前言：项目：一：数据：二：模型三：训练和评估四：main函数和训练过程五后处理。系列文章 2022李宏毅作业hw1—新冠阳性人员数量预…

Python 2023年8月27日
0048
Android10 dex2oat实践

一、dex2oat 详解以下是官方对于dex2oat的解释： ART 使用预先 (AOT) 编译，并且从 Android 7.0（代号 Nougat，简称 N）开始结合使用 AO…

Python 2023年10月16日
00122
Python学习系列之一: python相关环境的搭建

前言学习python和使用已经一年多了，这段时间抽空整理了一下以前的笔记，方便日后查阅。 Python介绍 Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚…

Python 2023年5月25日
00106
阿里云部署flask项目（CentOS7使用nginx+gunicorn）（2）：xshell连接远程服务器和pycharm实时更新云端项目代码

文章目录前言一、xshell连接服务器二、pycharm连接云端项目 * 下一节将介绍nginx的安装和使用。前言为了能够更方便的访问服务器，在这里使用xshell工具进…

Python 2023年8月13日
0042
Django两表案例

django-admin startproject 项目名 python manage.py startapp 应用名 INSTALLED_APPS = [ ‘django.con…

Python 2023年8月4日
0045
NumPy是什么

NumPy是什么 NumPy 的全称是” Numeric Python”，它是 Python 的第三方扩展包，主要用来计算、处理一维或多维数组。在数组算术…

Python 2023年8月25日
0047
Python-WebSpider

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

Python 2023年6月9日
0035
数字货币稳定币对网格做市策略

更多精彩内容，欢迎关注公众号：数量技术宅，也可添加技术宅个人微信号：sljsz01，与我交流。什么是稳定币对稳定币是数字货币中特有的一类资产，不同于BTC、ETH等币值大幅…

Python 2023年6月3日
0070
Vue+Django 旅游网项目首页前端实现

Vue+Django 旅游网项目首页前端实现结构公共的样式 src/assets/common.less 公共的js（工具函数、接口地址、配置文件）接口地址配置 src/u…

Python 2023年8月5日
0058

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

pandas3 DataFrame数据的查询编辑

3.DataFrame数据的查询和编辑

大家都在看