Pandas：Series、DataFrame数据的loc、iloc、ix 查询 / 读取

2023年6月2日上午5:21 • 人工智能 • 阅读 67

一、DataFrame的数据查询 / 提取

1、对单列、多列进行访问读取

— 对单列数据的访问：DataFrame的单列数据为一个Series。根据DataFrame的定义可以知晓DataFrame 是一个带有标签的二维数组，每个标签相当每一列的列名；如：df.a df[‘a’]

— 对多列数据访问：访问DataFrame多列数据可以将多个列索引名称视为一个列表，df[[‘a’,’b’]]

2、对多行进行访问读取

（1）如果只是需要访问DataFrame某几行数据的实现方式则采用数组的选取方式， 使用”:”。

（2）head和tail也可以得到多行数据，但是用这两种方法得到的数据都是从开始或者末尾获取的连续数据；默认参数为访问5行，只要在方法后方的”()”中填入访问行数即可实现目标行数的查看。

3、查看访问DataFrame中的数据——loc,iloc方法介绍

（1）loc方法是针对DataFrame索引名称的切片方法，如果传入的不是索引名称，那么切片操作将无法执行；利用loc方法，能够实现所有单层索引切片操作。

loc方法使用方法： DataFrame.loc[ 行索引名称或条件 , 列索引名称 ] # 闭区间（含最后一个值）

（2）iloc和loc区别：是iloc接收的必须是行索引和列索引的位置。

iloc方法的使用方法： DataFrame.iloc[ 行索引位置 , 列索引位置 ] # 开区间（不含最后一个值）

（3）注意点：

— 使用loc方法和iloc实现多列切片，其原理的通俗解释就是将多列的列名或者位置作为一个列表或者数据传入。

— 使用loc，iloc方法可以取出DataFrame中的任意数据。

— loc内部还可以传入表达式，结果会返回满足表达式的所有值。

- loc更加灵活多变，代码的可读性更高，iloc的代码简洁，但可读性不高。具体在数据分析工作中使用哪一种方法，根据情况而定，大多数时候建议使用loc方法。

— 在loc使用的时候内部传入的行索引名称如果为一个区间，则前后均为闭区间；iloc方法使用时内部传入的行索引位置或列索引位置为区间时，则为前闭后开区间。

4、查看访问DataFrame中的数据——切片方法之ix

（1）ix方法更像是loc和iloc两种切片方法的融合。ix方法在使用时既可以接收索引名称也可以接收索引位置。

（2）其使用方法： DataFrame.ix[ 行索引的名称或位置或者条件, 列索引名称或位置 ]

（3）控制ix方法需要注意以下几点：

Ø 使用ix方法时，当索引名称和位置存在部分重叠时，ix默认优先识别名称。
Ø 尽量使用列索引名称，而非列索引位置，主要用来保证代码可读性。
Ø 使用列索引位置时，需要注解，同样保证代码可读性。
Ø 除此之外ix方法还有一个缺点，就是在面对数据量巨大的任务的时候，其效率会低于loc和iloc方法，所以在日常的数据分析工作中建议使用loc和iloc方法来执行切片操作。

代码1：

import pandas as pd

print("-------创建一维Series数据------------")
创建方式1：
s1=pd.Series([90,86,70],index=['leo','kate','john'])
print(s1)
创建方式2：
dict={'leo':90,'kate':86,'john':70}
s1=pd.Series(dict)
print(s1)

print("-----绝对位置查找----")
print(s1[0])

print("-----标签查找-----")
print(s1['kate'])

print("-----列表标签查找----")
print(s1[['john','kate']])

print("----条件表达式查找----")
print(s1[s1>80])

结果图：

Pandas：Series、DataFrame数据的loc、iloc、ix 查询 / 读取

代码2：

import pandas as pd

print("=========创建一组DataFrame数据---使用date_range创建时间索引=======")
date=pd.date_range('20100101',periods=6)
df=pd.DataFrame(np.random.randn(6,4),
                index=date,                columns=list('abcd'))

print(df.head())
print(df.index)    # 打印数据框的索引
print(df.values)   # 打印数据框内的元素值

print("---------读取单列、多列-------")
print(df.a)
print(df['a'])
print(df[['a','b']])     # 读取多列

print("------读取多行-----------")
print(df[0:4])
print(df.head(3))   # 打印前3行数据

print("------读取多行、多列-----------")
print(df.loc['2010-01-01':'2010-01-04',['a','b']])   # loc是闭区间，尾部包含
print(df.iloc[:4,[0,1]])                               # iloc是开区间，尾部不包含
print(df.ix[:4,['a','b']])                           # ix 是开区间，尾部不包含
print(df.loc[df.index<'20100105',['a','b']])      # loc 第一个参数可以用条件提取

结果图：

代码3：

import pandas as pd
创建DataFrame
df = pd.DataFrame([['Snow','M',22],['Tyrion','M',32],['Sansa','F',18],['Arya','F',14]],
                  columns=['name','gender','age'])
print(df)
print("----------提取多行、多列-----------")
print(df[['gender','age']])
print(df.loc[1:3,['gender','age']])   # loc是闭区间，尾部包含
print(df.iloc[1:3,[1,2]])              # iloc是开区间，尾部不包含
print(df.iloc[:,1:3])
读取第1行到第2行的数据
print(df[1:3])
print(df.iloc[1:3])

#读取第1行和第3行，第0列到第2列,不包括第二列
print(df.iloc[[1,3],0:2])

#读取倒数第3行到倒数第1行的数据，iloc不包含最后一行
print(df[-3:-1])
print(df.iloc[-3:-1])

结果图：

Original: https://www.cnblogs.com/wodexk/p/10316258.html
Author: 后来的后来123
Title: Pandas：Series、DataFrame数据的loc、iloc、ix 查询 / 读取

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/559851/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

模型评估（误差平方和(SSE The sum of squares due to error)）

1 误差平方和(SSE The sum of squares due to error)： ¶ 举例:(下图中数据-0.2, 0.4, -0.8, 1.3, -0.7, 均为真实值…

人工智能 2023年7月27日
0063
用卷积神经网络训练Cifar10数据集

目录 Cifar10数据集介绍卷积神经网络的搭建完整代码 Cifar10数据集介绍 Cifar10数据提供了5万张3232像素点的十分类彩色图片和标签，用于训练；提供了1万…

人工智能 2023年7月13日
0042
ssm框架之spring：xml配置再补充

前面聊了spring中配置XML注入bean，但是现在进行一些补充：创建bean的方式其实前面配置的xml中bean，但是对于对象bean其有两种方式：普通bean：配置文件…

人工智能 2023年6月2日
0085
pandas_数据处理分析基本

20210405 fancy_lee 1.pandas介绍 Python Data Analysis Library 或 pandas ，是基于NumPy 的一种工具，该工具是为了…

人工智能 2023年7月8日
0065
保姆级详细教程：Windows 安装 Visual Studio + OpenCV + OpenCV contrib

目录 0.写作背景 1.安装visual studio 2.下载OpenCV相关的源码下载OpenCV原始的源码下载OpenCV contrib的源码下载安装cmake 3….

人工智能 2023年6月19日
0086
AttributeError: ‘AxesSubplot‘ object has no attribute ‘bar_label‘

AttributeError: ‘AxesSubplot’ object has no attribute ‘bar_label’ …

人工智能 2023年6月19日
0078
机器学习实战 | Python机器学习算法应用实践

作者：韩信子@ShowMeAI教程地址：https://www.showmeai.tech/tutorials/41本文地址：https://www.showmeai.tech/a…

人工智能 2023年6月23日
0073
redis（基础 && redis缓存）

一，redis基础目录数据类型 1.1 字符串 1.2 hash 1.3 List 1.4 Set 1.5 sorted set jedis操作redis 与spring集成 …

人工智能 2023年6月26日
0075
opencv在 Cmakelist的写法以及编译详解

目录 1. 预备知识 2.实战测试，官网下载opencv编译不安装 2.1. 准备工作 2.2. 官方安装教程 2.3.官方测试用例 2.3.1 Create a program …

人工智能 2023年7月18日
0039
【语义分割】算法理论梳理：基础理论/常见网络FCN、DeepLab、LR-ASPP、UNet、U2Net

目录语义分割 1. 常见数据集格式 2. 常见语义分割评价指标转置卷积 1. 运算步骤（s为步长，p为padding，k为卷积核尺寸） 2. 优势以及存在的问题膨胀卷积 1….

人工智能 2023年6月18日
0064
Pandas索引基本操作

公众号：尤而小屋作者：Peter编辑：Peter 大家好，我是Peter~ 本文主要是记录Pandas中单层索引的一些基本操作。 ; 10种索引下面简单回顾下之前学习创建的10种…

人工智能 2023年6月11日
0055
安装TensorFlow

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月4日
0079
python动物语音识别_GitHub – bestpower/Speech_Recognition_Test: 利用Python+TensorFlow实现语音识别…

Speech_Recognition_Test 中文语音识别 1、项目运行环境 Windows7x64 Pycharm 2018.2.4 Python 3.6.2 独立显卡 GTX…

人工智能 2023年5月27日
0089
Poisson回归和负二项回归该如何分析

1.前提条件在分析之前，首先我们要了解Poisson分布和负二项回归分布的适用条件，它们均需满足以下三个条件： 1.平稳性：发生频数的大小，只与单位大小有关系。(比如1万为单位，…

人工智能 2023年6月17日
0060
深度学习推荐算法模型-论文和PyTorch实现

目录一 AutoRec 1.1 论文 1.2 代码二 Deep Crossing 2.1 论文 2.2 代码三 NeuralCF 3.1 论文 3.2 代码四 PNN 4….

人工智能 2023年7月22日
0090
PyTorch中的损失函数有哪些常见的选择

问题描述你好，我今天要解决的问题是关于PyTorch中的损失函数有哪些常见的选择。我会详细介绍每个损失函数的算法原理、公式推导、计算步骤，并提供复杂的Python代码示例来解释代…

人工智能 2024年1月5日
0022

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Pandas：Series、DataFrame数据的loc、iloc、ix 查询 / 读取

大家都在看