Pandas入门——选取数据

2023年7月8日下午2:14 • 人工智能 • 阅读 105

1、1 下标或标签作为索引

dict = {'a': 0, 'b': 1, 'c': 2}
df = pd.Series(dict)
print(df)
print(df[0])
print(df['a'])

a    0
b    1
c    2
dtype: int64
0
0

想要显示带索引(标签)的某一行数据时，需要内部再嵌套一个[] 。

print(df[[0]])
print(df[['a']])

a    0
dtype: int64
a    0
dtype: int64

截取字符

print(df[:2])

a    0
b    1
dtype: int64

类似于字典，判断标签是否存在。

print('c' in df)

True

2、1 标签作为索引

2、1、1、1 选择一列：

（1）未使用函数

dict = {'one': {'a': 0, 'b': 1, 'c': 2}, 'two': {'a': 4, 'b': 9, 'c': 3}}
df = pd.DataFrame(dict)
print(df['one'])

a    0
b    1
c    2
Name: one, dtype: int64

与Series类似，想要显示带索引的数据时，需要内部再嵌套一个[]。

print(df[['one']])

   one
a    0
b    1
c    2

（2）使用函数

df.loc[] 一般适用于根据标签选择行的情况，但也可以写成以下形式选择列。

print(df.loc[:, ['one']])

   one
a    0
b    1
c    2

2、1、1、2 选择不止一列

（1）未使用函数

print(df[['one', 'two']])

   one  two
a    0    4
b    1    9
c    2    3

（2）使用函数

调用df.loc[]：

print(df.loc[:, ['one', 'two']])

   one  two
a    0    4
b    1    9
c    2    3

2、1、2、1 选择一行

直接写df[‘a’]会报错，正确且唯一的方法是调用df.loc[]， 但要注意以下两种方式的显示结果是不同的，嵌套[]可以显示索引。

print(df.loc['a'])

one    0
two    4
Name: a, dtype: int64

print(df.loc[['a']])

   one  two
a    0    4

2、1、2、2 选择不止一行

print(df.loc[['a', 'b']])

   one  two
a    0    4
b    1    9

（1）选择某一范围时

先行后列

print(df.loc[['a', 'b'], ['one', 'two']])

   one  two
a    0    4
b    1    9

（2）选择某一具体值时

先行后列

print(df.loc[['a'], ['one']])

   one
a    0

也可写成以下形式，但只输出值。

print(df.loc['a', 'one'])

2、2 下标作为索引

2、2、1、1 选择一行/多行

（1）未使用函数

直接写df[0]会报错，正确写法是df[:1]。

print(df[:1])

   one  two
a    0    4

与Series类似，切片可以灵活的截取不同行。

（2）使用函数

调用df.iloc[]， 但要注意以下两种方式的显示结果是不同的，切片可以显示索引。

print(df.iloc[0])

one    0
two    4
Name: a, dtype: int64

print(df.iloc[0:1])

   one  two
a    0    4

2、2、2、1 选择一列/多列

df.iloc[] 一般适用于根据下标选择行的情况，但也可以写成以下形式选择列。

print(df.iloc[:, 0:2])

   one
a    0
b    1
c    2

2、2、3、1 选择某一范围时

（1）未使用函数

print(df[:2][['one', 'two']])

   one  two
a    0    4
b    1    9

（2）使用函数

调用df.iloc[]：

print(df.iloc[0:2, 0:2])

   one  two
a    0    4
b    1    9

2、2、3、2 选择某一值时

（1）未使用函数

print(df[1:2][['one']])

   one
b    1

（2）使用函数

print(df.iloc[1:2, 1:2])

   two
b    9

2、3 dtype作为索引

支持numpy通用数据类型，include和exclude用于实现”提取这些数据类型的列”或”提取不是这些数据类型的列”。

dft = pd.DataFrame({'A': np.random.rand(3),
                    'B': 1,
                    'C': 'foo',
                    'D': pd.Timestamp('20010102'),
                    'E': pd.Series([1.0] * 3).astype('float32'),
                    'F': False,
                    'G': pd.Series([1] * 3, dtype='int8')})
print(dft.select_dtypes([bool]))

          A  B    C          D    E      F  G
0  0.079111  1  foo 2001-01-02  1.0  False  1
1  0.618861  1  foo 2001-01-02  1.0  False  1
2  0.346071  1  foo 2001-01-02  1.0  False  1

       F
0  False
1  False
2  False

print(dft.select_dtypes(include=['bool', 'number'], exclude=['float32']))

          A  B      F  G
0  0.054771  1  False  1
1  0.722049  1  False  1
2  0.256301  1  False  1

其中通用数据类型如下：

[numpy.generic,
 [[numpy.number,
   [[numpy.integer,
     [[numpy.signedinteger,
       [numpy.int8,
        numpy.int16,
        numpy.int32,
        numpy.int64,
        numpy.int64,
        numpy.timedelta64]],
      [numpy.unsignedinteger,
       [numpy.uint8,
        numpy.uint16,
        numpy.uint32,
        numpy.uint64,
        numpy.uint64]]]],
    [numpy.inexact,
     [[numpy.floating,
       [numpy.float16, numpy.float32, numpy.float64, numpy.float128]],
      [numpy.complexfloating,
       [numpy.complex64, numpy.complex128, numpy.complex256]]]]]],
  [numpy.flexible,
   [[numpy.character, [numpy.bytes_, numpy.str_]],
    [numpy.void, [numpy.record]]]],
  numpy.bool_,
  numpy.datetime64,
  numpy.object_]]

Original: https://blog.csdn.net/DAHWHG/article/details/120263112
Author: DAHWHG
Title: Pandas入门——选取数据

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/678653/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

matpotlib之折线图

文章目录折线图： plot函数示例说明：扩展应用 * 1、线条风格 – 线条颜色线条样式线条粗细 2、数据点标记marker 2、多组数据总结： ; 折线…

人工智能 2023年7月14日
0065
SAHI强化YOLOv5在小目标上的表现

环境 ubuntu 18.04 64bit sahi 0.8.4 yolov5 5.0 pytorch 1.7.1+cu101 前言目标检测和实例分割是迄今为止计算机视觉中最重要…

人工智能 2023年5月23日
00102
【论文笔记】Combining Reinforcement Learning and Rule-based Method to Manipulate Objects in Clutter

Abstract To reduce the complexity of strategy learning, we propose a framework for robots …

人工智能 2023年7月10日
0080
数字图像处理：图像分割——边缘检测与区域分割

一、图像分割 1.图像分割：根据图像的某些局部特征（灰度级、纹理、彩色或统计特征等）的相似性和互斥性，将图像分割成若干子区域，在每个子区域内部具有相似（相同或相近）特性，而相邻子区…

人工智能 2023年6月18日
0064
Python统计学11——分位数回归

分位数回归也是数理统计里面经典的模型，他相对于在最小二乘模型上进行了改进，虽然本身还是线性的参数模型，但对损失函数进行了改进。我们都知道最小二乘的损失函数是均方误差最小，分位数的损…

人工智能 2023年7月27日
0097
鼠标的工作原理，鼠标是如何定位的，DPI的作用

鼠标有很多部件，这里主要讲其中一个部件，图像传感器当你在鼠标垫上移动鼠标时，在鼠标的下方，有图形采集系统(IAS)，它是由一颗红外LED灯，一对透镜，以及一个图形像素矩阵组成 L…

人工智能 2023年7月9日
0055
Matplotlib安装与配置

1. Matplotlib 简介 Matplotlib 是 Python 生态系统的一个重要组成部分，是用于可视化的绘图库，它提供了一整套和 matlab 相似的命令 API 和可…

人工智能 2023年7月5日
0070
SpringBoot SpringBoot 基础篇 4 基于 SpringBoot 的SSMP 整合案例 4.4 数据层标准开发【基础CRUD】

SpringBoot 【黑马程序员SpringBoot2全套视频教程，springboot零基础到项目实战（spring boot2完整版）】 SpringBoot 基础篇文章目…

人工智能 2023年6月26日
0051
pytorch: torch.max() 使用与理解

在使用 pytorch 进行训练时，会使用使用到改行代码：predict = torch.max(outputs.data, 1)[1]其中 output 为模型的输出，该函数主要…

人工智能 2023年7月21日
0050
AI-无损检测方向速读：基于深度学习的表面缺陷检测方法综述

1 表面缺陷检测的概念表面缺陷检测是机器视觉领域中非常重要的一项研究内容, 也称为 AOI (Automated optical inspection) 或 ASI (Autom…

人工智能 2023年6月24日
0061
【神经网络】一文带你轻松解析神经网络（附实例恶搞女友）

😊😊😊 欢迎来到本博客😊😊😊本次博客内容将讲解关于神经网络的相关知识🎉 作者简介：⭐️⭐️⭐️ 目前计算机研究生在读。主要研究方向是人工智能和群智能算法方向。目前熟悉python网…

人工智能 2023年7月6日
0061
tensorflow调用并实现注意力机制

1 什么是注意力机制当我们看一张图片时，我们会直接聚焦到我们最关心的事情上，比如我们只会看到兔子，而忽略了兔子嘴里的草和蓝天白云。注意力机制是你模仿人脑自动捕捉最重要的信息的能力…

人工智能 2023年5月23日
0091
量化投资之工具篇一：Backtrader从入门到精通（1）-手把手教你零基础实现一个策略案例

量化投资是一个非常大的课题，从这边文章开始，我会从如下几个方面构建量化投资的这个框架： 1、工欲善其事，必先利其器。我们先学习一个量化投资回测利器-backtrader，通过这个工…

人工智能 2023年7月5日
0094
sklearn中的决策树（分类）

本文在我的知乎上同步更新：sklearn中的决策树（分类） – 知乎 Sklearn库有很多机器学习模型，不同的模型有着不同的特点，针对不同的问题，选取对应的模型，可以…

人工智能 2023年7月3日
00111
从链家爬取北京各区二手房房价进行分析并实现数据可视化

前言最近，本可人儿最近在学习大数据的分析和计算，正好利用所学的Spark的相关知识做一点小东西。使用的语言是python。使用工具爬虫：Scrapy框架和Xpath数据解析数…

人工智能 2023年7月16日
0059
pandas行列转换的4大技巧

公众号：尤而小屋作者：Peter编辑：Peter 大家好，我是Peter~ 本文介绍的是Pandas中4个行列转换的方法，包含： melt 转置T或者transpose wide_…

人工智能 2023年7月7日
0076

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pandas入门——选取数据

1、1 下标或标签作为索引

2、1 标签作为索引

2、2 下标作为索引

2、3 dtype作为索引

大家都在看