36~ pandas读取

目录

1.pandas简介

2 索引

2.1 查看行索引

2.2 查看列索引

2.3 设定索引

2.4 重设索引

3. pandas获取行–loc和iloc

3.0 loc和iloc的区别及用法

3.1 df.iloc

1) df.iloc[0] 获取指定行

2) df.iloc[0:3]:切片获取多行,

df.iloc[:row]: 切片获取多行 从0–row行,[0:row]左闭右开

3) df.iloc[行,列]: 指定行,列取到某单元格的数据

4) df.iloc[0:2,1:3] 用切片来取指定行列

5) df.iloc[[行号1,行号2],[列号1,列号2]] 获取不连续的行 列 数据

6) df.iloc[:,:] 提取所有数据

3.2 df.loc

1) df.loc[index] : 获取 指定行的数据

2) df.loc[index1:index2] 切片获取连续的多行,左闭右闭

3) df.loc[index1,index3,index4] 获取不连续的多行 左闭右闭

4) df.loc[df.A>0] 选取A列大于0的行

5) df.loc[:,”列名”] 获取某列的数据

6) df.loc[index1:index3] [“col1”] 获取连续多行,指定单列

7) df.loc[[index1,index3], [“col1”] ] 获取​​​​​​​不连续多行,指定单列

8) df.loc[:, [‘A’, ‘C’]] 获取不连续多列– A列和C列

​编辑

9) df.loc[:, ‘A’:’C’] 选取连续多列–A列到C列

10) df.loc[index,列名] 获取指定单行,单列的数据 –具体单元格值

11) df.loc[index1:index2, “col1″:”col3”] 获取连续多行,多列

12) df.loc[[index1,index2], “col1″:”col3”] 获取不连续行,不连续列的内容

数据查询:取得 DataFrame的子集

1.pandas简介

由于pandas使用openpyxl或xlwings库读写excel文件,因此openpyxl和xlwings必须安装一个

pandas是一个开放源码,可以从各种文件格式(excel,csv,json,数据库SQL等)中导入数据,导出数据。

pandas衍生自术语”panel data” 面板数据

Pandas库使用Numpy库提供高性能的矩阵运算, 安装Pandas库时,Numpy库将自动安装。

pandas的数据类型主要是Series类(一维数据系列)和DataFrame类(二维数据表)

Series对象保存一组数据,类似于一维数组列表

DataFrame对象是一个表格型的数据结构,有多个列,多个行,类似于excel表格或数据库的表。

提取dataFrame的一行或一列获得一个Series对象。

类似于数据库,Dataframe有索引列,用于快速查找。

36~ pandas读取

2 索引

索引就像地址,告知你数据在dataframe或者series的具体位置。索引分为行索引和列索引两种。默认情况下,行索引为序列号,列索引为列名。

2.1 查看行索引

df.index

2.2 查看列索引

df.columns

36~ pandas读取

2.3 设定索引

set_index方法是专门用来将某一列设置为index

主要参数:
keys:需要设置为index的列名
drop:True or False。在将原来的列设置为index,是否需要删除原来的列。默认为True,即删除(Delete columns to be used as the new index.)【将设置为索引的列删除,默认为True 】
append:True or False。新的index设置之后,是否要删除原来的index。默认为True。(Whether to append columns to existing index.)[原索引是否保留,默认为True ]

inplace:True or False。是否要用新的DataFrame取代原来的DataFrame。默认False,即不取代。( Modify the DataFrame in place (do not create a new object))

【是否在原DataFrame上修改,默认False 】

inplace=False ,不在原df上修改,set_index返回一个新的df,

inplace=True ,在原df上修改,set_index返回None

inplace=False 使用时需要赋值

`
“””
excel_data=excel_data.set_index(‘age’) 需要赋值,才生效

Original: https://blog.csdn.net/lzmlc0109/article/details/126721329
Author: 此时
Title: 36~ pandas读取

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/743402/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球