Pandas基础学习笔记（二）——DataFrame用法

2023年8月16日上午7:07 • Python • 阅读 56

一、什么是DataFrame

DataFrame是一种表格型的数据结构。它的每一列可以是不同的值类型（例如布尔型、数值型、字符串等），此外它 既有行索引index，又有列索引columns。我们可以将它看成是 由Series组成的字典（将每一列看成是一个Series）。

二、DataFrame的创建

*Pandas.DataFrame( data, index, columns, dtype, copy )

编号参数描述1data数据可采取各种形式，例如：ndarray、series、map、list、dict、constant、DataFrame。2index行标签。如果没有传递索引值，可选的默认语法是np.arange(n)。3columns列标签。如果没有传递索引值，可选的默认语法为np.arange(n)。4dtype每一列的数据类型。5copy默认值为False，用于复制数据。

1、通过传入列表创建：

data=[['zhangsan',88,'M'],['lisi',99,'F'],['wangwu',78,'M']]
columns=['name','age','gender']
index=['a','b','c']
df=pd.DataFrame(data=data,index=index,columns=columns)
print(df)

运行结果：

2、通过传入dict创建：

data={'name':['zhangsan','lisi','wangwu'],'age':[23,34,45],'gender':['M','F','M']}
df=pd.DataFrame(data=data)
print(df)

运行结果：

3、通过传入dataframe创建：

通过观察结果可以发现，相当于是通过index和columns的值对原dataframe进行了索引得到的一个新的dataframe。如果在原表中没有找到相应的行或列，会自动补充NaN。

data={'name':['zhangsan','lisi','wangwu'],'age':[23,34,45],'gender':['M','F','M']}
df=pd.DataFrame(data=data)
tmp1=pd.DataFrame(data=df,index=[0,1],columns=['name','age'])
tmp2=pd.DataFrame(data=df,index=['a','b','c'])
print(df)
print(tmp1)
print(tmp2)

运行结果：

df表：

tmp1：

tmp2：

三、读写文件

1、读文件：

pd.read_csv(文件路径) #读csv文件，返回DataFrame对象
*pd.read_excel(文件路径) #读excel文件，返回DataFrame对象

2、写文件：

df.to_csv(文件路径)
*df.to_excel(文件路径)

四、DataFrame的索引：

1、df [列名] ：返回series

2、df [ [列名1，列名2] ]：返回DataFrame

3、df [ 起始行(include)：结束行(exclude) ]：返回索引值所对应的行组成的DataFrame。

4、df [布尔列表]：返回列表中为True的行组成的DataFrame （布尔列表的长度必须与df的行数相同，且返回的DataFrame的索引是原表中的对应的索引）

5、df [多条件布尔查询]：使用’&’和’|’连接查询条件。

注意：多条件布尔查询时，不能用and或or代替’&’和’|’。因为and和or它要求所连接的是真实的True或False，而例如df_baby_name[‘Count’]>85000这样的条件语句返回的是一个series，而不是True或False，因此要用&代替and，用|代替or。

6、loc索引：

df.loc[行维度，列维度]——标签选择

行维度：标签索引、标签切片(include:include) 、标签列表、

列维度：标签索引、标签切片(include:include) 、标签列表、

举例：

data=pd.read_csv('elections.csv') #数据
print(data.head()) #展示前几行

数据示例：

标签索引：

data.loc[0,'Party'] #标签索引

结果：

'Republican' #类型为str

标签切片：

data.loc[0:3,'Candidate':'%'] #标签切片,因为是标签构成的切片，
                              #因此（include：include），这里比较特殊！

结果：

标签列表：

data.loc[[1,2,3],['Candidate','%']] #标签列表

结果：

布尔数组：

data.loc[(data['%']

结果：

注意：易混淆的返回结果类型。

7、iloc索引：

df.iloc[行索引，列索引]——索引选择

行索引：整数索引、整数切片(include:exclude)、整数列表、

列索引：整数索引、整数切片(include:exclude)、整数列表、

举例：

data.iloc[0,0]

结果：

整数切片：

data.iloc[0:2,0:2]

结果：

整数列表：

data.loc[[1,2,3],['Candidate','%']]

结果：

布尔数组：iloc里的布尔表达式最后必须加.values，否则会报错哦！

data.iloc[(data['Result']=='win').values,:]

结果：

五、DataFrame的常用属性：

shape：返回行数和列数。

size：DataFrame的行数*列数，即元素的总个数
index：返回行索引或行标签列表

columns：返回列标签列表

六、DataFrame的常用方法：

head(n) / tail(n)：返回dataframe的前/后n行，默认参数为5行
describe()：显示每一列的描述性统计分析

print(data.describe())

info()：显示dataframe相关信息，包括每一列的非空值数量和数据类型

copy()：复制DataFrame的值和指针。

与 = 赋值运算不同的是，copy后得到的是一个新的一模一样的DataFrame，修改copy后的表的值并不改变原来的DataFrame，但是修改=复制后的表的值会改变原来的DataFrame。

举例：

data_copy=data.copy()
data_copy.iloc[0,0]='OLAOLA'
print('原表：\n',data.head())
print('copy表：\n',data_copy.head())

举例：

data_equal=data
data_equal.iloc[0,0]='OLAOLA'
print('原表：\n',data.head())
print('=复制后的表：\n',data_equal.head())

sort_values()：DataFrame调用该方法将返回按照指定列排序后的dataFrame对象。

df.sort_values(‘指定列’，ascending=True)：按指定列升序排列(默认)

df.sort_values(‘指定列’，ascending=False)：按指定列降序排列

groupby(列名)：返回按照指定列名进行分组的DataFrameGroupBy对象，其实就是一个字典，key由指定列名的值组成，values即key对应的DataFrame。
df.groupby(列名).agg([聚合函数])： 分组后再聚合，常用聚合函数有’min’,’mean’,’max’,’count’,’sum’等。

举例：

data.groupby('Party').agg(['mean','max'])

concat()：拼接，将两个DataFrame拼接成为一个DataFrame。

concat(
    objs, #需要拼接对象，一般为列表或字典
    axis=0 #axis=0为行拼接，axis=1为列拼接
    join='outer', #out时外连接
    join_axea=None,
    ignore_index=False,
    keys=None,
    levels=None,
    names=None,
    verigy_integrity=False)

下期见！

Original: https://blog.csdn.net/m0_55807855/article/details/126896741
Author: 吉J_J吉
Title: Pandas基础学习笔记（二）——DataFrame用法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/750919/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【个人爬虫练习】今日头条单个文章的文本、视频内容爬取

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年10月2日
0067
python如何利用百度_练习项目20：使用python制作游戏（中）

该楼层疑似违规已被系统折叠隐藏此楼查看此楼上一篇教程，我们通过实现一个敌机由上至下的循环过程，初步了解了pygame这个模块的使用。接下来，我们进行第二阶段，真正的实现一个通…

Python 2023年9月25日
0053
pandas中DataFrame的修改元素值、缺失值处理、合并操作的方法

实验目的熟练掌握pandas中DataFrame的修改元素值、缺失值处理、合并操作的方法实验原理 concat合并： pd.concat(objs, axis=0, join=…

Python 2023年8月19日
0062
人工智能：支持向量机SVM 练习题（带解析）

1.对于线性可分的二分类任务样本集，将训练样本分开的超平面有很多，支持向量机试图寻找满足什么条件的超平面？（A） A.在正负类样本”正中间”的B.靠近正类样…

Python 2023年9月27日
0098
pytest学习和使用-fixture如何使用？

和setup、teardown的区别是：fixture可自定义测试用例的前置条件； setup、teardown针对整个脚本全局生效，可实现在执行用例前后加入一些操作； setup…

Python 2023年9月12日
0049
十七、PyGame事件

我们昨天在窗口上绘制了一张图片，今天我们来完善一下游戏的引入功能。我们发现，昨天我们绘制的一张图片右下角有一个按钮，当玩家点击按钮时，我们切换到另一个文件。可是我们昨天发现点击…

Python 2023年9月23日
0041
用Python画出圣诞树，瞧瞧我这简易版的吧

前言嗨嗨，大家好，我是小圆今天来实现一下用python画出圣诞树代码模块源码.点击领取即可 import turtle as t from turtle import …

Python 2023年8月30日
0030
萌妹子Python入门指北（四）

这个系列其实是想给非计算机专业的人一个python的入门指导，已经写了3篇，这篇拖了好久了。我开始觉得学编程真的很难，计算机有些方面的知识真是常人所不能理解的，仅仅靠这几篇文章肯定…

Python 2023年5月25日
0074
轩小陌的Python笔记-day15 内置模块（剩余）和开发规范

day15 内置模块和开发规范目标：掌握常见的内置模块的使用及了解软件开发的规范。今日概要：内置模块 json time datetime re 开发规范主文件配置文件 …

Python 2023年8月15日
0055
人工智能算法面试大总结-总目录

该面经总结了春招/秋招各厂高频面试八股，除开围绕简历扣项目细节，公司最喜欢问的还是这些经典算法中涉及的知识点。目前涵盖 Python、基础理论、分类与聚类、降维、支持向量机SV…

Python 2023年10月24日
0034
初识设计模式 – 观察者模式

观察者设计模式（Observer Design Pattern）的别名有很多，如发布 – 订阅（Publish/Subscribe）模式、模型 – 视图（M…

Python 2023年10月18日
0033
python flask接收图像

@app.route(‘/getimg’, methods=[‘POST’])def analyze():f= request.fi…

Python 2023年8月14日
0038
Python | Pandas | 不完全总结

本文对 Pandas 的使用进行不完全总结 1。 Updated: 2023 / 08 / 05 Python | Pandas | 不完全总结数据类型 * 信息查询类型转换 …

Python 2023年8月7日
0050
pythonforin替换字符_如何在pandas.Dataframe中替换字符串的一部分？

我试图替换pd.Dataframe中所有字符串的一部分,但它不起作用. 我的数据示例： HLAA0101 HLAA0201 HLAA0202 HLAA0203 HLAA0205 我…

Python 2023年8月7日
0047
Python实现秒杀某宝商品抢购（附超详细代码）

前言 618过去了，前两天我干了一件惊天动地的大事，估计这件大事是很多小伙伴都想干的。我居然用python抢购淘宝商品，没想到吧，最勇敢的还是我。关于抢购的思路以及代码，我将会在…

Python 2023年6月12日
00105
[爬虫]网抑云音乐评论

[爬虫]网抑云音乐评论前言自打开网抑云之后，我久久无法忘记，是它才能带给我内心世界的波涛汹涌。我左手拿起它，右手放下它，一日复一日，我终于完成了《The Spider Of M…

Python 2023年8月11日
0054

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pandas基础学习笔记（二）——DataFrame用法

1、通过传入列表创建：

2、通过传入dict创建：

3、通过传入dataframe创建：

1、读文件：

2、写文件：

大家都在看