Python数据分析三剑客之Pandas

2023年7月7日下午6:12 • 人工智能 • 阅读 61

处理数值型以外的其他类型数据。

常用类： Series，DataFrame

是一种类似于一维数组的对象，有两部分组成：

values：一组数据（ndarray类型）

index：相关的数据索引标签

Series的创建：

a = Series(data=[1, 2, 3, "Four"])

b = Series(data=np.random.randint(0, 100, size=(3, )))
// 注：用numpy创建时数组必须为一维

a = Series(data=[1, 2, 3, "Four"], index=['a', 'b', 'c', 'd'])

dic = {'语文': 100, '数学': 99, '理综': 250}
c = Series(data=dic)

Series的索引和切片：


c.语文
// 100

c[0:2]
//
语文    100
数学     99
dtype: int64

Series常用属性：

Series常用方法：

a1 = Series(data=[1, 2, 3], index=['a', 'b', 'c'])
a2 = Series(data=[1, 2, 3], index=['a', 'd', 'c'])
a = a1 + a2
//
a    2.0
b    NaN
c    6.0
d    NaN
dtype: float64

a.isnull()
//
a    False
b     True
c    False
d     True
dtype: bool

是一个【表格型】数据结构，DataFrame由按一定顺序排列的多列数据组成。设计初衷是将Series 的使用场景从一维拓展到多维。

既有 行索引index又有 列索引columns，值values

DataFrame的创建：


df = DataFrame(data=np.random.randint(0, 100, size=(6, 4)))

dic = {'name': ['zhangsan', 'lisi', 'wanglaowu'], 'salary': [1000, 2000, 3000]}
df = DataFrame(data=dic, index=['a', 'b', 'c'])

//
        name  salary
a   zhangsan    1000
b       lisi    2000
c  wanglaowu    3000

DataFrame属性：

示例创建成绩表：

dic = {'张三': [150, 150, 150, 300], '李四': [100, 100, 100, 100]}
df = DataFrame(data=dic, index=['语文', '数学', '英语', '理综'])

//
     张三  李四
语文  150   0
数学  150   0
英语  150   0
理综  300   0

DataFrame索引操作：

df = DataFrame(data=np.random.randint(0, 100, size=(6, 4)), columns=['a', 'b', 'c', 'd'])
//
    a   b   c   d
0  45  54  25  94
1  85  22  16  65
2  14  23  74  54
3  96  33  45  61
4  80   6   1  19
5  67  87  19   7

df['a']
//
0    45
1    85
2    14
3    96
4    80
5    67
Name: a, dtype: int32

df['a', 'c']

df.iloc[0]
//
a    45
b    54
c    25
d    94
Name: 0, dtype: int32

df.iloc[[0, 3, 5]]
//
    a   b   c   d
0  45  54  25  94
3  96  33  45  61
5  67  87  19   7

df.iloc[0, 'a']
df.iloc[0, 2]

df.loc[0, 'a']
df.loc[0, 2]

df.iloc[[0, 3, 5], 2]
//
0    25
3    45
5    19
Name: c, dtype: int32

DataFrame切片操作：

df[0:2]
//
    a   b   c   d
0  45  54  25  94
1  85  22  16  65

df.iloc[:, 0:2]
//
    a   b
0  45  54
1  85  22
2  14  23
3  96  33
4  80   6
5  67  87

DataFrame运算：同Series

示例：

dic = {'张三': [150, 150, 150, 300], '李四': [0, 0, 0, 0]}
df = DataFrame(data=dic, index=['语文', '数学', '英语', '理综'])
qz = df
qm =df
mean = (qz + qm) / 2
//
       张三   李四
语文  150.0  0.0
数学  150.0  0.0
英语  150.0  0.0
理综  300.0  0.0

zs = qz.loc['数学', '张三']
// 150

qm['李四'] += 100
//
       张三    李四
语文  150.0  100.0
数学  150.0  100.0
英语  150.0  100.0
理综  300.0  100.0

qz += 10
//
     张三  李四
语文  160  10
数学  160  10
英语  160  10
理综  310  10

时间数据类型的转换： pd.to_datetime()

dic = {'time': ['2010-10-10', '2011-11-20', '2020-01-10'], 'temp': [33, 31, 30]}
df = DataFrame(data=dic)
df['time'] = pd.to_datetime(df['time'])
//
time    datetime64[ns]

将某一列作为某一列的行索引： set_index()

df.set_index('time')

//
            temp
time
2010-10-10    33
2011-11-20    31
2020-01-10    30

Original: https://blog.csdn.net/qq_40202164/article/details/125548247
Author: GODamnbit
Title: Python数据分析三剑客之Pandas

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/676802/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

colmap的使用简介

colmap的三维重建使用简介，首先colmap的安装传送门在我另一篇中有记录。本篇记录一下使用方法。 1.数据集获取首先是数据集问题，可以下载自己想试着重建的数据集保存。通过 …

人工智能 2023年5月26日
00112
【ML】探索性数据分析 (EDA)

简介探索性数据分析 (EDA) 以了解我们数据集的信号和细微差别。这是一个循环过程，可以在我们开发过程的各个阶段（标记之前/之后、预处理等）完成，具体取决于问题的定义程度。例如，…

人工智能 2023年7月15日
0067
Mediapipe三维实时人体关键点检测与追踪（一）

Mediapipe三维实时人体关键点检测与追踪 1.Mediapipe简介 2.Mediapipe姿态检测器 3.Mediapipe图像姿态检测 4.Mediapipe摄像头实时姿…

人工智能 2023年6月15日
00138
【自动驾驶传感器融合系列】02自动驾驶中的多传感器同步理论

【自动驾驶传感器融合系列】02自动驾驶中的多传感器同步理论文前白话 * 1、传感器时空同步概念 2、传感器时间同步 – · 时间硬同步 · 时间软同步 3、传感器时空…

人工智能 2023年6月2日
0080
神经网络常见的激活函数,神经网络中的激活函数

深度学习中的主要激活函数有哪些 1.什么是激活函数？生物神经网络启发了人工神经网络的发展。但是，ANN并非大脑运作的近似表示。不过在我们了解为什么在人工神经网络中使用激活函数之前…

人工智能 2023年6月15日
0082
Python中的排序函数

列表排序 sort函数： list.sort(cmp=None,key=None,reverse=False) 对原列表进行排序，完成排序后，原列表变为有序列表。 sorted函数…

人工智能 2023年7月8日
0053
Python大数据分析与挖掘实战微课版答案 Python大数据分析与挖掘实战课后答案例题课后作业 python题目 python题库数据分析与挖掘题库数据分析与挖掘项目

（在此仅展示题目，所有数据、代码、答案、习题等点我头像，在资源中！！！）以下关于pandas 数据预处理说法正确的是（）。 _A、_pandas没有做哑变量的函数 _B、_在不导…

人工智能 2023年6月19日
0097
Pytorch下基于lstm的股价预测

一、库准备 import matplotlib.pyplot as plt from sklearn.preprocessing import MinMaxScaler impor…

人工智能 2023年7月13日
0055
自从用了这个接口测试工具，我的Postman再也没打开过

《开源精选》是我们分享Github、Gitee等开源社区中优质项目的栏目，包括技术、学习、实用与各种有趣的内容。本期推荐的是一个轻量级的接口测试工具——hoppscotch.io。…

人工智能 2023年7月29日
0082
【目标检测】YOLOv3-SPP ，在YOLOv3中增加SPP模块

文章目录 * – 一、YOLOv3模型结构 – 二、YOLOv3-SPP模型结构 – 三、SPP模块 – 四、对YOLOv3-SPP…

人工智能 2023年6月16日
00108
OpenCV快速入门四：TrackBar控件（滑动条）

一：函数API 1:createTrackbar int createTrackbar( const String &trackbarname, const String …

人工智能 2023年7月19日
0079
Python_Pandas

文章目录 * – 参考文档 – + 中文文档 + 官方文档 – Pandas的两种数据结构 – + 相应的操作 + * 单独取出一列…

人工智能 2023年7月7日
0083
图像处理/计算机视觉/ python环境下如何用滤波器（/逆滤波/均值滤波/低通滤波/高通滤波）处理图片【附代码】

计算机视觉滤波器实操基础知识 * 一、计算机视觉技术中常见的几种滤波器二、滤波器相关知识应用一：算术均值、几何均值、谐波逆谐波 * 一、问题分析二、结果图三、代码附录 …

人工智能 2023年6月19日
0099
YOLOV7训练自己的数据集

代码移植 GitHub – WongKinYiu/yolov7: Implementation of paper – YOLOv7: Trainable b…

人工智能 2023年6月16日
0082
在Ubuntu下搭建pytorch深度学习环境(conda命令windows Linux通用)

安装任务：检查ubuntu下是否有NVIDIA驱动，如果没有则需要安装 ubuntu下安装anaconda3 在ubuntu下配置conda清华源镜像（提高conda下载速度） …

人工智能 2023年7月22日
0066
pointnet语义分割_训练并预测自己的数据

这几天想用深度学习做一下点云的分割试验，网上搜了一下相关标题的blog有很多，但大部分只是简单的介绍文章内容，说明具体操作流程的干货并不多。在缺乏相关资料和帮助的情况下，本人大致搞…

人工智能 2023年5月23日
00110

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Python数据分析三剑客之Pandas

大家都在看