数据分析之pandas的使用

2023年10月30日上午8:47 • Python • 阅读 55

pandas

为什么学习pandas

numpy已经可以帮助我们进行数据的处理了，那么学习pandas的目的是什么呢？
numpy能够帮助我们处理的是数值型的数据，当然在数据分析中除了数值型的数据还有好多其他类型的数据（字符串，时间序列）， *那么pandas就可以帮我们很好的处理除了数值型的其他数据！

什么是pandas？

首先先来认识pandas中的两个常用的类
Series
DataFrame

Series

Series是一种类似与 _一维数组_的对象，由下面两个部分组成：
values：一组数据（ndarray类型）
index：相关的数据索引标签
Series的创建
由列表或numpy数组创建
由字典创建

from pandas import Series
s = Series(data=[127,2,3,'regina'])

为什么需要有显示索引？
答：显示索引可以增强Series 的可读性

还可以直接引入字典：

Series的索引和切片

s[0] --> regina
s.姓名 --> regina
s[0:2] -->
姓名    regina
年龄        23
dtype: object

Series的常用属性
shape
size
index 返回索引
values 返回值

s.shape
s.size
s.index #返回索引
s.values #返回值
s.dtype #元素的类型

Series的常用方法
head(),tail() 这里的head和tail默认是5，tail显示最后n个数据
unique() 去重
isnull(),notnull()
add() sub() mul() div() 只有索引一致的数据才可以相加同时也只有数据类型一样的才能相加

DataFrame

DataFrame是一个 【表格型】的数据结构。DataFrame由按一定顺序排列的多列数据组成。设计初衷是将Series的使用场景从一维拓展到多维。DataFrame既有行索引，也有列索引。
行索引：index
列索引：columns
值：values
DataFrame的创建
DataFrame的属性

============================================
练习：
根据以下考试成绩表，创建一个DataFrame，命名为df：

 regina  ivanlee
&#x8BED;&#x6587; 150        0
&#x6570;&#x5B66; 150        0
&#x82F1;&#x8BED; 150        0
&#x7406;&#x7EFC; 300        0

============================================

DataFrame索引操作

df = DataFrame(data=np.random.randint(60,100,size=(5,5)),columns=['A','B','C','D','E'],index=[1,2,3,4,5])

– 对行进行索引
+ iloc: 通过隐式索引取行 (不根据所定义的index取值)

取单个元素： df.iloc[,]

* DataFrame的切片操作
– 对行进行切片
– 对列进行切片
* df索引和切片操作
– 索引：
+ df[col]:取列
+ df.loc[index]:取行
+ df.iloc[index,col]:取元素
– 切片：

DataFrame的计算与Series一致

时间数据类型的转换
pd.to_datetime(col)

dic = {
    'time':['2010-10-10','2011-11-20','2020-01-10'],
    'temp':[33,31,30]
}
df = DataFrame(data=dic) df['time'].dtype = 'O'
import pandas as pd
#将time列的数据类型转换成时间序列类型
df['time'] = pd.to_datetime(df['time'])
df['time']

* 将某一列设置为行索引
– df.set_index() 上图中的索引是隐式索引的012，如果要将time列作为行索引

#将time列作为源数据的行索引
df.set_index('time',inplace=True)

Original: https://www.cnblogs.com/ivanlee717/p/16987592.html
Author: ivanlee717
Title: 数据分析之pandas的使用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/808105/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Django对接支付宝Alipay支付接口

最新博客更新见我的个人主页: https://xzajyjs.cn 我们在使用Django构建网站时常需要对接第三方支付平台的支付接口，这里就以支付宝为例（其他平台大同小异），使用…

Python 2023年11月2日
0045
机器学习之数据处理与可视化【鸢尾花数据分类|特征属性比较】

### 回答1：要进行 python– 鸢尾花数据集_iris _数据_的 _可视化，首先需要读取数据。我们可以使用pandas库中的read_csv函数来读取cs…

Python 2023年9月3日
00108
Django中根据URI来获取返回的数据

1，首先，如果url传递的参数形式是这样的： http://192.168.1.210:8999/category/id=4 那我们需要写一个方法来获取url传递的参数，然后再和从…

Python 2023年8月4日
0076
函数记忆：python装饰器实现短时缓存方法执行结果

函数记忆：python装饰器实现短时缓存方法执行结果【函数记忆】方法结果缓存装饰器 cache = {} def is_obsolete(entry, duration): d …

Python 2023年6月3日
0059
【python 目标检测】基于深度学习的道路破损检测|yolov5|VOC

前不久从大数据局那里接到了一个任务，让我们做一个道路破损的目标检测，上网搜了一搜，发现资料并不是很多。 torch 1.11.0torchvision 0.12.0python 3…

Python 2023年9月30日
0088
Python 学习笔记（七）–socket

1.网络七层模型及主要协议 2.TCP的”三次握手”和四次挥手三次握手 Step1：首先客户端向服务器端发送一段TCP报文; Step 2：服务器端接收到…

Python 2023年5月25日
0081
Matplotlib和tkinter学习笔记（一）

文章目录前言绘图 matplotlib的绘图流程： tkinter的使用流程 tkinter控件属性控件的值和单位总结前言 1 关于 Matplotlib 模块 Matp…

Python 2023年9月6日
0059
pandas 时间序列

文章目录 * – 为什么要学习pandas中的时间序列 – 生成一段时间范围 – 关于频率的更多缩写 – 在DataFrame中使用…

Python 2023年8月6日
0042
YOLO Air一款面向科研小白的YOLO项目 | 包含大量改进方式教程

YOLO Air一款面向科研小白的YOLO项目|包含大量改进方式教程|适用YOLOv5,YOLOv7,YOLOX,YOLOv4,YOLOR,YOLOv3,transformer等算…

Python 2023年9月16日
0047
通过Matplotlib画sin(x)

通过Matplotlib画sin(x) 《Python程序设计与科学计算》中的一些笔记。 1.初始绘制通过np.linspace生成一个等差数列。为了使曲线变得平滑，在[0,2π…

Python 2023年9月2日
0094
外星人入侵

Alien_Invasion.py import pygamefrom settings import Settingsfrom airplane import Airplanei…

Python 2023年9月25日
0041
字节微服务HTTP框架Hertz使用与源码分析｜拥抱开源

一、前言 Hertz[həːts] 是一个 Golang 微服务 HTTP 框架，在设计之初参考了其他开源框架 fasthttp、gin、echo 的优势，并结合字节跳动内部的需…

Python 2023年10月23日
0048
python Scrapy进阶（scrapy-redis）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

Python 2023年10月6日
0043
df添加一行 python_Python之pandas实现更复杂的Excel操作

◆ ◆ ◆ ◆ ◆我是需求有人问了我一个这样的问题，题目是：……。直接上图吧~ 总之一句话，给我求出每名同学两次模拟考试的成绩涨跌情况我来安排 1.造点…

Python 2023年8月18日
0047
Python中yield返回生成器的详细方法

最简单、直观的认识，将 yield 看做 return 对待，只是 return 返回一个值，而 yield 返回一个生成器。要理解 yield 的作用，必须理解生成器是什么？ …

Python 2023年5月25日
0056
Flask 框架：运用Echarts绘制图形

echarts是百度推出的一款开源的基于 JavaScript的可视化图表库，该开发库目前发展非常不错，且支持各类图形的绘制可定制程度高，Echarts绘图库同样可以与 Flask…

Python 2023年10月20日
0038

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31