Pandas之Series、DataFrame、MultiIndex

2023年8月7日下午4:30 • Python • 阅读 40

Series是一个类似于一维数组的数据结构，它能够保存任何类型的数据
*主要由一组数据和与之相关的索引两部分构成。
pd.Series(data=Node,index=None,dtype=None)
data：传入的数据，可以是ndarray，list等
index：传入的索引，要与数据长度相等
dtype：数据的类型
index
values
series.sort_values(ascending=True)
series.add(数字)
需要series里面存的values是数字类型
series.sub(数字)
同上
逻辑运算
values中的每个元素进行逻辑运算
series.isin(values)
values：一个集合序列
也是一种逻辑运算
series.apply(func)
func：自定义函数
series.value_counts()
统计series中元素出现的次数

series[2]

pd.DataFrame(data=None,index=None,columns=None)
index：行索引
columns：列索引
shape
index
columns
values
T ：转置
data.head(n=5)
data.tail(n=5)
data.reset_index(drop=False)
重置索引
drop：是否丢弃原来的索引。
data.set_index(keys,drop=True)
keys： 列索引名称（单级索引）或 列索引名称组成的列表（多级索引）
drop：是否将指定作为索引的列删除
data.sort_values(by,ascending=True)
by：按单个列或多个列进行排序
返回一个新视图
data.sort_index(ascending=True)
按索引进行排序
返回一个新视图
data.query(查询语句字符串)
查询指定的行记录
data.query(“open
data.describe()
统计运算：count，mean，std，min,max
只针对数值类型进行统计
data.apply(func,axis=0)
func：自定义函数
axis=0：默认拿到每一列进行自定义运算
普通统计函数：默认axis=0,即按列统计

函数名说明

Arithmetic median of values

Mode

Absolute Value

Product of values

compute the index labels with the maximum

compute the index labels with the minimum

累计统计函数

函数作用

计算前1/2/3/…/n个数的最大值

计算前1/2/3/…/n个数的最小值

计算前1/2/3/…/n个数的积

data[‘open’][‘2018-02-27’]
先列后行
不支持切片
data.loc[‘2018-02-27′:’2018-02-22′,’open’]
按索引查询
先列后行
支持切片
data.iloc[:3,:5]
按索引的下标查询
先列后行
支持切片
data.ix[0:4,[‘open’,’close’,’high’]]
不推荐
data[‘close’]=1
有则修改
无则新增
data.close=1
只能修改某一列的值
data[data[‘open’]>23]
返回一个DataFrame视图
data[(data[“open”] > 23) & (data[“open”] < 24)]
多个逻辑判断

arrays = [[1, 1, 2, 2], ['red', 'blue', 'red', 'blue']]
pd.MultiIndex.from_arrays(arrays, names=('number', 'color'))

结果
MultiIndex(levels=[[1, 2], ['blue', 'red']],
           codes=[[0, 0, 1, 1], [1, 0, 1, 0]],
           names=['number', 'color'])

names：levels的名称
levels：每个level的元祖值

Original: https://blog.csdn.net/weixin_44390164/article/details/121303148
Author: 每一个不曾起舞的日子，都是对生命的辜负
Title: Pandas之Series、DataFrame、MultiIndex

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/740422/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python数据分析透视表，定制你的分析计算需求

透视表是一种可以对数据动态排布并且分类汇总的表格格式，在常用的python的数据分析非标准库pandas中体现为pivot_table模块。 pivot_table数据透视表可以灵…

Python 2023年8月8日
0040
Scrapy使用报错socket.timeout: timed out

项目场景：最近在学习Scrapy框架的时候遇到一个很奇怪的问题，为了设置请求时候的随机请求头引入了from fake_useragent import UserAgent,但是启…

Python 2023年10月1日
0040
湖南大学python头歌实训-matplotlib

; 第1关：线图的制作本关任务：寒冷冬天两块不同金属都加热到500度，在空气中放置，温度会不断降低，在接下来的十小时内，现每隔半小时测量一次，测量得到金属块一的温度是500，4…

Python 2023年8月30日
0034
python如何期货交易_Python期货量化交易基础教程（15）

15、pandas模块： K线、tick数据都是pandas.DataFrame类型，因此我们有必要介绍下pandas模块。 Pandas 的主要数据结构是 Series(一维数据…

Python 2023年8月8日
0064
Pandas groupby分组操作详解

在数据分析中，经常会遇到这样的情况：根据某一列（或多列）标签把数据划分为不同的组别，然后再对其进行数据分析。比如，某网站对注册用户的性别或者年龄等进行分组，从而研究出网站用户的画像…

Python 2023年8月7日
0030
记一次Python大作业-代码格式记录

导入包： 1）import pandas as pd 读取文件： 1）读取csv文件：pd.read_csv(“./submission.csv”，dtyp…

Python 2023年8月17日
0055
【完虐算法】「字符串-最长公共子序列」全面总结

你好！我是Johngo！ LeetCode专题「字符串」现在准备到了 5 期内容来啦。 [TencentCloudSDKException] code:FailedOperatio…

Python 2023年6月3日
0080
【C++】友元、嵌套类、异常、RTTI、类型转换运算符

友元类、友元成员函数和嵌套类是在其他类中声明的类；新增的特性：异常、运行阶段类型识别（RTTI）和改进后的类型转换控制。C++异常处理提供了处理特殊情况的机制，如果不对其进行处理，…

Python 2023年9月7日
0047
numpy库函数用法（一）：sum函数用法

专栏: numpy库函数用法目录 * – 一、sum函数通用格式 – 二、sum函数相关参数 – 三、sum函数举例 – + 1、…

Python 2023年8月25日
0041
Linux系统下的pytorch环境配置

一、安装conda 安装conda的方法请参考博主的另一篇文章，里面详细的讲解了安装的方法。文章地址如下：在Linux系统配置yolov5环境（tensorflow-gpu、cu…

Python 2023年9月7日
0053
1. pip和conda的区别

Pip 或者 conda的时候经常被混合使用，这两者也通常被认为是几乎相同的，尽管他们的很多功能是重叠的，但它们的设计和使用目的不同。所以这次参考官方的解释，来进行如下总结和归纳：…

Python 2023年9月9日
0056
PYTHON的一维转二维

需求实践中，很多数据是一维的，比如按客户编号构建的一张分地区、分阶段违约次数表。一维数组：现在需要将其转换为二维矩阵，各地区、各阶段的客户违约次数之和。既做了一维转二维的工作，也…

Python 2023年8月16日
0067
分布式机器学习：PageRank算法的并行化实现（PySpark）

算法的完整实现代码我已经上传到了GitHub仓库：Distributed-ML-PySpark（包括其它分布式机器学习算法），感兴趣的童鞋可以前往查看。我们在博客《数值分析：幂迭…

Python 2023年10月28日
0078
通过读取数据源，生成一个excel多个sheet的可视化数据报表的过程。（项目2）

import pandas as pd from openpyxl.drawing.image import Image import matplotlib.pyplot as p…

Python 2023年8月7日
0049
别人都在认真听课，我埋头写Python为主播疯狂点点点点点赞！

最近有次在钉钉看直播，发现这个直播非常之精彩，于是情不自禁地想要为主播大佬连刷一波赞：但我发现，手动连击点赞速度十分不可观。气人的是，钉钉直播不能长按刷赞！这让我很恼怒。心中满怀…

Python 2023年6月15日
0056
java实现根据先序遍历和中序遍历结果复原二叉树（剑指offer）

思路前序遍历序列为根左右顺序，中序遍历序列为左根右。首先根据前序遍历序列确定根节点，然后在中序遍历序列寻找根节点位置，考虑到当前序列在中序遍历序列的开始位置从而在中序遍历序列中…

Python 2023年6月12日
0063

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pandas之Series、DataFrame、MultiIndex

大家都在看