Pandas的基本使用

2023年7月9日上午1:00 • 人工智能 • 阅读 79

Pandas的基础

1.1 Pandas的介绍

专门用于数据挖掘的开源python库
以Numpy为基础，借力Numpy模块在计算方面性能高的优势
基于matplotlib，能够简便的画图
独特的数据结构

1.2 为什么使用Pandas

增强图表可读性
便捷的数据处理能力
读取文件方便
封装了Matplotlib、Numpy的画图和计算
Pandas数据结构

Pandas中一共有三种数据结构，分别为：Series、DataFrame和MultiIndex（老版本中叫Panel ）。其中Series是一维数据结构，DataFrame是二维的表格型数据结构，MultiIndex是三维的数据结构。

SeriesDataFrameMultiIndexSeries是一维数据结构DataFrame是二维的表格型数据结构MultiIndex是三维的数据结构

2.1 Series

Series是一个类似于一维数组的数据结构，它能够保存任何类型的数据，比如整数、字符串、浮点数等，主要由一组数据和与之相关的索引两部分构成。

1. Series的创建

; 2. serise的属性

2.2 DataFrame

1 DataFrame的创建

; 2 DataFeam的属性

3. DataFrame索引值的设置

; 2.3 MultiIndex与Panel

1. MultiIndex

MultiIndex是三维的数据结构; 多级索引（也称层次化索引）是pandas的重要功能，可以在Series、DataFrame对象上拥有2个以及2个以上的索引。

; 2. Panel

3.基本数据操作

读取文件
data=pd.read_csv("./data/stock_day.csv")
删除一些列，让数据更简单些，再去做后面的操作
data = data.drop(["ma5","ma10","ma20","v_ma5","v_ma10","v_ma20"], axis=1)

3.1 索引操作

默认的索引操作必须事先列后行
使用loc:只能指定行列索引的名字
使用iloc可以通过索引的下标去获取

; 3.2 赋值操作

3.3 排序

1. DataFrame排序

; 2. series排序

3.4. 总结

; 4. DataFrame运算

4.1 算术运算

; 4.2 逻辑运算

4.3 统计运算

Numpy当中已经详细介绍，在这里我们演示min(最小值), max(最大值), mean(平均值), median(中位数), var(方差), std(标准差),mode(众数)结果:
对于单个函数去进行统计的时候，坐标轴还是按照默认列”columns” (axis=0, default)，如果要对行”index” 需要指定(axis=1)
方差 data.var(0) 标准差 data.std(0)
median()：中位数
求出最大值的位置idxmax()、求出最小值的位置idxmin()

; 4.4 自定义运算

apply(func, axis=0) func:自定义函数 axis=0:默认是列，axis=1为行进行运算

Pandas画图

更多细节
pandas.Series.plot

; 6. 读取文件

6.1 csv

; 6.2 hdf5

我这里遇到错误了还没解决
后面解决

6.2 JSON

; 7. 高级数据处理

7.1 缺失值处理

应用isnull判断是否有缺失数据NaN
应用fillna实现缺失值的填充
应用dropna实现缺失值的删除
应用replace实现数据的替换

; 1. 缺失值是Nan

movie.dropna() 不修改原数据

2. 缺失值是其他符号

; 7.2 数据离散化

7.3 合并

; 7.4 交叉表和透视表

7.5 分组与聚合

Original: https://blog.csdn.net/qq_39759664/article/details/118500969
Author: 小玩偶啊
Title: Pandas的基本使用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/679662/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

YOLOV1详解——Pytorch版

由于YOLOV1是end没有设置先验框，因此预测精度受的影响且迁移能力差；只有一个特征层，对小物体和群体的小物体预测能力差，这样也意味着有更多的修改空间。参考代码：https:/…

人工智能 2023年6月17日
0061
构建民航业知识图谱并实现语义查询

CivilAviation Q&A 根据民航业年度公报（年报）构建民航业知识图谱并实现语义查询。项目地址：https://github.com/ShawnHXH/QA-Ci…

人工智能 2023年6月1日
0082
SMI-FGSM：空间动量提高对抗迁移性

1 引言当前很多对抗攻击方法在白盒条件下都能达到非常高的攻击成功率，但在该条件下生成的对抗样本可迁移性较差。基于动量的攻击MI-FGSM是提高对抗样本可迁移性的一种非常有效方法，…

人工智能 2023年5月31日
0095
基于macos M1 python3.8的tensorflow安装（简单方便几步完成）

基于macos M1 python3.8的tensorflow安装：基于macos M1 ，ios12，anaconda3，python3.8 问题描述：之前安装tensorf…

人工智能 2023年5月24日
0068
VScode配置conda虚拟环境

VScode学习Python 记录自己利用VScode学习Python的一些坑，和大家学习分享一下 VScode配置conda的虚拟环境，遇到一些问题问题 VScode安装好以后…

人工智能 2023年7月5日
0067
电蚊香长时间通电引发的86离线语音智能盒子的设计开发

人工智能 2023年5月23日
0066
HOG3D原理解读

最近需要使用HOG3D对视频中提取的兴趣点进行描述，就研究了下相关的原理，原论文名为：A Spatio-Temporal Descriptor Based on 3D-Gradie…

人工智能 2023年6月20日
00101
YOLOV5源码的详细解读

YOLOv5目录结构 ├── data：主要是存放一些超参数的配置文件（这些文件（yaml文件）是用来配置训练集和测试集还有验证集的路径的，其中还包括目标检测的种类数和种类的名称）…

人工智能 2023年7月4日
0070
spark数据倾斜，spark sql 优化方案

1、SQL 代码层面优化 Step1、阻塞调度的长耗时 SQL 提取 Step2、划分长耗时 SQL Step3、对长耗时 SQL 逐个分析 1.1、数据倾斜优化 1.1.1、sq…

人工智能 2023年7月15日
0067
Python-Pandas-Excel/CSV 数据处理大全整理 (一)

本文主要针对Python处理Excel & CSV文件的应用。所有代码均实例化代入且逐条备注解释。全文逐条手工输入整理，可能会产生错误之处，还请指正。之后会陆续整理 &…

人工智能 2023年7月8日
0043
YOLO系列算法

目录 YOLO系列算法 * yolo算法 – Yolo算法思想 Yolo的网络结构 + 网络输入网络输出 * 7X7网格 30维向量 Yolo模型的训练 + 训练样本…

人工智能 2023年7月27日
0064
Rich feature hierarchies for accurate object detection and semantic segmentation

Abstract 在过去几年中，在标准PASCAL VOC数据集上测量的目标检测性能保持稳定。性能最好的方法是复杂的集成系统，通常将多个低级图像特征与高级上下文相结合。在本文中，我…

人工智能 2023年7月12日
0068
【数学建模】分类模型

目录一、水果分类的例子二、逻辑回归（Logistic regression) 三、线性概率模型（LPM）四、Spss求逻辑回归 1、操作步骤 2、预测成功率看分类表 3、逻辑…

人工智能 2023年7月1日
0042
回归预测 | MATLAB实现GBDT(梯度提升树)fitrensemble参数设定

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月17日
0070
【机器学习算法】线性回归算法

文章目录一、线性回归 * 1. 回归问题 – – 回归和分类 2. 预测未来 – – 机器学习实现预测的流程 3. 线性方程 &#…

人工智能 2023年6月15日
0073
【Python刷题篇】——Python入门 011面向对象（二）

🤵‍♂️ 个人主页: @北极的三哈个人主页 👨‍💻 作者简介： Python领域新星创作者。 📒 系列专栏：《牛客刷题-Python篇》《牛客刷题-SQL篇》 🌐推荐《牛客网》—…

人工智能 2023年7月29日
0050

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30