Pandas

2023年6月11日下午1:32 • 人工智能 • 阅读 217

一·Pands的数据结构分析

Pandas的两个主要的数据结构：Senes和DataFrame

(一)1·Series是一个类似一维数组的对象，它能够保存任何类型的数据，主要由一组数据和与之相关的索引两部分构成。

2.通过传入一个列表来创建一个Series类对象：

。

4.为了能方便地操作Series对象中的索引和数据，所以该对象提供了两个属性index和values分别进行获取。

（二）1.DataFrame类对象可以使用以下构造方法创建：pandas.DataFrame（data = None，index = None，columns = None， dtype = None，copy = False ）

2.通过传入数组来创建DataFrame类对象：

创建数组

3，可以使用列索引的方式来获取一列数据，返回的结果是一个Series对象。

通过列索引的方式获取一列数据

4.删除某一列数据，则可以使用del语句实现。

reindex()方法的语法格式

如果不想填充为NaN，则可以使用fill_value参数来指定缺失值。

ser_obj.reindex([‘a’, ‘b’, ‘c’, ‘d’, ‘e’, ‘f’],

fill_value = 6)

Series有关索引的用法类似于NumPy数组的索引，只不过Series的索引值不只是整数。如果我们希望获取某个数据，既可以通过索引的位置来获取，也可以使用索引名称来获取。

布尔型索引同样适用于Pandas，具体的用法跟数组的用法一样，将布尔型的数组索引作为模板筛选数据，返回与模板中True位置对应的元素。

ser_bool = ser_obj > 2

算数运算与数据对齐:

1.Pandas执行算术运算时，会先按照索引进行对齐，对齐以后再进行相应的运算，没有对齐的位置会用NaN进行补齐。

数据排序：

Pandas中按索引排序使用的是sort_index()方法，该方法可以用行索引或者列索引进行排序。

按索引对DataFrame进行分别排序，示例如下。

pandas中用来按值排序的方法为sort_values()，该方法的语法格式如下。

常用的统计计算

1.Pandas为我们提供了非常多的描述性统计分析的指标方法，比如总和、均值、最小值、最大值等。

如果希望一次性输出多个统计指标，则我们可以调用describe()方法实现，语法格式如下。

层次化索引：

前面所涉及的Pandas对象都只有一层索引结构，又称为单层索引，层次化索引可以理解为单层索引的延伸，即在一个轴方向上具有多层索引。

前面所涉及的Pandas对象都只有一层索引结构，又称为单层索引，层次化索引可以理解为单层索引的延伸，即在一个轴方向上具有多层索引。

Series和DataFrame均可以实现层次化索引，最常见的方式是在构造方法的index参数中传入一个嵌套列表。

认识层次化索引

1.from_tuples()方法可以将包含若干个元组的列表转换为MultiIndex对象，其中元组的第一个元素作为外层索引，元组的第二个元素作为内层索引。

2.from_arrays()方法是将数组列表转换为MultiIndex对象，其中嵌套的第一个列表将作为外层索引，嵌套的第二个列表将作为内层索引。

层次化索引的操作

1.例：根据书籍统计表，创建一个具有多层索引的Series对象，示例如下：

2.如果商城管理员需要统计小说销售的情况，则可以从表中筛选出外层索引标签为小说的数据。

3.交换分层顺序是指交换外层索引和内层索引的位置。

4.在Pandas中，交换分层顺序的操作可以使用swaplevel()方法来完成

5.在Pandas中，交换分层顺序的操作可以使用swaplevel()方法来完成。

要想按照分层索引对数据排序，则可以通过sort_index()方法实现。

读写文本文件：

1.在进行数据分析时，通常不会将需要分析的数据直接写入到程序中，这样不仅造成程序代码臃肿，而且可用率很低。常用的解决方法是将待分析的数据存储到本地中，之后再对存储文件进行读取。

2.CSV文件是一种纯文本文件，可以使用任何文本编辑器进行编辑，它支持追加模式，节省内存开销。

3.to_csv()方法的功能是将数据写入到CSV文件中。

read_csv()函数的作用是将CSV文件的数据读取出来，转换成DataFrame对象展示。

5.Text格式的文件也是比较常见的存储数据的方式，后缀名为”.txt”，它与上面提到的CSV文件都属于文本文件。

6.to_excel()方法的功能是将DataFrame对象写入到Excel工作表中。

read_excel()函数的作用是将Excel中的数据读取出来，转换成DataFrame展示。

Pandas的io.sql模块中提供了常用的读写数据库函数。

Original: https://blog.csdn.net/m0_67668319/article/details/123307264
Author: m0_67668319
Title: Pandas

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/600171/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Python】txt奇数行添加字段+csv查找范围内数据

我可以嚣张宣布，我终于3级了hhhh。添加文章标签的时候终于可以随心所欲了，这是我唯一想要的点。奇数行添加字段这个其实分析和搜索一下，涉及到的一个关键知识点就是：Python文…

人工智能 2023年7月8日
00101
机械臂速成小指南（八）：运动学建模（标准DH法）

👨‍🏫🥰🥳需要机械臂相关资源的同学可以在评论区中留言哦🤖😽🦄 指南目录📖： 🎉🎉机械臂速成小指南（零点五）：机械臂相关资源🎉🎉 机械臂速成小指南（零）：指南主要内容及分析方法 …

人工智能 2023年7月5日
00141
YoloV7:训练自己得数据集详细教程

美团刚刚发出yolov6，AB大神就带着yolov7来了。。。。。这速度是真快。。在 5-160 FPS 范围内速度和精度超过所有已知目标检测器。在后不到两个星期，提出 YO…

人工智能 2023年6月15日
00106
【数字图像处理matlab】 (均值、中值、排序、众数、方差/协方差、相关系数、直方图/累计直方图)

【数字图像处理matlab】 (统计与描述) 一些数字图像处理，统计与描述相关代码，matlab编写文章目录【数字图像处理matlab】 (统计与描述) * – …

人工智能 2023年6月18日
00100
pandas DataFrame数据筛选和切片

条件筛选选取col1列的取值大于n的记录: data[data[‘col1’]>n] 筛选col1列的取值大于n的记录,但是显示col2，col3列…

人工智能 2023年6月2日
00125
Layer Normalization解析

原论文名称：Layer Normalization原论文地址： https://arxiv.org/abs/1607.06450 之前有讲过Batch Normalization的…

人工智能 2023年6月15日
00111
OpenCV中LineTypes各枚举值(LINE_4 、LINE_8 、LINE_AA )的含义

在OpenCV中凡是与绘图有关的函数几乎都要涉及到这个LineTypes参数的设置。比如说函数line()、函数putText()、函数drawContours()、函数recta…

人工智能 2023年6月19日
00126
pythonpandas读取多列数据为一列_Python+Pandas读取excel一列或者多列保存为列表

excel内容读取一列保存为list，项目名称为例： import pandas as pd def excel_one_line_to_list(): df = pd.read…

人工智能 2023年7月9日
0089
Unity 讯飞实时语音转写（三）—— 分析转写结果

目录 Unity 讯飞实时语音转写（一）—— 使用WebSocket连接讯飞语音服务器Unity 讯飞实时语音转写（二）—— 接收转写结果Unity 讯飞实时语音转写（三）—— 分…

人工智能 2023年5月27日
00107
R语言dplyr包数据列重排（reorder）实战：把特定数据列移动到第一列、把特定数据列移动到最后一列、数据列多列重排、按照字母顺序重排数据列、把数据列反序

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月19日
00117
线性二自由度汽车模型的微分方程

本部分内容系汽车理论第五章第三节，我做了一点整理和总结。 1. 二自由度二自由度最开始是指侧向与横摆两个自由度。下图是一个车辆坐标系下，车辆存在六个自由度：沿x轴运动，前进运…

人工智能 2023年6月4日
00155
【Python】京东自动下单抢购脚本——双十一购物小技巧

最近种草一款富士📷已久，但限于富士产能，一直都没有等到开放购买，在尝试几次定闹钟到点准时抢购后，果断放弃，于是花了一个周末时间写了一个简易脚本，终于成为一名合格的”富家…

人工智能 2023年7月3日
00249
4G工业路由器的硬件保护作用是什么

4G工业路由器拥有诸多硬件保护的主要目标是保证设备的稳定运行，不断网不宕机。这也是选择联网设备中首要条件。原因非常简单，这是保证远程联网数据传输的基本，如果出现联网中断，必然导致项…

人工智能 2023年6月6日
00144
ORB_SLAM2、ORB_SLAM3跑EuRoc&KITTI数据集及evo评估

EuRoc数据集 ORB_SLAM2 ./Examples/Monocular/mono_euroc Vocabulary/ORBvoc.txt Examples/Monocula…

人工智能 2023年5月28日
00102
数据挖掘简答题

什么是数据挖掘什么是分类，什么是聚类，分类和聚类的区别 KDD(知识发现)的基本过程知识发现处理过程的模型从广义的观点，数据挖掘是从大型数据集（可能是不完全的，有噪音的，不确…

人工智能 2023年5月31日
0091
神经网络之输出层设计

[ 设计_一个 4 _层_的 _神经网络_需要以下步骤： 1. 确定输入 _层_的大小。这通常由输入数据的维度决定。例如，如果输入是 50 个特征，那么输入 _层_应该有 50 个…

人工智能 2023年7月2日
00106

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pandas

大家都在看