pandas学习笔记1: DataFrame和ndarray类

2023年7月8日下午5:35 • 人工智能 • 阅读 62

我想在一个大表格中处理其中两列，先对一列筛选，再对另一列筛选。其实就是数据清洗过程。

我的原表是DataFrame类，这是我的代码。

import os
import numpy as np
import pandas as pd
from datetime import datetime
from pandas import Timestamp

path = "D:/pandas/空管数据2018.12.csv"
data = pd.read_csv(path,index_col=['Unnamed: 0'],parse_dates=['实际起飞时间','实际降落时间'],low_memory=False)
screencondition1 = data['起飞机场'] == 'ZBAA'       #筛选起飞机场为首都机场
screencondition2 = data['降落机场'] == 'ZBAA'       #筛选降落机场为首都机场
data1 = data[screencondition1]
data2 = data1.sort_values('实际起飞时间').reset_index().fillna(0)
data3 = data[screencondition2]
data4 = data3.sort_values('实际降落时间').reset_index().fillna(0)
print(data2)

输出结果如下：

index 航班号机型注册号 … 扇区19离开时间扇区20名称扇区20进入时间扇区20离开时间
0 50202 CSS6871 B752 B2845 … 0 0 0 0
1 94007 CCA975 A333 B5913 … 0 0 0 0
2 17221 CSS6945 B752 B1463 … 0 0 0 0
3 135569 CCA9693 B738 B7896 … 0 0 0 0
4 50963 CSS6909 B733 B2966 … 0 0 0 0
… … … … … … … … …

23188 150574 CCA4166 A320 B8890 … 0 0 0 0
23189 151693 CES5176 A320 B8975 … 0 0 0 0
23190 152292 CSN6214 A320 B8991 … 0 0 0 0
23191 152751 CFI013 C680 B9329 … 0 0 0 0
23192 155735 CCA1625 A321 B9919 … 0 0 0 0
[23193 rows x 284 columns]

如果我用pd.values把DataFrame转成ndarray类，则是下面的结果：

[[50202 ‘CSS6871’ ‘B752’ … 0 0 0]
[94007 ‘CCA975’ ‘A333’ … 0 0 0]
[17221 ‘CSS6945’ ‘B752’ … 0 0 0]
…

[152292 ‘CSN6214’ ‘A320’ … 0 0 0]
[152751 ‘CFI013’ ‘C680’ … 0 0 0]
[155735 ‘CCA1625’ ‘A321’ … 0 0 0]]

Original: https://blog.csdn.net/weixin_59012690/article/details/123165872
Author: Elophredr
Title: pandas学习笔记1: DataFrame和ndarray类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/678970/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

从手写数字识别入门深度学习丨MNIST数据集详解

就像无数人从敲下”Hello World”开始代码之旅一样，许多研究员从”MNIST数据集”开启了人工智能的探索之路。 MNIST数…

人工智能 2023年6月25日
00114
图像处理之理想高通滤波器、巴特沃斯高通滤波器和高斯高通滤波器的matlab简单实现

一、前言高通滤波器的功能是让高频率通过而滤掉或衰减低频,其作用是使图像得到锐化处理,突出图像的边界。经理想高频滤波后的图像把信息丰富的低频去掉了，丢失了许多必要的信息。一般情况…

人工智能 2023年6月17日
00111
基于matlab点云工具箱对点云进行处理四：对点云进行欧式聚类，并获得包围点云簇的外接凹多边形

基于matlab点云工具箱对点云进行处理四：对点云进行欧式聚类，并获得包围点云簇的外接凹多边形步骤：读取velodyne数据包pcap文件内的点云数据使用pcdownsamp…

人工智能 2023年6月2日
00133
RODNet: A Real-Time Radar Object Detection Network Cross-Supervised by Camera-Radar Fused Object 3D

一篇雷达与视觉融合的文章原论文地址：https://arxiv.org/abs/2102.05150代码地址：https://github.com/yizhou-wang/RODN…

人工智能 2023年7月12日
0067
论文阅读：弱基础小白跑通PCN源码过程随记

论文名： PCN: Point Completion Network源码： _ https://github.com/wentaoyuan/pcn_一些杂乱的记录：1.一定要记得c…

人工智能 2023年5月25日
00131
SQuAD数据集简介

文章目录 1. 什么是SQuAD? 2. SQuAD 1.1 2. SQuAD2.0 3. 评价指标 4. 当前排名什么是SQuAD? SQuAD是Stanford Questi…

人工智能 2023年5月27日
00105
行人重识别数据集之 Market1501 数据集

Market1501 数据集一、数据集结构二、数据集命名 2015年，论文 Person Re-Identification Meets Image Search 提出了 …

人工智能 2023年5月26日
00104
openCV安装与环境配置

到官网下载进入官网后，选择library，选择Windows 点击进入后会自动下载（ps:官网下载速度很慢）这个是百度网盘链接链接：https://pan.baidu.com…

人工智能 2023年6月19日
00107
pandas 处理什么样的数据？

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月6日
00115
Ubuntu22.04安装Cuda11.3和Cudnn8.5的深度学习GPU环境

全文以Ubuntu 22.04为例进行安装 Linux下驱动安装 sudo apt update && sudo apt upgrade -y ubuntu-dri…

人工智能 2023年6月16日
00123
机器学习算法系列（十三）-朴素贝叶斯分类算法（Naive Bayes Classifier Algorithm）

阅读本文需要的背景知识点：一丢丢编程知识一、引言前面几节介绍了一类分类算法——线性判别分析、二次判别分析，接下来介绍另一类分类算法——朴素贝叶斯分类算法1 （Naive Bay…

人工智能 2023年7月3日
0095
事件抽取与事件图谱构建

公众号系统之神与我同在知识图谱是下一代人工智能的基础设施，是实现可解释人工智能的重要手段。事件图谱的意义：通用领域丰富现有的知识图谱支撑其它信息获取引擎事件图谱构建的关键…

人工智能 2023年6月1日
00111
第3章 docker容器管理

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月28日
0081
如何使用OpenCV在图像中抠出指定的颜色区域

1 简要说明及流程我们往往需要在图像中抠出指定颜色的区域。在实际工况下这种指定颜色不是简单的纯色，往往难以单一的用R G B的某个范围值去确定。本文以PhotoShop为基准,…

人工智能 2023年7月19日
0059
【OpenCV】cv2.putText()函数用法

文章目录 cv2.putText()函数用法 * 参数字体选择例如 cv2.putText()函数用法 cv2.putText(image, text, org, font, …

人工智能 2023年6月18日
0099
pytorch中的数据导入之DataLoader和Dataset的使用介绍

在使用Pytorch构建和训练模型的过程中，经常需要把原始数据（图片、文本等）转换为张量的格式。对于小数据集，我们可以手动导入，但是在深度学习中，数据集往往是比较大的，这时pyto…

人工智能 2023年7月21日
0084

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pandas学习笔记1: DataFrame和ndarray类

大家都在看