Pandas处理表格基础

2023年7月6日下午2:00 • 人工智能 • 阅读 66

现在使用Python处理表格类数据（excel/csv）已经成为工作不可或缺的技能，尤其大数据量的分析筛选转换，Python更可以提供无与伦比的优势，使用Python处理数据，那Pandas就肯定绕不开，这篇就是Pandas的简单应用。

Pandas 数据分析包

使用只需引入即可

import pandas as pd

处理表格

获取表格数据
我们日常大部分情况都会使用excel，所以这次使用Pandas来处理excel作为例子

path = '/Users/lishiwen/Downloads/'
fileName = 'Person'
excel = pd.read_excel(path + fileName + '.xlsx')
df = pd.DataFrame(excel)
df

结果：

2. 一些查看表格的基本信息的方法：

dataframe有宽表转长表的方法，可以更好的展现数据维度与组合

df.melt()

结果：

df.melt(id_vars=["姓名","年龄","体重","性别","身高"])

上面是一些pandas的dataframe的一些基础属性，日常数据处理需要一些对数据的处理，下面开始对表格进行基础操作

筛选数据

df[ df.性别 == "男" ]

上面的数据筛选出我们需要的男性数据，但是可以看到索引还是之前的索引，可能不是我们希望展示的，所以需要重制索引

df2 = df[ df.性别 == "男" ]
df2.index = range(len(df2))
df2

根据条件添加列数据

在处理表格时，会有根据某列的数据，新增一列新的数据，这时候可能就会需要用到判断或计算式

df['小，初，高'] = df.apply(lambda x: '小学' if x.年级 < 7 else '初中' if 6 <x.年级 < 10 else '高中', axis=1)
df

根据某列值修改其他列

df['学费']=0
df.loc[df['小，初，高'] == '小学', '学费'] = 100
df.loc[df['小，初，高'] == '初中', '学费'] = 200
df.loc[df['小，初，高'] == '高中', '学费'] = 300
df

分组查看

表格处理中肯定会有希望通过某一维度聚合查看其他类型数据，这就用到了分组

df.groupby(['年级','班级','姓名']).mean()

绘图

pandas处理数据的能力是毋庸置疑的，但是他更加强大是因为它还可以绘图，可以根据你的数据绘制出你想要的图表，可以更直观的分析数据
可以直接使用df.plot()进行绘图，但是表格数据内有中文，绘图时会做警告，并且展示不了中文，所以需要多一个引用 import matplotlib.pyplot as plt 因为pandas的plot调用的matplotlib绘图，通过plt设置文字编码即可。

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']
plt.rcParams['axes.unicode_minus']=False

df3 = df.groupby(['年级','班级','姓名']).mean()
df3.rename(columns={'年龄':'age'},inplace=True)
df3.plot()

上面就是使用pandas处理表格数据的简单应用场景，pandas处理表格只有你想不到，没有它做不到的。更多使用参见它的使用手册

Original: https://blog.csdn.net/VincentLee7/article/details/125954026
Author: LiShiwen0206
Title: Pandas处理表格基础

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/674087/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

深度学习系列27：VAE生成模型

AE AE（Autoencoder），自动编码器。自编码器的初衷是为了数据降维，假设原始特征x维度过高，那么我们希望通过编码器E将其编码成低维特征向量z=E(x)，编码的原则是尽可…

人工智能 2023年6月16日
0080
知识图谱概论

知识图谱概论概念人工智能发展阶段计算智能计算机早已超过人类感知智能让计算机具备视觉和听觉等感知的智能。语音识别和人脸识别等技术上已取得进步。认知智能与人类语言、知识…

人工智能 2023年6月1日
0073
Python处理数据格式后跑模型（pycrfsuite）—验证数据有效性

文章目录 1、先跑通官方数据集的模型 2、观察官方数据集格式 3、分割数据集 4、处理数据格式 5、跑模型 1、先跑通官方数据集的模型参考模型：基于crf的CoNLL2002数据…

人工智能 2023年5月31日
0090
强化学习——Proximal Policy Optimization Algorithms

文章目录前言为什么需要PPO TRPO PPO 前言本文对论文《Proximal Policy Optimization Algorithms》进行总结，如有错误，欢迎指出。…

人工智能 2023年7月14日
00118
百度语音识别异常_百度语音识别和语音合成实战

概述随着人工智能的普及，越来越多的产品希望在现阶段增加语音功能。然而，语音识别并不是那么容易，所以各大互联网巨头都推出了语音识别产品。本文主要介绍了百度的语音识别和语言合成功能。…

人工智能 2023年5月25日
0073
基于人脸识别的门禁系统报告

*课题背景随着社会经济的快速发展，人民生活水平的不断提高，群众的安全防卫意识也逐步提升。由此，人们对安全防卫系统的要求越来越高。如何利用新的技术手段设计更加可靠的安防系统，增加居…

人工智能 2023年6月19日
0064
模糊神经网络

参考：https://wenku.baidu.com/view/94f77a7384868762cbaed58f.htmlhttps://wenku.baidu.com/view/…

人工智能 2023年7月13日
0053
LVS+Keepalived群集实验

目录一，keepalived介绍 1，keepalived是什么 2、Keepalived工作原理 3、Keepalived 体系主要模块及其作用二，keepalived服务主…

人工智能 2023年5月30日
0078
【(强推)李宏毅2021/2022春机器学习课程】2022-语音与影像上的神奇自监督学习模型【精】

文章目录 Review：Self-supervised Learning for Text Self-supervised Learning for Speech Self-sup…

人工智能 2023年5月25日
0070
论文阅读《Sparse R-CNN：End-to-End Object Detection with Learnable Proposals》

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月12日
0058
fluent气动噪声计算步骤_Actran在电机噪声中的解决方案

1、声学软件Actran简介 Actran是由比利时FFT公司开发的一款通用声学仿真计算软件，被应用于各个行业进行声学性能的仿真计算和评估。在2011年，美国MSC Softwar…

人工智能 2023年5月27日
0087
Unity 性能优化总结

造成游戏性能瓶颈的主要原因分成以下几个方面：（1）CPU1.过多的 draw call2.复杂的脚本或者物理模拟（2）GPU1.顶点处理过多的顶点、过多的逐顶点计算2.片元处理过多…

人工智能 2023年7月30日
0047
分类问题——广义线性回归

课程回顾线性模型只能应用在自变量和因变量是线性或者接近线性的情况。在现实生活中，数据之间存在着大量非线性的关系。为了解决这类问题，我们就需要对线性模型进行改进。例如在上面提到了…

人工智能 2023年7月2日
0078
OpenCV4 图像处理与视频分析实战教程笔记

14. 图像直方图的比较比较巴氏距离和余弦相似度 void hist_compare() { Mat src1 = imread("D:/images/hist_01….

人工智能 2023年6月18日
0076
YOLOv4: Optimal Speed and Accuracy of Object Detection

YOLOv4: Optimal Speed and Accuracy of Object Detection英文注解： YOLOv4:OptimalSpeedandAccuracy…

人工智能 2023年7月9日
0050
数据分析4 — 将爬取的数据保存成CSV格式

什么是 CSV 文件 CSV（Comma-Separated Values）是一种使用逗号分隔来实现存储表格数据的文本文件。我们都知道表格有多种形式的存储，比如 Excel 的…

人工智能 2023年7月15日
00106

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pandas处理表格基础

上面就是使用pandas处理表格数据的简单应用场景，pandas处理表格只有你想不到，没有它做不到的。更多使用参见它的 使用手册

大家都在看

上面就是使用pandas处理表格数据的简单应用场景，pandas处理表格只有你想不到，没有它做不到的。更多使用参见它的使用手册