Python Pandas操作Excel 01

2023年7月7日上午1:20 • 人工智能 • 阅读 81

1.1 Pandas操作Excel 01

1.1.1 数据类型和新建文件

我们用pandas，操作的常见数据类型有： csv txt excel sql

数据.to_csv() 可以新建一个 csv 文件
数据.to_excel() 可以新建一个 excel 文件
数据.to_sql() 可以新建一个 sql 文件

在我们新建文件之前，肯定要学习如何封装相应的数据。

pd.DataFrame() 封装成一个二维数据表

import pandas as pd

二维数据表 = pd.DataFrame({'序号':[1,2,3],'姓名':['a','b','c']})
二维数据表 = 二维数据表.set_index('序号')
二维数据表.to_excel('1.xlsx',)
print('新建 1.xlsx 成功')

二维数据表 = 二维数据表.set_index('序号') 我们把索引列 设置为 我们提供的一列 Key，这样就不会 出现 默认索引列了。

pd.Series() 封装一个一维数据表

1.2.1 读取 txt 和 csv 文件

read_csv() 默认以 文本内容的逗号为分隔符

import pandas as pd

读取数据 = pd.read_csv('1.csv')

print(读取数据)

read_table() 默认以 文本内容的 \t 制表符为 分隔符

import pandas as pd

读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',')
print(读取数据)
print(读取数据2)

如果文本内容的分隔符跟我们用的这两个方法没有一个是对应的，就需要告诉方法我们的分隔符是什么。

1.2.2 认识 read_csv() 的参数

参数描述sep分隔符，字符串或正则表达式都支持header表头的行号设置为什么，以哪个行号为表头。如果没有表头应该写 Nonenames配合 header=None 使用，创建一行新的表头index_col设置索引为哪一列，可以是表头名，或列号skiprows从文件开始处，需要跳过的行数或行号列表。[2,3] 跳过 2 号行和3号行，如果直接提供一个数字，那么就是从读取处开始跳过多少行数据。encoding编码，例如 utf-8nrows从文件开头处读入的行数，限制我们读几行。

① 比如我们把 1 号行，设置为表头

import pandas as pd

读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=1)
print(读取数据)
print(读取数据2)

② 创建一个新表头

import pandas as pd

读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'])
print(读取数据)
print(读取数据2)

③ 过滤掉前 1行

import pandas as pd

读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'])
print(读取数据)
print(读取数据2)

④ 过滤掉 1 号行

import pandas as pd

读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'],skiprows=[1])
print(读取数据)
print(读取数据2)

⑤ 把字段1 当为索引列

import pandas as pd

读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'],index_col='字段1',skiprows=1)
print(读取数据)
print(读取数据2)

⑥ 读取前两行

import pandas as pd

读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'],index_col='字段1',skiprows=1,nrows=2)
print(读取数据)
print(读取数据2)

1.2.3 数据对象的一些方法

数据obj.head(读取的行数) 读取前几行数据

数据obj.shape 返回数据表的行数和列数

数据obj.columns 返回数据表的表头，装在一个列表里

数据obj.index 返回索引数据，比如从哪里开始，到哪里结束，步长是多少。

数据obj.dtypes 返回每一列or每一个字段的数据类型。即各个表头名里面存储的数据大致是什么类型的。

; 1.3.1 .txt 文件 `转` .csv 文件

import pandas as pd

txt数据 = pd.read_csv(txt文件路径)
txt数据.to_csv(csv文件的存储路径)

就很简单，这样直接进行转换就行。

1.4.1 读取 mysql 文件

import pymysql
import pandas as pd

连接对象 = pymysql.connect(host='localhost',user='root',password='123123',database='tempdata')

游标对象 = 连接对象.cursor()

数据表  = pd.read_sql('select * from 基本信息表',con=连接对象)

print(数据表)

1.5.1 读取 Excel 文件

import pandas as pd

数据表 = pd.read_excel('1.xlsx')
print(数据表)

Original: https://blog.csdn.net/qq_52606908/article/details/122377101
Author: 牟泉禹[Dark Cat]
Title: Python Pandas操作Excel 01

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/675183/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

用ltp提取文本关系并创建知识图谱（基于neo4j）（二）

博主在上一篇用ltp提取文本关系并创建知识图谱（基于neo4j）（一）文章中用LTP对单句话做了分析，提取了语义依存关系，并用python在neo4j网站上创建了图谱。本章是对上篇…

人工智能 2023年5月31日
00110
Seq2Seq+Attention生成式文本摘要

任务描述: 自动摘要是指给出一段文本，我们从中提取出要点，然后再形成一个短的概括性的文本。自动的文本摘要是非常具有挑战性的，因为当我们作为人类总结一篇文章时，我们通常会完整地阅读它…

人工智能 2023年7月29日
0058
基于MMRotate训练自定义数据集做旋转目标检测 2022-3-30

本文目录简述 1.MMrotate下载 2.环境安装 3.自定义数据集制作 * 3.1 roLabelImg 打标签 3.2 生成DOTA数据集格式的标签 3.3 数据集裁剪（s…

人工智能 2023年5月26日
0096
病毒组学数据分析 -03 Virsorter2病毒序列识别

VirSorter2 应用多分类器、专家指导的方法来检测不同的 DNA 和 RNA 病毒基因组。它对其之前版本（virsorter）进行了重大更新：与更多的病毒组合作，包括 ds…

人工智能 2023年7月16日
0060
Self-training with Noisy Student improves ImageNet classification (2020 CVPR)

1. 出处 2020 CVPR 2. 主要内容想要尽可能的利用上无标签的数据，来提高模型分类能力 3. 整体结构输入数据： labeled images和unlabeled i…

人工智能 2023年7月1日
0065
利用MATLAB绘制箱线图—箱线图在高光谱图像处理中的应用

利用MATLAB绘制箱线图一、箱线图在高光谱图像处理中的应用二、箱线图具体MATLAB代码分享三、参考文献欢迎学习交流！邮箱： z…@1…6.com…

人工智能 2023年6月18日
0074
VOC数据集介绍及构建自己的VOC格式目标检测数据集

文章目录 1、安装标注工具 * 1.1 ubuntu linux 系统 1.2 windows系统 2、labelimg使用方法 3、标注结果文件说明 * 3.1 Pascal V…

人工智能 2023年7月10日
0057
【学习笔记】深度学习在医学图像配准领域的应用《Deep Learning in Medical Image Registration: A Survey》

医学图像配准是根据图像内容的匹配原则，将不同医学图像转换到同一个坐标系统下。医学图像配准处理不同观察点，不同时间，或者使用不同设备（CT,MR,US等）的图像对是非常有必要的。传统…

人工智能 2023年5月26日
00109
极米Z6X Pro值得购买吗？这篇评测告诉你

随着生活水平的不断提高，我们也在追求更高的生活品质，所以家庭娱乐的需求也有了质的变化。越来越多的人开始选择投影机来组建属于自己的家庭影院。投影仪真正打造了超越百寸的震撼视听感受， …

人工智能 2023年6月28日
0085
Intel的ipp库（Integrated Performance Primitives）

IPP库包含了许多底层优化的函数。如果已经安装了IPP库，opencv在运行时也会自动调用。NVIDIA公司针对GPU开发了的GPU加速的图像、视频、信号处理库NPP（NVIDIA…

人工智能 2023年5月28日
0075
Java 实现音频添加自定义时长静音（附代码） | Java工具类

前言本文提供一个可以给一个wav音频添加自定义时长静音的工具类。正好工作中用到，所以正好分享分享。 Maven依赖 com.google.guava guava 30.1.1-j…

人工智能 2023年6月4日
00124
SPSS多选题数据如何录入与分析？——SPSS多重响应分析的详细讲解

SPSS学习记录day5 写在前面：今天我们讲解多重响应分析的有关内容分析>多重响应关于多重响应（Multiple Response），多重可以理解为多选，即对通过多选…

人工智能 2023年6月19日
00285
自回归模型的建模与参数估计-Python

AR§模型的参数估计设{X t X_t X t }适合X t = a 1 X t − 1 + ⋯ + a p X t − p + ϵ t X_t=a_1X_{t-1}+\cdo…

人工智能 2023年6月17日
0082
梯度下降算法(Gradient descent)

首先，我们需要明确梯度下降就是求一个函数的最小值，对应的梯度上升就是求函数最大值。简而言之：梯度下降的目的就是求函数的极小值点，例如在最小化损失函数或是线性回归学习中都要用到梯度…

人工智能 2023年7月4日
0082
Python学习DAY4|Pandas库的使用方法

本笔记摘录清华大学工业工程系朱成礼老师的python教案与授课内容，并在此基础上进行实操性的拓展，希望能对大家有所帮助。零、简介 DataFrame是一个二维数据结构，既有行索…

人工智能 2023年7月7日
0071
如何确保模型在部署后的性能、准确度和稳定性

如何确保模型在部署后的性能、准确度和稳定性在将机器学习模型部署到实际应用中时，我们希望模型能够保持良好的性能、准确度和稳定性。本文将详细介绍如何确保模型在部署后能够达到这些要求，…

人工智能 2024年1月3日
0039

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31