pandas创建及读取excel文件

2023年8月8日上午4:00 • Python • 阅读 55

将DataFrame数据写入excel文件。
没有限制时，会自动添加index。
用字典创建时的key则自动为column。
如果想去掉自动生成的index，可以用set_index指定，但不会改变原df。如果想要改变，使用inplace参数。

import pandas as pd
file = r"D:\xlsx\test1.xlsx"
df1 = pd.DataFrame({"ID": ["a", "b", "c"], "name": ["Lucy", "Jim", "Lily"], "score": [70, 80, 90]})
print(df1)
df1.to_excel(file)

  ID  name  score
0  a  Lucy     70
1  b   Jim     80
2  c  Lily     90

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ialhr6fy-1661600614670)(attachment:image.png)]

df1 = df1.set_index("ID")
print(df1)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RaHVqYbh-1661600614673)(attachment:image.png)]

df1 = pd.DataFrame({"ID": ["a", "b", "c"], "name": ["Lucy", "Jim", "Lily"], "score": [70, 80, 90]})
df1.set_index("ID", inplace=True)
print(df1)

当从excel读取文件时，也会自动在生成的数据上加index。

import pandas as pd
file_src = r"D:\xlsx\test1.xlsx"
file_dst = r"D:\xlsx\test2.xlsx"
df1 = pd.read_excel(file_src)
print(df1)

  ID  name  score
0  a  Lucy     70
1  b   Jim     80
2  c  Lily     90

查看行列及前后几行

df1.head(2)

IDnamescore0aLucy701bJim80

df1.tail(2)

IDnamescore1bJim802cLily90

df1.shape

(3, 3)

数据header不是excel的第一行

使用header指定第几行，注意excel的第一行对应的header为0

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BttICNzc-1661600614674)(attachment:image.png)]

df1 = pd.read_excel(file_src,header=1)
df1.columns

Index(['ID', 'name', 'score'], dtype='object')

数据无header

在读取时header指定为None，使用columns指定header
在读取时，使用names指定

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-H4CSL6m2-1661600614675)(attachment:image.png)]


df1 = pd.read_excel(file_src, header=None)
df1.columns = ["ID", "name", "score"]
df1.columns

Index(['ID', 'name', 'score'], dtype='object')


df1 = pd.read_excel(file_src, names=["ID", "name", "score"])
df1.columns

Index(['ID', 'name', 'score'], dtype='object')

读入数据时将index删除掉

使用index_col参数设置读入时的index

file_src =  r"D:\xlsx\test2.xlsx"
df1 = pd.read_excel(file_src)
df1

IDnamescore0aLucy701bJim802cLily90

file_src =  r"D:\xlsx\test2.xlsx"
file_dst = r"D:\xlsx\test3.xlsx"
df1 = pd.read_excel(file_src, index_col="ID")
print(df1)
df1.to_excel(file_dst)

读取指定的列

使用usecols指定，可以为数字或者字母，列表或者切片。

指定读取的行数

nrows=数字

file_src =  r"D:\xlsx\test2.xlsx"
df1 = pd.read_excel(file_src, nrows=2, index_col="ID")
print(df1)

    name  score
ID
a   Lucy     70
b    Jim     80

指定跳过的行

skiprows=列表

file_src =  r"D:\xlsx\test2.xlsx"
df1 = pd.read_excel(file_src, skiprows=[1,3], index_col="ID")
print(df1)

   name  score
ID
b   Jim     80

详细可参考 https://editor.csdn.net/md/?articleId=126057819

Original: https://blog.csdn.net/weixin_48668114/article/details/126561674
Author: weixin_48668114
Title: pandas创建及读取excel文件

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/741508/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

SSD目标检测网络解读（含网络结构和内容解读）

SSD实现思路 SSD具有如下主要特点：从YOLO中继承了将detection转化为regression的思路，一次完成目标定位与分类基于Faster RCNN中的Anchor…

Python 2023年6月9日
0080
编程架构演化史：远古时代，从打孔卡（Punched Card）开始

回想读书时记录到书本里的打孔纸带编程，到初学编程接触到的C语言高级编程，再到C++、Java面向对象语言产生；从面向过程系统设计到面向对象系统设计；从三层结构到MVC、MVP、M…

Python 2023年10月19日
0046
pandas中怎么把第一列删掉_Pandas DataFrame行或列的删除方法drop函数

平时在用DataFrame时候，删除操作用的不太多。原数据包含的信息过多，或者生成了新的无用信息行/列，需要从DataFrame中筛选数据，组成一个新的DataFrame再继续操作…

Python 2023年8月6日
00107
python-pandapower电力系统潮流计算（算例8：ieee33节点潮流计算））

本系列讲解电力&#…

Python 2023年8月19日
0040
详解YOLOv5中的Bottleneck

深度学习入门小菜鸟，希望像做笔记记录自己学的东西，也希望能帮助到同样入门的人，更希望大佬们帮忙纠错啦~侵权立删。目录一、背景知识 — 残差结构二、Bottlene…

Python 2023年9月27日
0059
python | 降水数据分析（Ⅰ）绘制全国降水四季分布图

写在前面上次交了作业（全国气温分布图）之后，老师开始让自己摸索处理数据的方法。为了这周先交一个成果上去（已经拖了两周了），决定画一个四季分布图和一个时序图，用两篇文章来记录。下…

Python 2023年9月2日
00187
‘utf-8’ codec can’t decode byte 0xd4 in position 1,invalid continuation byte报错解决办法

读取文件时报错。这是python在读取文件时非常容易遇到的一个编码问题。解决办法是添加 encoding=’ISO-8859-1’。由于ftp下载默认的是…

Python 2023年6月3日
0081
导包问题解决–ImportError: DLL load failed while importing _path: 找不到指定的模块

一、问题反馈在运行某个Python程序时，需要导入numpy和matplotlib包如下： import numpy as np import matplotlib.pyplot…

Python 2023年8月23日
0084
大制作，1500多行python代码实现各大平台音乐搜索，下载，收听

python实现各大平台音乐搜索，下载，收听先上效果图各大平台的歌随便搜，随便听！打包后软件地址：https://wws.lanzoui.com/iosS7rlgzmb 密码: …

Python 2023年9月22日
0045
帮你搞懂什么是Session

目录 1. 什么是Session？ 2. 什么时间考虑使用Session？ 3. 怎么使用Session？ 4. Session的详解： 5. HttpSession与Cookie…

Python 2023年11月7日
0031
学 Python 之前，你该了解这些。

大家好，我是梦雅。很久之前，我写了《零基础入门学习Python》系列，放在了我的原创电子书《Python修炼之道》。《零基础入门学习Python》是我学习之初一边学一边写，回…

Python 2023年9月25日
0039
AttributeError：模块‘scipy.sparse‘没有属性‘coo_array‘ (module ‘scipy.sparse‘ has no attribute ‘coo_array‘)

食用指南：本文参考了2021-6-3前的国内外几乎所有论坛的相关bug解决方案一、bug描述🐛 在做图论的建模的过程中,须要通过无向图判断图的连通性,于是我在参考这篇参考pyth…

Python 2023年8月29日
0067
【Pandas总结】第五节 Pandas 数据查询方法总结_df.loc()总结

文章目录 * – 一、写在前面 – 二、查询方法：df.loc() – + 2.1 查询单个值 + 2.2 查询列表对应的值 + 2.3 查询区…

Python 2023年8月6日
0043
Java多进程测试用例_Pytest xdist/Pytest并行多进程执行测试用例,pytestxdistpytestparallel…

如果想分布式执行用例，用例设计必须遵循以下原则： 1.用例之间都是独立的， 2.用例a不要去依赖用例b 3.用例执行没先后顺序， 4.随机都能执行每个用例都能独立运行成功每个用例都…

Python 2023年9月14日
0052
Python学习笔记

Python pandas库㈢前言一、数据清洗 * ①缺失值处理 – (1)查看缺失值 (2)处理缺失值 ②重复值处理 – (1)查看重复值 (2)处理…

Python 2023年8月19日
0045
联邦聚合(FedAvg、FedProx、SCAFFOLD)

联邦聚合算法对比(FedAvg、FedProx、SCAFFOLD) 论文链接： FedAvg：Communication-Efficient Learning of Deep Ne…

Python 2023年9月15日
0043

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31