使用Python对xlsx，csv, txt格式文件进行读、写并绘图

2023年7月7日上午6:30 • 人工智能 • 阅读 48

0. 背景

最近需要用到python通过读取，写入Excel数据，并画一些图。虽然以前学过一些，但是都忘得差不多了，故翻出以前学习的资料，整理在此，常用常新，也方便自己以后复习。

1. 通过pandas库在Python里写入数据到Excel，并生成本地文件（001）

代码：

import pandas as pd

df = pd.DataFrame({'ID':(1,2,3),'Name':('Tim','Victor','Nick')})
df = df.set_index('ID')
df.to_excel('D:/py学习/Python_EXCEL/output.xlsx')
print('Done!')

输出样式:

通过pandas库读取本地Excel文件，并直接在Python里显示（002）

代码：

import pandas as pd

Incites = pd.read_excel('D:/py学习/Python_EXCEL/Incites.xlsx')
print(Incites.shape)
print(Incites.columns)
print(Incites.head(3))
print('========================')
print(Incites.tail(3))

输出样式:

通过pandas库在Python里写多行多列数据的格式（不生成本地文件）（003）

代码：

import pandas as pd

s1 = pd.Series([1,2,3],index = [1,2,3],name = 'A')
s2 = pd.Series([10,20,30],index = [1,2,3],name = 'B')
s3 = pd.Series([100,200,300],index = [2,3,4],name = 'C')

df = pd.DataFrame({s1.name:s1,s2.name:s2,s3.name:s3})

print(df)

输出样式:

通过pandas将本地Excel中的数据排序，分类，并直接在Python里显示（007）

代码：

import pandas as pd

products = pd.read_excel('D:/py学习/Python_EXCEL/List.xlsx', index_col='ID')

products.sort_values(by=['Worthy', 'Price'], inplace=True, ascending=[True, False])
print(products)

输出样式:

通过pandas库在Python实现对本地Excel中数值大小范围的筛选，将直接在Python里显示（不保存到原Excel文件）（008）

初始数据：

对学生的Age（18-30）和分数（85-100）两个参数进行筛选。

代码：

import pandas as pd

def age_18_to_30(a):
    return a>=18 and a30

def level_a(s):
    return s>=85 and s100

students = pd.read_excel('D:/py学习/Python_EXCEL/Students.xlsx', index_col='ID')

students = students.loc[students['Age'].apply(age_18_to_30)].loc[students['Score'].apply(level_a)]

print(students)

输出样式:

通过pandas库读取本地Excel文件，并通过matplotlib在Python里画出柱形图（bar_chart）（009）

原数据：

将该数据画成直方图

代码：

import pandas as pd
import matplotlib.pyplot as plt

students = pd.read_excel('D:/py学习/Python_EXCEL/Res_areas.xlsx')
students.sort_values(by='Documents_number', inplace=True, ascending=False)
print(students)

plt.bar(students.Name, students.Documents_number, color='orange')
plt.xticks(students.Name, rotation='90')
plt.xlabel('Name')
plt.ylabel('Documents_number')
plt.title('Wos of Science Res_areas')
plt.tight_layout()
plt.show()

输出样式:

通过pandas库读取本地Excel文件，并通过matplotlib在Python里画出双柱形图（double_bar_chart）（010）

原数据：

将该数据画成双柱形图

代码：

import pandas as pd
import matplotlib.pyplot as plt

students = pd.read_excel('D:/py学习/Python_EXCEL/Res_areas_double.xlsx')
students.sort_values(by='2021', inplace=True, ascending=False)
print(students)
students.plot.bar(x='Res_areas', y=['2020', '2021'], color=['orange','r' ])
plt.title('Wos of Science Res_areas',fontsize=16,fontweight='bold')
plt.xlabel('Res_areas', fontweight='bold')
plt.ylabel('Documents_number', fontweight='bold')
ax = plt.gca()
ax.set_xticklabels(students['Res_areas'], rotation='45', ha='right')
f = plt.gcf()
f.subplots_adjust(left=0.2,bottom=0.45)

plt.show()

输出样式:

8. 通过pandas库读取本地Excel文件，并通过matplotlib在Python里画出堆叠柱形图(stacked_chart)（011）

原数据：

将该数据画成堆叠柱形图

代码：

import pandas as pd
import matplotlib.pyplot as plt

users = pd.read_excel('D:/py学习/Python_EXCEL/Users.xlsx')
users['Total'] = users['Oct'] + users['Nov'] + users['Dec']
users.sort_values(by='Total', inplace=True, ascending=True)
print(users)

users.plot.barh(x='Name', y=['Oct', 'Nov', 'Dec'], stacked=True, title='User Behavior')

plt.tight_layout()
plt.show()

输出样式:

9. 通过pandas库读取本地Excel文件，并通过matplotlib在Python里画出饼图（piechart）（012）

原数据：

将该数据画成饼图

代码：

import pandas as pd
import matplotlib.pyplot as plt

papers = pd.read_excel('D:/py学习/Python_EXCEL/papers.xlsx', index_col='国家/地区')
print(papers)

papers['2020'].plot.pie(fontsize=8, counterclock=False, startangle=-270)

plt.title('Source of Web of Science Papers', fontsize=16, fontweight='bold')
plt.ylabel('2020', fontsize=12, fontweight='bold')
plt.show()

输出样式:

10. 通过pandas库读取本地Excel文件，并通过matplotlib在Python里画出堆积图(stacked_area_chart)（013）

原数据：

; 10.1 将该数据画成堆积图

代码：

import pandas as pd
import matplotlib.pyplot as plt

years = pd.read_excel('D:/py学习/Python_EXCEL/Years.xlsx', index_col='Year')
print(years)
print(years.columns)

years.plot.area(y=['USA', 'China', 'UK'])

plt.title('Source of Country', fontsize=16, fontweight='bold')
plt.ylabel('Number of Papers', fontsize=12, fontweight='bold')
plt.xticks(years.index, fontsize=8, rotation='45', ha='right')
plt.show()

输出样式:

10.1 将该数据画成折线图（区别只在代码第8行plot少了.area）

代码：

import pandas as pd
import matplotlib.pyplot as plt

years = pd.read_excel('D:/py学习/Python_EXCEL/Years.xlsx', index_col='Year')
print(years)
print(years.columns)

years.plot.area(y=['USA', 'China', 'UK'])

plt.title('Source of Country', fontsize=16, fontweight='bold')
plt.ylabel('Number of Papers', fontsize=12, fontweight='bold')
plt.xticks(years.index, fontsize=8, rotation='45', ha='right')
plt.show()

输出样式:

11. 通过pandas库读取本地Excel文件，并通过matplotlib在Python里画出散点图(Bar_chart)（011）

原数据：

将该数据第二三列前五行画成散点图

代码：

import pandas as pd
import matplotlib.pyplot as plt

pd.options.display.max_columns = 777
names = pd.read_excel('C:/Users/WJ/Desktop/Python_EXCEL/Names.xlsx')
print(names.head())

names.plot.scatter(x='Documents', y='Times_cited')
plt.show()

输出样式:

12. 通过pandas库读取本地Excel文件，并通过matplotlib在Python里画出直方图(Histogram)（015）

注：关于直方图和柱形图的差别如下：
直方图一般用来描述等距数据或等比数据；柱形图一般用来描述称名数据或顺序数据。. 直观上，直方图矩形之间是衔接在一起的，表示数据间的数学关系；柱形图则留有空隙，表示仅作为两个或多个不同的类，而不具有数学相关性质。

原数据：

将该数据第二三列前五行画成直方图

代码：

import pandas as pd
import matplotlib.pyplot as plt

pd.options.display.max_columns = 777
names = pd.read_excel('D:/py学习/Python_EXCEL/Names.xlsx')
print(names.head())

names.Times_cited.plot.hist(bins=100)
plt.xticks(range(0, max(names.Times_cited), 500), fontsize=8, rotation=90)

print(names.corr())

plt.tight_layout()
plt.show()

输出样式:

13. 通过pandas库读取本地Excel文件，并在Python将其转置输出（021）

原数据：

将该数据第二三列前五行画成散点图

代码：

import pandas as pd

pd.options.display.max_columns=999
videos = pd.read_excel('D:/py学习/Python_EXCEL/Videos.xlsx', index_col='Month')
table = videos.transpose()
print(table)

输出样式:

14. 通过pandas库读取本地csv格式文件，并在Python将其输出（022）

原数据：

代码：

import pandas as pd

pd.options.display.max_columns=999

students1 = pd.read_csv('D:/py学习/Python_EXCEL/Incites_Pulication.csv')
print(students1)

输出样式:

15. 通过pandas库读取本地csv格式文件，并在Python将其输出（022）

原数据：

代码：

import pandas as pd

pd.options.display.max_columns=999

students2 = pd.read_csv('D:/py学习/Python_EXCEL/info.txt')
print(students2)

输出样式:

15. 通过pandas库读取本地csv格式文件，再通过scipy库对数据进行线性回归分析，并用matplotlib在Python将其输出（022）

原数据：

代码：

import pandas as pd
import matplotlib.pyplot as plt
from scipy.stats import linregress

num = pd.read_excel('D:/py学习/Python_EXCEL/Trendency.xlsx')
print(num)

slope, intercept, r, p, std_err=linregress(num.Year, num.USA)

exp = num.Year*slope+intercept

plt.scatter(num.Year, num.USA)
plt.plot(num.Year, exp, color='orange')
plt.title(f"y={slope}*x+{intercept}")
plt.xticks(num.Year,  rotation=90)
plt.tight_layout()
plt.show()

print(slope*35+intercept)

输出样式:

Original: https://blog.csdn.net/weixin_46915208/article/details/124061914
Author: 学吧学无止境
Title: 使用Python对xlsx，csv, txt格式文件进行读、写并绘图

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/675669/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

语义分割、实例分割

在cv领域，会经常见到”语义分割”、”实例分割”这两个名词，本文就来解释下他们分别是什么意思，又有什么区别。以下的图部分借用自知乎…

人工智能 2023年5月28日
0075
UI绘制流程_具体绘制(Draw,绘制流程)

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月30日
0090
实验三：CART分类决策树python实现（两个测试集）（一）|机器学习

目录 * – python实现 – + 分步 + 源代码（全部） – 测试集1（鸢尾花集） – 测试集2（红酒品类数据集） &#82…

人工智能 2023年6月16日
0077
Hadoop 综合揭秘——MapReduce 基础编程（介绍 Combine、Partitioner、WritableComparable、WritableComparator 使用方式）

前言本文主要介绍 MapReduce 的原理及开发，讲解如何利用 Combine、Partitioner、WritableComparator等组件对数据进行排序筛选聚合分组的功…

人工智能 2023年6月4日
0091
OpenMV入门

1. 什么是OpenMV OpenMV 是一个开源，低成本，功能强大的机器视觉模块。 OpenMV上的机器视觉算法包括寻找色块、人脸检测、眼球跟踪、边缘检测、标志跟踪等。以S…

人工智能 2023年7月30日
0053
基于wine葡萄酒数据集的分类方法研究

目录一、问题阐述 1.1、数据集信息 1.2、可解决的问题二、设计目的三、实验需要的平台四、基本原理分析 4.1、逻辑回归算法基本原理 4.2、支持向量机算法的基本原理五…

人工智能 2023年7月3日
0075
【毕业设计】大数据-实时疫情数据可视化项目 – flask python

1 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求…

人工智能 2023年7月5日
0087
03_Cypher之核心语法

文章目录 Cypher介绍 * Neo4j模式 (Pattern) 初始化数据几个重要的函数基于Where数据过滤 * 约束查询者与被查询者查询二度人脉按关系的类型进行过滤…

人工智能 2023年6月10日
0064
Python基础练习题，含答案解析

大家好，我是辣条。今天给大家整理一些Python练习题【含答案解析】，可以自己先尝试做一下，再和文末的答案解析核对，希望能帮助到你。练习题 1.使用字符串的格式化输出完成以下名…

人工智能 2023年7月5日
00103
树莓派深度学习系统镜像，包含opencv、pytorch、tensorflow、pytorch_lightning、tflite等

纯净树莓派镜像，基于官方Raspberry Pi OS (64 bit)——”raspios_arm64-2021-05-28“，适用Raspberry P…

人工智能 2023年5月24日
0088
主成分分析法(PCA)及其python实现

主成分分析法（Principal Component Analysis，PCA）是一种用于把高维数据降成低维，使分析变得更加简便的分析方法。比如我们的一个样本可以由n n n维随机…

人工智能 2023年7月4日
0093
如何处理缺失值

人工智能 2024年1月2日
0022
MATLAB实现智能计算方法实验：实验二模糊控制仿真实验

资源链接 MATLAB实现智能计算方法课程所有实验代码资源链接为：MATLAB实现智能计算方法课程所有实验代码资源实验汇总 MATLAB实现智能计算方法课程所有实验汇总博客链接为…

人工智能 2023年6月25日
0074
Pandas统计分析中（数据计算、数据格式化、数据分组统计、数据移位、数据转换、数据合并、数据导出）

本篇博文来自《Python数据分析从入门到精通》_明日科技编著相信经过第3章的学习，您已经了解Pandas了，那么本章开始进行Pandas进阶，对Pandas相关技术进一步加深讲…

人工智能 2023年7月6日
0072
Meta Faster R-CNN：基于注意力特征对齐的小样本目标检测

论文标题： Meta Faster R-CNN: Towards Accurate Few-Shot Object Detection with Attentive Feature…

人工智能 2023年7月10日
0068
旋转框目标检测————关于旋转框定义和解决方案

百度云盘分享简介笔者当初为了学习JAVA，收集了很多经典源码，源码难易程度分为初级、中级、高级等，详情看源码列表，需要的可以直接下载！这些源码反映了那时那景笔者对未来的盲目，…

人工智能 2023年6月19日
00123

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

使用Python对xlsx，csv, txt格式文件进行读、写并绘图

0. 背景

1. 通过pandas库在Python里写入数据到Excel，并生成本地文件（001）

8. 通过pandas库读取本地Excel文件，并通过matplotlib在Python里画出堆叠柱形图(stacked_chart)（011）

9. 通过pandas库读取本地Excel文件，并通过matplotlib在Python里画出饼图（piechart）（012）

10. 通过pandas库读取本地Excel文件，并通过matplotlib在Python里画出堆积图(stacked_area_chart)（013）

; 10.1 将该数据画成堆积图

10.1 将该数据画成折线图（区别只在代码第8行plot少了.area）

11. 通过pandas库读取本地Excel文件，并通过matplotlib在Python里画出散点图(Bar_chart)（011）

12. 通过pandas库读取本地Excel文件，并通过matplotlib在Python里画出直方图(Histogram)（015）

13. 通过pandas库读取本地Excel文件，并在Python将其转置输出（021）

14. 通过pandas库读取本地csv格式文件，并在Python将其输出（022）

15. 通过pandas库读取本地csv格式文件，并在Python将其输出（022）

15. 通过pandas库读取本地csv格式文件，再通过scipy库对数据进行线性回归分析，并用matplotlib在Python将其输出（022）

大家都在看