打开txt报错_python(pandas)读取外部数据使用Pandas读写操作txt文件

2023年8月21日下午7:06 • Python • 阅读 100

1、准备.txt的数据文件

打开txt报错_python(pandas)读取外部数据使用Pandas读写操作txt文件

其实pandas读写.txt文件和读写csv文件是类似的，而且使用的都是pd.read_csv() / df.to_csv()

2、pandas.read_csv()语法：

pandas.read_csv(filepath_or_buffer, sep=’, ‘, delimiter=None, header=’infer’, names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression=’infer’, thousands=None, decimal=b’.’, lineterminator=None, quotechar='”‘, quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)
常用参数解释：
filepath_or_buffer #需要读取的文件及路径
sep=’,’ # 以，为数据分隔符
shkiprows= 10 # 跳过前十行
nrows = 10 # 只去前10行
usecols=[0,1,2,…] #需要读取的列，可以是列的位置编号，也可以是列的名称
parse_dates = [‘col_name’] # 指定某行读取为日期格式
index_col = [‘col_1′,’col_2’] # 读取指定的几列
error_bad_lines = False # 当某行数据有问题时，不报错，直接跳过，处理脏数据时使用
na_values = ‘NULL’ # 将NULL识别为空值
encoding=’utf-8′ #指明读取文件的编码，默认utf-8

3、使用Pandas读取用英文逗号”,”分隔的.txt文件，sep=’,’可以省略

小心编码问题：

import numpy as npimport pandas as pddf = pd.read_csv(r"e:\text01.txt",encoding='ANSI')# df = pd.read_csv(r"e:\text01.txt",sep=',' ,encoding='utf-8')print(df) >>&#x7ED3;&#x679C;&#xFF1A;      &#x7F16;&#x53F7;         &#x59D3;&#x540D;   &#x804C;&#x4E1A;  &#x5730;&#x5740;0   1001      jalen  &#x8BA1;&#x7B97;&#x673A;  &#x8D35;&#x5DDE;1   1002         xr   &#x8FD0;&#x8425;  &#x8D35;&#x5DDE;...

上面的代码就读取了整个text01.txt的数据，需要注意的是编码转换问题，你读取的时候encoding必须一致，你也可以打开文档–另存为–修改编码为utf-8指定的编码格式。

import numpy as npimport pandas as pddf = pd.read_csv(r"e:\text01.txt",encoding='utf-8')# df = pd.read_csv(r"e:\text01.txt",sep=',' ,encoding='utf-8')print(df)

4、使用Pandas读取其他分割符的.txt文件，sep=’分隔符’写清楚

同样注意编码保持一致

import numpy as npimport pandas as pddf = pd.read_csv(r"e:\text02.txt",sep=' ' ,encoding='utf-8')print(df) >>&#x7ED3;&#x679C;&#xFF1A;   &#x7F16;&#x53F7;  &#x5730;&#x5740;0   1  &#x8D35;&#x5DDE;1   2  &#x5E7F;&#x4E1C;2   3  &#x676D;&#x5DDE;3   4  &#x6E56;&#x5317;

5、使用Pandas读取.txt文件指定的行和列

import numpy as npimport pandas as pd#&#x8BFB;&#x7684;&#x6587;&#x4EF6;&#xFF1B;&#x8BFB;&#x53D6;&#x7B2C;0&#xFF0C;1&#xFF0C;3&#x5217;&#xFF1B;&#x4E0D;&#x8BFB;&#x524D;&#x4E24;&#x884C;&#xFF0C;&#x7136;&#x540E;&#x8BFB;3&#x884C;&#xFF1B;&#x5FFD;&#x7565;&#x5217;&#x540D;&#xFF1B;&#x7F16;&#x7801;df = pd.read_csv(r"e:\text01.txt",sep=',',usecols=[0,1,3],skiprows=2,nrows=3,header=None,encoding='utf-8')print(df) >> &#x7ED3;&#x679C;&#xFF1A;      0     1   30  1002    xr  &#x8D35;&#x5DDE;1  1003  lili  &#x8D35;&#x5DDE;2  1004  nini  &#x5E7F;&#x4E1C;

6、使用Pandas写入.txt文件

写入csv文件是最常用的，csv文件默认用’,’作为分隔符。
语法：
df.to_csv(path_or_buf=None, sep=’,’, na_rep=”, float_format=None, columns=None, header=True, index=True, index_label=None, mode=’w’, encoding=None)
常用参数说明：
path_or_buf：文件名、文件具体、相对路径、文件流等
sep：文件分割符号，to_csv()的sep默认为’,’，可指定任意字符作为分隔符
na_rep：将NaN转换为特定值。写入时NaN会被表示为空字符串，我们可能希望用其他值代替，如：’- ‘、’/’、’NULL’ 等
columns：选择部分列写入。保留部分列且按列排序，columns=[‘B列列名’,’A列列名’]
header：忽略列名，header=None 不写入列名
index：index=False 表示选择不写入索引

import numpy as npimport pandas as pd #&#x8BFB;&#x53D6;text01.txt&#x6307;&#x5B9A;&#x7684;&#x6570;&#x636E;df = pd.read_csv(r"e:\text01.txt",sep=',',usecols=['&#x7F16;&#x53F7;','&#x59D3;&#x540D;','&#x5730;&#x5740;'],nrows=3,encoding='utf-8')print(df) #&#x5C06;df&#x5199;&#x5165;.txt&#x6587;&#x4EF6;df.to_csv(r"e:\text03.txt",sep=",",columns=['&#x7F16;&#x53F7;','&#x59D3;&#x540D;','&#x5730;&#x5740;'],index=False,encoding='utf-8')print("&#x5199;&#x5165;&#x6210;&#x529F;") #&#x518D;&#x8BFB;&#x53D6;&#x9A8C;&#x8BC1;text03.txtdf3 = pd.read_csv(r"e:\text03.txt",sep=",",encoding='utf-8')print(df3) >>&#x7ED3;&#x679C;&#xFF1A;     &#x7F16;&#x53F7;     &#x59D3;&#x540D;  &#x5730;&#x5740;0  1001  jalen  &#x8D35;&#x5DDE;1  1002     xr  &#x8D35;&#x5DDE;2  1003   lili  &#x8D35;&#x5DDE;&#x5199;&#x5165;&#x6210;&#x529F;     &#x7F16;&#x53F7;     &#x59D3;&#x540D;  &#x5730;&#x5740;0  1001  jalen  &#x8D35;&#x5DDE;1  1002     xr  &#x8D35;&#x5DDE;2  1003   lili  &#x8D35;&#x5DDE;

python连接操作Oracle数据库

Original: https://blog.csdn.net/weixin_39714015/article/details/112501276
Author: weixin_39714015
Title: 打开txt报错_python(pandas)读取外部数据使用Pandas读写操作txt文件

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/755988/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

软件测试 git和gitee集成Pycharm 基于Flask的Mock Server服务器

文章目录 * – 1 Git – + 1.1 作用 + 1.2 工具 + 1.3 名称解释 – 2 安装git和注册Gitee – …

Python 2023年8月15日
0064
python去掉人像白边_python 使用plt画图,去除图片四周的白边方法

用matplotlib.pyplot画的图，显示和保存的图片周围都会有白边，可以去掉。为了显示的更清楚，给图片加了红色的框 import matplotlib.pyplot as …

Python 2023年9月6日
0042
pandas 中的dataframe

if df.empty: print(‘休息天，pass’) break pd.isnull()，pd.notnull()，np.isnan()，pd.notna()，pd.isn…

Python 2023年8月18日
0043
用python摸鱼一个益智游戏，今天又是一个开摆的一天~

嗨害大家好鸭！我是小熊猫❤ 如何当一个合格的摸鱼打工人呢~ 今天来用python简单摸个鱼~做一个益智游戏 ~ ; 准备一下软件环境，咱们还是用python和pycharm即可。…

Python 2023年9月19日
0057
linux一切皆文件之tcp socket描述符（三）

一、知识准备 1、在linux中，一切皆为文件，所有不同种类的类型都被抽象成文件（比如：块设备，socket套接字，pipe队列）2、操作这些不同的类型就像操作文件一样，比如增删改…

Python 2023年6月10日
0069
Python3,我把新年祝福写在“雨“中，你看，雨一直下，气氛还算融洽，在同个屋檐下….

新年愿望写在”雨”中 1、引言 2、代码实战 * 2.1 模块介绍 – 2.1.1 Pygame 介绍 2.1.2 Pygame的display…

Python 2023年11月5日
0053
Halcon 快速入门教程

文章首发于我的 github 仓库-cv算法工程师成长之路，欢迎关注我的公众号-嵌入式视觉。本人水平有限，文章如有问题，欢迎及时指出。如果看完文章有所收获，一定要先点赞后收藏。毕竟…

Python 2023年10月28日
0053
python＞＞numpy包

章节内容什么是NumPy模块和NumPy数组创建数组基本数据类型数据可视化索引和切片副本和视图目录什么是NumPy模块和NumPy数组？创建数组基本数据类型数据可视化索…

Python 2023年8月23日
0061
Pandas之数据结构解析——Series的介绍

作为数据分析师，在日常生活中我们会接触到各种各样的需求，其中excel更必不可少，面对庞大数据量，快速的需求我们该如何处理，这时Pandas就显得举足轻重，可以快速有效的处理表格数…

Python 2023年8月19日
0039
vue+django+postgres前后端分离项目——部署至centos7.6（腾讯云服务器

数据库postgresql14 在官网上跟着命令下载 Postgresql14 sudo yum install -y https://download.postgresql.or…

Python 2023年8月3日
0048
数据分析与可视化（四）Pandas学习基础一：统计分析基础

文章目录 * – 1. pandas的数据结构 – + * series：一维数组对象，通过索引来访问 * DataFrame：有一组有序的列，表格型的数据…

Python 2023年8月20日
0051
史上最全最详细python绘图手册（看我就够）——Matplotlib绘图详解

包的引入不引入当然用不了💦 import matplotlib print(matplotlib.__version__) PyPlot 大多数Matplotlib实用程序都位于…

Python 2023年8月30日
0046
python绘制风玫瑰图_用Python matplotlib 怎么画风向玫瑰图能给出程序的

推荐答案 python安装(之前写过一篇关于python的安装，这里不重复介绍) (1) 如何下载？百度—> Python官网 (2) 版本：python-3.4…

Python 2023年9月4日
0032
基于强化学习的测试日志智能分析实践

摘要：测试日志智能分析是提升智能化测试效率的一个关键步骤。随着软件规模的不断扩增，加快测试时间降低成本、实现智能化测试是至关重要的，而测试日志智能分析是提升智能化测试效率的一个关…

Python 2023年10月29日
0046
pymongo基础使用方法

1.客户端初始化初始化MongoDB客户端 client = pymongo.MongoClient(‘localhost’,27017 ) 2.创建数据…

Python 2023年6月12日
0071
网易翻译爬虫/反爬虫

-*- coding: utf-8 -*- @Author : LEHOSO @FileName: CrawlerTranslation.py @Time : 2021/9/28 …

Python 2023年6月3日
0067

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31