Python学习笔记#1：使用genfromtxt读取txt中数据

2023年8月26日上午2:16 • Python • 阅读 118

Python学习笔记#1：使用genfromtxt读取txt中数据

1. 语法：

numpy.genfromtxt(fname, dtype=

从文本文件加载数据，缺失值按指定处理。

前 skip_header 行之后的每一行都在分隔符处拆分，注释字符之后的字符将被丢弃。

2. 参数：

fname：文件、str、pathlib.Path、str 列表、生成器
要读取的文件、文件名、列表或生成器。如果文件扩展名是 .gz 或 .bz2 ，则首先解压缩文件。请注意，生成器必须返回字节或字符串。列表中的字符串或由生成器生成的字符串被视为行。

dtype： dtype，可选
结果数组的数据类型。如果为 None，则 dtypes 将由每列的内容单独确定。

comments： str，可选
用于指示注释开始的字符。注释后一行上出现的所有字符都将被丢弃。

delimiter： str、int 或序列，可选
用于分隔值的字符串。默认情况下，任何连续的空格都充当分隔符。也可以提供整数或整数序列作为每个字段的宽度。

skiprows：整数，可选
在 numpy 1.10 中删除了 skiprows。请改用skip_header。

skip_header：整数，可选
在文件开头要跳过的行数。

skip_footer：整数，可选
在文件末尾要跳过的行数。

converters：可变的，可选的
将列的数据转换为值的一组函数。转换器还可用于为缺失数据提供默认值：converters = {3:lambda s:float(s or 0)}。

missing：可变的，可选的
在 numpy 1.10 中删除了缺失。请改用missing_values。

missing_values：可变的，可选的
对应于缺失数据的字符串集。

filling_values：可变的，可选的
缺少数据时用作默认值的一组值。

usecols：顺序，可选
要读取的列，0 是第一个。例如，usecols = (1, 4, 5) 将提取第 2、第 5 和第 6 列。

names： {无，真，str，序列}，可选
如果 names 为 True，则从前 skip_header 行之后的第一行读取字段名称。此行之前可以有选择地使用注释分隔符。如果名称是逗号分隔名称的序列或single-string，则名称将用于定义结构化数据类型中的字段名称。如果名称为无，则将使用 dtype 字段的名称(如果有)。

excludelist：顺序，可选
要排除的名称列表。此列表附加到默认列表 [‘return’,’file’,’print’]。排除的名称后附下划线：例如，file 将变为 file_。

deletechars： str，可选
组合了必须从名称中删除的无效字符的字符串。

defaultfmt： str，可选
用于定义默认字段名称的格式，例如 “f%i” 或 “f_%02i”。

autostrip：布尔型，可选
是否自动从变量中去除空格。

replace_space：字符，可选
用于替换变量名中的空格的字符。默认情况下，使用’_’。

case_sensitive： {真，假，’upper’, ‘lower’}，可选
如果为 True，则字段名称区分大小写。如果为 False 或 ‘upper’，则字段名称将转换为大写。如果’lower’，字段名称将转换为小写。

unpack：布尔型，可选
如果为 True，则返回的数组被转置，以便可以使用 x, y, z = genfromtxt(…) 解包参数。当与结构化数据类型一起使用时，将为每个字段返回数组。默认为假。

usemask：布尔型，可选
如果为 True，则返回一个掩码数组。如果为 False，则返回一个常规数组。

loose：布尔型，可选
如果为 True，则不要为无效值引发错误。

invalid_raise：布尔型，可选
如果为 True，如果在列数中检测到不一致，则会引发异常。如果为 False，则会发出警告并跳过有问题的行。

max_rows：整数，可选
要读取的最大行数。不得与skip_footer 同时使用。如果给定，该值必须至少为 1。默认是读取整个文件。

encoding： str，可选
用于解码输入文件的编码。当 fname 是文件对象时不适用。特殊值 ‘bytes’ 启用向后兼容解决方法，确保您在可能的情况下接收字节数组并将 latin1 编码的字符串传递给转换器。覆盖此值以接收 unicode 数组并将字符串作为输入传递给转换器。如果设置为无，则使用系统默认值。默认值为’bytes’。

like： array_like
引用对象以允许创建不是 NumPy 数组的数组。如果作为like 传入的array-like 支持__array_function__ 协议，则结果将由它定义。在这种情况下，它确保创建一个与通过此参数传入的对象兼容的数组对象。

3. 实例

txt文件：（test.in）
a b c d e f
1 2 3 4 5 6
2 3 4 5 6 7
3 4 5 6 7 8
4 5 6 7 8 9
5 6 7 8 9 0
6 7 8 9 0 1
7 8 9 0 1 2
8 9 0 1 2 3
9 0 1 2 3 4
0 1 2 3 4 5

程序：
test.py

!/usr/bin/env python3

# – – coding: utf-8 ––
import numpy as np

data = np.genfromtxt(‘test.in’, delimiter = ”, names=True)

print(data.dtype.names)

print(data)

a = data[‘a’]
b = data[‘b’]
c = data[‘c’]
d = data[‘d’]
e = data[‘e’]
f = data[‘f’]

print(a)

sel_ns=[(a>1)
& (b>1)
& (c>1)
& (d>1)
& (e>1)
& (f>1)
]

print(sel_ns)

a_f = a[tuple(sel_ns)]

print(a_f)

运行结果：

从运行结果可以清晰地分析出genfromtxt的用法。

Original: https://blog.csdn.net/yukuaidere/article/details/126837978
Author: yukuaidere
Title: Python学习笔记#1：使用genfromtxt读取txt中数据

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/759854/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

盘点 Python 中字符串的常用操作，对新手极度友好

在 Python 中字符串的表达方式有四种一对单引号一对双引号一对三个单引号一对三个双引号a = ‘abc’b= “abc”c =…

Python 2023年8月29日
0044
Entity Framework Core 7中高效地进行批量数据插入

因为之前的版本中，EF Core无法实现高效地批量插入、修改、删除数据，所以我开发了Zack.EFCore.Batch这个开源项目，比较受大家的欢迎，获得了400多个star。从…

Python 2023年10月13日
00100
pandas|DataFrame.append

文章目录 * – + 1. append dict + 2. append series + 3. append list + 4. append array + 5….

Python 2023年8月7日
0054
C++模板(初阶)

本章主要讲解三个部分：泛型编程、函数模板、类模板目录泛型编程函数模板函数模板概念函数模板的格式函数模板的原理函数模板的实例化隐式实例化显式实例化模板参数的匹配…

Python 2023年9月26日
0034
手把手带你进入爬虫的世界，打好基础，走的更远

您好，我是码农飞哥，感谢您阅读本文，欢迎一键三连哦。本文是爬虫专栏的第一篇，重点介绍爬虫的基本概念，提供一个爬虫的标准步骤。干货满满，建议搜集，需要经常查看。如果您有任何问题和需求…

Python 2023年5月25日
0060
Numpy *****

名称描述object数组或嵌套的数列dtype数组元素的数据类型，可选copy对象是否需要复制，可选 order 创建数组的样式，C为行方向，F为列方向，A为任意方向（默认）sub…

Python 2023年8月29日
0041
用python画钢铁侠_Matplotlib绘制漫威英雄战力图，带你飞起来！

前言我们平常玩游戏或者看电影的时候，会看到里面介绍各种人的能力指标，以百度百科提供的漫威人物能力数值为例，如下图分别介绍了各个超级英雄的智力、力量、速度、耐力、能量发射、战斗技…

Python 2023年9月5日
00116
pytest实战练习

pytest是单元测试框架，用作代码层测试的框架。简单、易用，很多大型开源测试框架如appium、httprunner框架也基于它实现。网页、手机应用以及接口等测试都支持，也就是p…

Python 2023年9月9日
0040
1839. 所有元音按顺序排布的最长子字符串

所有元音按顺序排布的最长子字符串题目描述当一个字符串满足如下条件时，我们称它是美丽的：所有 5 个英文元音字母（’a’ ，’e&#82…

Python 2023年6月12日
0059
【python】python+numpy模块读、写raw图并使用opencv显示图片

参考链接：使用Python读取raw格式图像并显示 NumPy 数据类型 python对raw图的操作，读取raw图、保存raw图，raw10转raw8操作。大概用到以下函数：…

Python 2023年8月26日
0059
jupyter中subplots_adjust()调整子图大小无效、子图溢出和日期标签遮挡坐标轴刻度的问题解决

jupyter中subplots_adjust调整子图大小无效、子图溢出和日期标签遮挡坐标轴刻度的问题解决 * – + 解决在jupyter中使用subplots_ad…

Python 2023年9月5日
0039
python模拟投掷色子并做出数据可视化统计图

这里讲解模拟掷色子，并实现数据可视化的操作。数据可视化可以帮助我们更好地分析相关的统计结果，获得更为直观的统计图，帮组我们更好的处理一些事情。可视化的终极目标是洞悉蕴含在数据中的现…

Python 2023年8月26日
0061
【pytest官方文档】解读- 开发可pip安装的第三方插件

在上一篇的 hooks 函数分享中，开发了一个本地插件示例，其实已经算是在编写插件了。今天继续跟着官方文档学习更多知识点。一个插件包含一个或多个钩子函数，pytest 正是通过调…

Python 2023年10月17日
0054
python-pandas 数据提取笔记

数据抽取以列名(columns）和行名(index)作为参数.当只有一个参数时，默认是行名,即抽取整行数据,包括所有列。以行和列位置索引(即:0,1,2…）作为参数…

Python 2023年8月19日
0039
【数学建模学习笔记【集训十天】之第九天】

数模学习目录 Pandas 学习（续） * Pandas Json – json 读取-1 + * 文件准备运行结果如下：直接处理 json-2 + 运行结果如下：…

Python 2023年8月23日
0085
Pandas-04（缺失数据、分组、合并连接、级联）

1.缺失数据 1.1 isnull()和notnull()检测缺失数据 1.2 fillna()填充缺失值 1.3 删除NaN的行 1.4 replace()替换丢失的值或者通用值…

Python 2023年8月17日
0058

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Python学习笔记#1：使用genfromtxt读取txt中数据

!/usr/bin/env python3

大家都在看