Python学习笔记#1：使用genfromtxt读取txt中数据

2023年8月26日上午2:16 • Python • 阅读 110

Python学习笔记#1：使用genfromtxt读取txt中数据

1. 语法：

numpy.genfromtxt(fname, dtype=

从文本文件加载数据，缺失值按指定处理。

前 skip_header 行之后的每一行都在分隔符处拆分，注释字符之后的字符将被丢弃。

2. 参数：

fname：文件、str、pathlib.Path、str 列表、生成器
要读取的文件、文件名、列表或生成器。如果文件扩展名是 .gz 或 .bz2 ，则首先解压缩文件。请注意，生成器必须返回字节或字符串。列表中的字符串或由生成器生成的字符串被视为行。

dtype： dtype，可选
结果数组的数据类型。如果为 None，则 dtypes 将由每列的内容单独确定。

comments： str，可选
用于指示注释开始的字符。注释后一行上出现的所有字符都将被丢弃。

delimiter： str、int 或序列，可选
用于分隔值的字符串。默认情况下，任何连续的空格都充当分隔符。也可以提供整数或整数序列作为每个字段的宽度。

skiprows：整数，可选
在 numpy 1.10 中删除了 skiprows。请改用skip_header。

skip_header：整数，可选
在文件开头要跳过的行数。

skip_footer：整数，可选
在文件末尾要跳过的行数。

converters：可变的，可选的
将列的数据转换为值的一组函数。转换器还可用于为缺失数据提供默认值：converters = {3:lambda s:float(s or 0)}。

missing：可变的，可选的
在 numpy 1.10 中删除了缺失。请改用missing_values。

missing_values：可变的，可选的
对应于缺失数据的字符串集。

filling_values：可变的，可选的
缺少数据时用作默认值的一组值。

usecols：顺序，可选
要读取的列，0 是第一个。例如，usecols = (1, 4, 5) 将提取第 2、第 5 和第 6 列。

names： {无，真，str，序列}，可选
如果 names 为 True，则从前 skip_header 行之后的第一行读取字段名称。此行之前可以有选择地使用注释分隔符。如果名称是逗号分隔名称的序列或single-string，则名称将用于定义结构化数据类型中的字段名称。如果名称为无，则将使用 dtype 字段的名称(如果有)。

excludelist：顺序，可选
要排除的名称列表。此列表附加到默认列表 [‘return’,’file’,’print’]。排除的名称后附下划线：例如，file 将变为 file_。

deletechars： str，可选
组合了必须从名称中删除的无效字符的字符串。

defaultfmt： str，可选
用于定义默认字段名称的格式，例如 “f%i” 或 “f_%02i”。

autostrip：布尔型，可选
是否自动从变量中去除空格。

replace_space：字符，可选
用于替换变量名中的空格的字符。默认情况下，使用’_’。

case_sensitive： {真，假，’upper’, ‘lower’}，可选
如果为 True，则字段名称区分大小写。如果为 False 或 ‘upper’，则字段名称将转换为大写。如果’lower’，字段名称将转换为小写。

unpack：布尔型，可选
如果为 True，则返回的数组被转置，以便可以使用 x, y, z = genfromtxt(…) 解包参数。当与结构化数据类型一起使用时，将为每个字段返回数组。默认为假。

usemask：布尔型，可选
如果为 True，则返回一个掩码数组。如果为 False，则返回一个常规数组。

loose：布尔型，可选
如果为 True，则不要为无效值引发错误。

invalid_raise：布尔型，可选
如果为 True，如果在列数中检测到不一致，则会引发异常。如果为 False，则会发出警告并跳过有问题的行。

max_rows：整数，可选
要读取的最大行数。不得与skip_footer 同时使用。如果给定，该值必须至少为 1。默认是读取整个文件。

encoding： str，可选
用于解码输入文件的编码。当 fname 是文件对象时不适用。特殊值 ‘bytes’ 启用向后兼容解决方法，确保您在可能的情况下接收字节数组并将 latin1 编码的字符串传递给转换器。覆盖此值以接收 unicode 数组并将字符串作为输入传递给转换器。如果设置为无，则使用系统默认值。默认值为’bytes’。

like： array_like
引用对象以允许创建不是 NumPy 数组的数组。如果作为like 传入的array-like 支持__array_function__ 协议，则结果将由它定义。在这种情况下，它确保创建一个与通过此参数传入的对象兼容的数组对象。

3. 实例

txt文件：（test.in）
a b c d e f
1 2 3 4 5 6
2 3 4 5 6 7
3 4 5 6 7 8
4 5 6 7 8 9
5 6 7 8 9 0
6 7 8 9 0 1
7 8 9 0 1 2
8 9 0 1 2 3
9 0 1 2 3 4
0 1 2 3 4 5

程序：
test.py

!/usr/bin/env python3

# – – coding: utf-8 ––
import numpy as np

data = np.genfromtxt(‘test.in’, delimiter = ”, names=True)

print(data.dtype.names)

print(data)

a = data[‘a’]
b = data[‘b’]
c = data[‘c’]
d = data[‘d’]
e = data[‘e’]
f = data[‘f’]

print(a)

sel_ns=[(a>1)
& (b>1)
& (c>1)
& (d>1)
& (e>1)
& (f>1)
]

print(sel_ns)

a_f = a[tuple(sel_ns)]

print(a_f)

运行结果：

从运行结果可以清晰地分析出genfromtxt的用法。

Original: https://blog.csdn.net/yukuaidere/article/details/126837978
Author: yukuaidere
Title: Python学习笔记#1：使用genfromtxt读取txt中数据

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/759854/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

人工智能(AI)背后人工的力量——数据标注

尽管随着AI的普及，我们在生活中越来越依赖于人工智能，但”人工智障”的相关调侃也从来没有消失过。相信大家都知道，如果我们想要让AI准确识别出图中的鸟，我们…

Python 2023年9月28日
0041
pandas绘制饼图

绘制饼图需要用到matplotlib包，这是我使用的数据，里面记录了关于学生id,name,,age,gender,clazz信息的数据题目要求按照每个班级男生女生比例绘制饼图…

Python 2023年9月3日
0045
Python函数：apply()

函数： DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds…

Python 2023年8月16日
0047
numpy的使用教程

数组的定义 import math import numpy as np import random from timeit import timeit arr = np.arra…

Python 2023年8月28日
0038
Python基础教程（四）Pandas–DataFrame

DataFrame数据框架是一种二维数据结构，即数据按行和列的表格方式排列。 DataFrame的创建可以使用以下构造函数创建一个pandas DataFrame –…

Python 2023年8月7日
0038
Python读取dll库报错：[WinError 126]找不到指定的模块

问题描述所做的项目需要调用C编译好的dll动态链接库，一般来说，直接运行 import ctypes dll_read = ctypes.cdll.LoadLibrary(‘./…

Python 2023年8月2日
0082
python面向对象之继承(单继承,多继承,菱形继承)

继承一个类除了自身所拥有的属性方法之外,还获取了另外一个类的成员属性和方法是一种继承关系被继承的类叫做父类(基类,超类),继承的类叫做子类(衍生类)在python中所有类都继承…

Python 2023年6月10日
0065
tick_params()–matplotlib

函数功能改变刻度、刻度标签、网格线的外观 2.函数语法 plt.tick_params(axis=’both’,which=’major’,reset=False,**kwarg…

Python 2023年9月3日
0042
使用Anaconda完全替代官方Python

一. 为什么要用Anaconda替代官方Python Anaconda简介及其下载安装配置使用卸载_徐大康的博客-CSDN博客_anaconda Anaconda集成了很多…

Python 2023年9月8日
0054
python筛选一段数据_按多个关键字筛选数据

我认为您可以为每个关键字创建单独的掩码，然后通过&将它们与链接结合起来—对于每行至少一个True使用^{}：df_rest = pd.DataFrame({0:[&#821…

Python 2023年8月7日
0040
Python游戏开发–外星人入侵（源代码）

文章目录 1.效果展示 2. 《外星人入侵》源代码 * 2.1 image 2.2 alien_invasion.py 2.3 alien.py 2.4 bullet.py 2.5…

Python 2023年9月17日
0042
Flink SQL 子图复用逻辑分析

子图复用优化是为了找到SQL执行计划中重复的节点，将其复用，避免这部分重复计算的逻辑。先回顾SQL执行的主要流程 parser -> validate -> logic…

Python 2023年10月22日
0022
form表单内容序列化的两种方法

form表单内容序列化 form表单自带两种方法serialize()方法和serializeArray()方法 1.serialize()方法 描&…

Python 2023年6月9日
0062
正则表达式

文章目录一、正则初体验二、匹配规则三、字符串方法的使用 ; 一、正则初体验正则表达式是特殊的字符序列，利用事先定义好的特定字符以及他们的组合组成了一个规则，然后检查一个字符…

Python 2023年9月26日
0037
yolov5检测小目标（附源码）

yolov5小目标检测（图像切割法附源码） 6.30 更新切割后的小图片的label数据处理前言 yolov5大家都熟悉，通用性很强，但针对一些小目标检测的效果很差。YOLOv5…

Python 2023年8月1日
0061
猿人学第八题：验证码图文点选识别新思路

参考文章：猿人学web端爬虫攻防大赛赛题解析_第八题：验证码图文点选_起不好名字就不起了的博客-CSDN博客_猿人学第八题针对文字图片使用pillow对图片进行操作并判断图片…

Python 2023年9月20日
0036

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Python学习笔记#1：使用genfromtxt读取txt中数据

!/usr/bin/env python3

大家都在看