pandas读取csv相对路径_pandas批量读取csv文件–按行索引读取

2023年8月18日下午8:21 • Python • 阅读 68

pandas和fit_generator配合使用时，不想将数据全部读入内存，因为实际上也读入不了，数据量太大了。以下是如何按batch_size大小读取：

1、准备数据：

1 a = pd.DataFrame(a)

2 a = [

3 [1, 1, 1, 1],

4 [2, 2, 2, 2],

5 [3, 3, 3, 3],

6 [4, 4, 4, 4],

7 [5, 5, 5, 5],

8 [6, 6, 6, 6],

9 ]

10 a = pd.DataFrame(a)

11 a.to_csv(“../a.csv”, index=False)

2、读入原始数据：

1 pd.read_csv(“../a.csv”)

输出：

2 0 1 2 3

3 0 1 1 1 1

4 1 2 2 2 2

5 2 3 3 3 3

6 3 4 4 4 4

7 4 5 5 5 5

8 5 6 6 6 6

3、读取前几行：

1 pd.read_csv(“../a.csv”, nrows=2)

输出：

2 0 1 2 3

3 0 1 1 1 1

4 1 2 2 2 2

4、跳过某些行，或跳过前多少行：

1 pd.read_csv(“../a.csv”, skiprows=1, nrows=2)

输出：

2 1 1.1 1.2 1.3

3 0 2 2 2 2

4 1 3 3 3 3

5 pd.read_csv(“../a.csv”, skiprows=lambda x: x % 2 != 0)

输出：

6 0 1 2 3

7 0 2 2 2 2

8 1 4 4 4 4

9 2 6 6 6 6

通过skiprows指定跳过多少行，nrows参数取前多少行就可以实现batch_size大小的输入。

标签：读取,..,read,skiprows,按行,pd,csv

来源： https://www.cnblogs.com/dan-baishucaizi/p/12084175.html

Original: https://blog.csdn.net/weixin_42511091/article/details/112880918
Author: 是呵呵
Title: pandas读取csv相对路径_pandas批量读取csv文件–按行索引读取

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/753353/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

7.12 LeetCode刷题记录（动态规划，简单x1，中等x2）

7.12 LeetCode刷题记录（动态规划，简单x1，中等x2） 1 动态规划概念动态规划（英语：Dynamic programming，简称 DP），是一种在数学、管理科学、…

Python 2023年6月11日
0079
交互式仪表板！Python轻松完成！⛵

💡 作者：韩信子@ShowMeAI📘 数据分析实战系列：https://www.showmeai.tech/tutorials/40📘 本文地址：https://www.showm…

Python 2023年10月30日
0047
【Python从入门到精通】（十一）Python的函数的方方面面【收藏下来保证有用！！！】

您好，我是码农飞哥，感谢您阅读本文，欢迎一键三连哦。本文主要介绍Python的函数，函数的定义，使用，可变参数等等都有详细介绍。干货满满，建议收藏，需要用到时常看看。小伙伴们如有…

Python 2023年6月3日
0077
【Pandas+Python】初始化一个全零的Dataframe

解决方案初始化一个100*3的0矩阵，变为Dataframe类型，并为每列赋值一个属性 import numpy as np import pandas as pd arr = …

Python 2023年8月25日
00139
Python爬虫能当副业吗？到了哪个层次能接单？解析能挣钱的方式

Original: https://www.cnblogs.com/pythonQqun200160592/p/15459479.htmlAuthor: python可乐编程Tit…

Python 2023年5月25日
0054
爬虫系列：穿越网页表单与登录窗口进行采集（二）

上一期我们讲解了 Python Requests 库、提交一个基本表单、HTML 相关控件等内容。本篇文章我们接着上一期文章介绍通过 Python Requests 提交文件和图…

Python 2023年6月10日
00125
python:多元线性回归总结

最近做的项目要用到多元线性回归，小结一下用python做多元线性回归要用到的代码和步骤：数据：因变量y,自变量x 1. 导入库导入包 import os import pand…

Python 2023年8月1日
0053
Python入门系列（九）pip、try except、用户输入、字符串格式

pip 包含模块所需的所有文件。检查是否安装了PIP $ pip –version 安装 包 $ pip install package_name 使用包…

Python 2023年10月23日
0046
python绘制股票k线图

使用python绘制股票k线图 1. 需要安装的包 tushare matplotlib mpl_finance datetime 使用Anaconda Prompt安装，安装语句…

Python 2023年8月2日
0054
逆向爬虫16 Scrapy持久化存储

逆向爬虫16 Scrapy持久化存储在Scrapy中，数据可以持久化存储到4个地方：① CSV文件，② MySQL数据库，③ MongoDB数据库，④ 文件存储 (图片等二进制文…

Python 2023年10月2日
0041
会说话的代码 Python pyttsx3，及AttributeError:partially initialized module……(……)报错，解决方法

安装pyttsx3 我们先安装需要的库 pyttsx3文字朗读模块: 常用方法是在输入命令:pip install 所需的模块 -i http://pypi.doubanio.co…

Python 2023年9月18日
0046
最新IDEA配置Maven指南（适用于2022及以下版本）

2023年更新——IDEA2022配置Maven一次包过教程前言 Maven是当今Java开发中主流的依赖管理工具，那么小伙伴们在刚开始学习的时候呢，IDEA配置Maven肯定会…

Python 2023年9月26日
00263
python爬虫–爬取cctv连续剧

Python 2023年5月24日
0084
【Python】numpy常用API整理汇总

np.array(list) 直接通过一个列表来创建数据，可以使用 dtype来指定数据类型。 np.array([1,2,3]) np.array([[1, 2, 3], [4,…

Python 2023年8月26日
0083
【软件测试学习笔记】pytest-allure生成测试报告

pytest-allure生成测试报告安装模块：pip install allure-pytest 第一步&am…

Python 2023年9月14日
0054
基于Python的wordcloud安装方法(内含升级pip、安装matplotlib包的方法)

前言花了一个下午的时间，找了很多的资料，终于安装好了wordcloud库。废话不多说，直接上各种问题及解决方法。一、安装步骤方法1 直接在命令提示符中输入pip instal…

Python 2023年9月4日
0060

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pandas读取csv相对路径_pandas批量读取csv文件–按行索引读取

大家都在看