H5文件批量读写操作

2023年8月21日上午11:19 • Python • 阅读 57

1、遍历文件夹操作

for root, dirs, files in os.walk(file_location):
    # root&#x8F93;&#x51FA;&#x6587;&#x4EF6;&#x5939;&#xFF0C;dirs&#x8F93;&#x51FA;root&#x4E0B;&#x6240;&#x6709;&#x7684;&#x6587;&#x4EF6;&#x5939;&#xFF0C;files&#x8F93;&#x51FA;root&#x4E0B;&#x7684;&#x6240;&#x6709;&#x7684;&#x6587;&#x4EF6;
    print('&#x5F53;&#x524D;&#x6587;&#x4EF6;&#x5939;:', root)
    print('&#x5305;&#x542B;&#x7684;&#x6587;&#x4EF6;&#x5939;:', dirs)
    print('&#x5305;&#x542B;&#x7684;&#x6587;&#x4EF6;:', files)
    print()

os.walk是系统自带函数，用于遍历文件夹中的所有文件，os是python自带的系统库，前面要写个import os

2、批量读取文件名称

file_list = []  # &#x8BBE;&#x7F6E;&#x4E00;&#x4E2A;&#x5217;&#x8868;&#x5B58;&#x50A8;&#x6587;&#x4EF6;&#x540D;&#x79F0;

&#x8BBE;&#x7F6E;&#x5FAA;&#x73AF;&#x904D;&#x5386;csv&#x6587;&#x4EF6;&#xFF0C;&#x5C06;&#x6587;&#x4EF6;&#x540D;&#x79F0;&#x5B58;&#x50A8;&#x8FDB;file_list
for root, dirs, files in os.walk(file_location):
    for filename in files:
        if filename.endwith(.csv):
            file_path = os.join(root, filename)
            file_path = os.abspath(filename)
            file_list.append(file_path)

3、遍历文件名，批量导入数据

all_data = pd.Dataframe()  # &#x8BBE;&#x7F6E;&#x4E00;&#x4E2A;dataframe&#x53C2;&#x6570;&#x5B58;&#x50A8;&#x8BFB;&#x51FA;&#x6765;&#x7684;&#x6570;&#x636E;

&#x5FAA;&#x73AF;&#x8BFB;&#x53D6;&#x53C2;&#x6570;
for fp in sorted(file_list):
    # &#x5BFC;&#x5165;&#x6570;&#x636E;
    df = pd.read_csv(fp, skiprows=1, encoding=utf-8)
    all_data = all_data.append(df, ignore_index=True)

注意四点：

第一个需要使用sorted方法对文件列表进行排序

第二个encoding是utf-8还是gbk

第三个别忘了ingnore_index=True

第四个skiprows视情况而定，一般都等于1

4、对导入的数据再次排序

all_data.sort_values(by=['candle_begin_time'], inplace=True)

DataFrame.sort_values(by=’##’, axis=0, ascending=True, inplace=False, na_position=’last’)

by指定列名(axis=0或’index’)或索引值(axis=1或’columns’)axis若axis=0或’index’，则按照指定列中数据大小排序；若axis=1或’columns’，则按照指定索引中数据大小排序，默认axis=0ascending是否按指定列的数组升序排列，默认为True，即升序排列inplace是否用排序后的数据集替换原来的数据，默认为False，即不替换na_position{‘first’,’last’}，设定缺失值的显示位置

5、将批量读取的数据存储进一个H5文件

all_data.to_hdf(
    r'E:\Digitalcurrencyquant\part3\data\eos_1min_data.h5',
    key='all_data',
    format=table,
    mode='w'
)

这里要注意的是出现warning就加一个format=table

Original: https://blog.csdn.net/weixin_38754624/article/details/116452300
Author: 每天进步一点点321
Title: H5文件批量读写操作

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/755674/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

金山云将于12月30日在港交所上市：不发行新股，王育林已辞职

12月23日，金山云（NASDAQ:KC，HK:03896）发布公告称，拟通过介绍方式在港交所主板上市，代码为”03896″。按照计划，金山云将于2022年…

Python 2023年10月8日
0054
python pytest allure_Pytest+Allure环境的搭建

pytest的安装: 1.1. windows下: pip install pytest 1.2. linux下: pip install pytest 安装pytest-allu…

Python 2023年9月14日
0027
（超详细)python环境安装

耀风也是python初学者，文章可能会有不严谨的地方，如有发现希望帮我指正 1.python环境的安装（1）为什么要安装python环境？ python是一个解释性语言，所谓解释…

Python 2023年8月1日
0062
Flask1.1.4 Werkzeug1.0.1 源码分析：启动流程

基于QuickStart中的一个demo来分析 from flask import Flask app = Flask(__name__) @app.route("/&q…

Python 2023年8月12日
0063
Bugly iOS自动导入符号表

前言最近在处理Bugly问题的时候顺便解决了下符号表上传的问题，使用最新的上传工具包，也是顺便整理了下可以使用的脚本添加到了项目中，把这个过程中遇到的问题总结出来，脚本也会给出来…

Python 2023年10月21日
0038
pip安装教程

‘pip’不是内部或外部命令,也不是可运行的程序或批处理文件第一步：确定python已安装第二步：下载pip 第三步：安装pip 可能的问题:pytho…

Python 2023年8月1日
0082
ChatGPT：我围观了量子位MEET2023智能未来大会，还当了一回课代表

编辑部 ChatGPT 发自凹非寺量子位 | 公众号 QbitAI 什么是”MEET2023智能未来大会”？大会上来了哪些重磅嘉宾？他们在大会上探讨…

Python 2023年11月4日
0043
Python的seaborn和matplotlib作图之barplot条形图高级实战DIY技巧详解

前言昨天在浏览www.hltv.org网站的csgo选手数据时看到了这样一幅图，图上包含有选手的六项数据，分别为KPR（平均每回合击杀），DPR（平均每回合死亡），KAST（助攻…

Python 2023年9月3日
0072
matplotlib库的使用

博客免费资料下载地址:博客资源+Matplotlib绘图的基本使用-Python文档类资源-CSDN下载给个好评吧！ 1.matplotlib概述线条设置：颜色表示颜色的字…

Python 2023年9月6日
0040
unittest里discover用法_【pytest】01 基础用法

python的单元测试主要采用两种测试框架，unittest是python内置的标准类库，pytest是第三方库，它兼容unittest。本章主要讲解Pytest框架的基础用法。 …

Python 2023年9月13日
0053
【Python自学笔记】爬虫必备！Scrapy爬虫反爬之中间件添加随机UserAgent&使用代理池！

文章目录爬虫反爬 * 随机UserAgent – 获取随机UserAgent 代理池 – 获取代理池使用代理池 ; 爬虫反爬很多网站都有反爬的措施，为…

Python 2023年10月4日
0036
tf.nn.dropout和tf.keras.layers.Dropout的区别（TensorFlow2.3）与实验

全网搜索tf.nn.dropout和tf.keras.layers.Dropout区别，发现好多都是错误的讲解，因此有必要进行一次实验和纠错。tf.nn.dropout和tf.ke…

Python 2023年8月28日
0079
《Redis实战篇》一、短信登录

1.1、导入黑马点评项目 1.1.1 、导入SQL ; 1.1.2、有关当前模型手机或者app端发起请求，请求我们的nginx服务器，nginx基于七层模型走的事HTTP协议，可…

Python 2023年9月27日
0042
基于PyTorch的YOLOv5介绍

在PyTorch中使用YOLOv5YOLO是 “You only look once “的首字母缩写，是一个开源软件工具，它具有实时检测特定图像中物体的高效…

Python 2023年10月29日
0043
python学生管理系统(pyqt5 含界面)

学生管理系统项目流程项目模块账号登陆人脸识别增添学生信息删除学生信息改动学生信息查询学生信息项目主体框架 app.py为主代码，负责用于界面打开展示。 img文件夹…

Python 2023年11月5日
0044
创建DataFrame

一：import pandas as pdfrom pyspark.sql import SparkSessionfrom pyspark.sql.types import Str…

Python 2023年8月17日
0066

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

H5文件批量读写操作

大家都在看