Python处理(加载、合并)多个csv文件

数据集介绍:本数据集是某化工系统的数据,一共有很多个月的,我这里就拿一个月的数据集,August_data(八月的数据集),一共有31个csv文件。

Python处理(加载、合并)多个csv文件

方法一 for循环遍历+os.listdir(directory_path)+[ for file in tqdm] + os.path.join(path,file)

import pandas as pd
import numpy as np
from tqdm import tqdm
import os

def get_data(path):
    df_list = []
    for file in tqdm(os.listdir(path)):##进度条
        file_path = os.path.join(path, file)
        df = pd.read_csv(file_path)
        df_list.append(df)
    df = pd.concat(df_list)
    return df

cPath = '.\August_data'
cPath = 'F:/BaiduNetdiskDownload/宁东电厂数据及分析要求/宁东脱销系统优化-上海交大/SCR数据-2020-1/8月数据' #F:/BaiduNetdiskDownload/宁东电厂数据及分析要求/宁东脱销系统优化-上海交大/SCR数据-2020-1/8月数据
uPath = str(cPath)#uPath = unicode(cPath,'utf-8')
dirs = os.listdir(TEST_PATH)
print(dirs)
test_df = get_data(cPath)
print(test_df.head())
test_df.to_csv(path_or_buf="test.csv",index=False)#保存为CSV文件

方法二 glob方法


#!/usr/bin/env python
coding=utf-8

import glob
import time
import csv
import pandas as pd
from tqdm import tqdm
a new file
#open all the CSV file
#遍历文件夹下所有csv文件
TEST_PATH = '.\August_data'
csv_list = glob.glob(f'{TEST_PATH}\*.csv')
print('共有%s个CSV文件'% len(csv_list))
print (csv_list)

def get_data():
    df_list = []
    for csv_file in csv_list:
        df = pd.read_csv(csv_file)
        df_list.append(df)
    df = pd.concat(df_list)
    print("Loading Oer")
    return df
get_data()

参考

Python 读取多个CSV文件整合到一个CSV文件

Python –读取多个CSV文件特定行写入到新文件

Python os.listdir() 方法

glob模块使用教程​​​​​​​

glob模式匹配的规则​​​​​​​N​​​​​​​z

pandas 之unique()函数与nunique()函数区别

总结

两个办法都挺好的,浅层原理都是,得到文件夹下的各个文件的名字,然后利用该名字做遍历去加载csv。

如果目录名字为中文 需要转码处理:uPath = unicode(cPath,’utf-8′),但python2中的unicode()函数在python3中会报错:Python3没有unicode()这个函数,换成了 str()函数,但如果是csv本身数据不合规的处理起来还是麻烦,本身这套打法没问题。

如果对您有用的话的话,啦啦啦麻烦点个赞吧(●ˇ∀ˇ●)~~

Original: https://blog.csdn.net/weixin_43332715/article/details/120578900
Author: 思考实践
Title: Python处理(加载、合并)多个csv文件

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/739069/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 【目标检测】YOLOv5遇上知识蒸馏

    前言 模型压缩方法主要4种: 网络剪枝(Network pruning) 稀疏表示(Sparse representation) 模型量化(Model quantification…

    Python 2023年11月7日
    032
  • 【Bluetooth|蓝牙开发】二、蓝牙开发入门

    个人主页:董哥聊技术 我是董哥,嵌入式领域新星创作者创作理念:专注分享高质量嵌入式文章,让大家读有所得! 【所有文章汇总 】 1、蓝牙基础概念 蓝牙,是一种 利用低功率无线电,支持…

    Python 2023年10月16日
    052
  • Seata 1.5.2 源码学习(事务执行)

    关于全局事务的执行,虽然之前的文章中也有所涉及,但不够细致,今天再深入的看一下事务的整个执行过程是怎样的。 TransactionManager io.seata.core.mod…

    Python 2023年10月14日
    049
  • 动手实践丨基于ModelAtrs使用A2C算法制作登月器着陆小游戏

    摘要:在本案例中,我们将展示如何基于A2C算法,训练一个LunarLander小游戏。 LunarLander是一款控制类的小游戏,也是强化学习中常用的例子。游戏任务为控制登月器着…

    Python 2023年10月24日
    073
  • Pandas处理日期数据

    Pandas处理日期数据 * – 依据前缀查询 – 获取月周季度(针对index)* 获取年月日* to_period() 函数* date_range()…

    Python 2023年8月18日
    067
  • Anaconda环境下换源快速安装pytorch

    Anaconda环境下换源快速安装pytorch 换源安装pytorch * 1 更换清华源 2 添加镜像源 3 安装pytorch 换源安装pytorch 1 更换清华源 需要在…

    Python 2023年9月16日
    040
  • 算法 | 详解斐波那契数列问题

    本篇是学习了《趣学算法(第2版)》 第一章之后总结的。 上一篇讲到了等比数列求和问题,求(S_n = 1 + 2 + 2^2 + 2^3 + … + 2^{63}= ?…

    Python 2023年10月18日
    041
  • Linux基本命令(3)

    Linux基本命令(3) 📟作者主页:慢热的陕西人🌴专栏链接:Linux📣欢迎各位大佬👍点赞🔥关注🚓收藏,🍉留言 本博客主要讲解了最后一部分常用的Linux指令和一些热键,另外还介…

    Python 2023年10月7日
    032
  • 卡塔尔世界杯-诸神黄昏

    世界杯 世界杯概述:国际足联世界杯(FIFA World Cup)简称”世界杯”,是世界上最高荣誉、最高规格、最高竞技水平、最高知名度的足球比赛,与奥运会并…

    Python 2023年10月7日
    047
  • 2、NumPy数组基本用法

    NumPy数组基本用法 * – 1、numpy中的数组: – 2、创建数组(np.ndarray对象): – 3、ndarray常用属性: &#…

    Python 2023年8月29日
    065
  • python爬虫之Scrapy框架,基本介绍使用以及用框架下载图片案例

    一、Scrapy框架简介 Scrapy是:由Python语言开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据,只需要实现少量的代码,就…

    Python 2023年10月1日
    048
  • 第六课 Python Web企业门户网站-缓存

    10.1 开发”首页”模块 10.1.1 轮播横幅 10.1.2 企业概况 10.1.3 新闻动态 10.1.4 通知公告 10.1.5 科研基地 10.1…

    Python 2023年8月5日
    066
  • 【Python百日基础系列】Day14 – Pandas 文本数据处理及匿名函数和映射函数

    抵扣说明: 1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。 Original: https://blo…

    Python 2023年8月9日
    067
  • 纯前端 excel 导出

    前端 excel 表格导出 我们习惯了后端去处理表格,直接接口返回 ,那前端如何轻松的导出表格呢? 文章目录 * – + 前端 excel 表格导出 + Ⅰ. 通过 j…

    Python 2023年10月11日
    054
  • macOS安装Scrapy,不要踩坑了

    文章目录 * – 安装Scrapy – + 1.使用Anaconda或Miniconda + 2.推荐使用虚拟环境安装 + 3.特定平台安装说明 + * 3…

    Python 2023年10月1日
    061
  • 文件概述

    我们这里讨论的文件并不是文件夹中的纸质文件,特指计算机中的文件。 那计算机中的文件到底是什么呢? 什么是文件 计算机文件是存储在存储器上的数据序列,可以包含任何数据内容。 概念上,…

    Python 2023年6月11日
    060
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球