Python处理(加载、合并)多个csv文件

2023年8月7日上午3:31 • Python • 阅读 64

数据集介绍：本数据集是某化工系统的数据，一共有很多个月的，我这里就拿一个月的数据集，August_data（八月的数据集)，一共有31个csv文件。

方法一 for循环遍历+os.listdir(directory_path)+[ for file in tqdm] + os.path.join(path,file)

import pandas as pd
import numpy as np
from tqdm import tqdm
import os

def get_data(path):
    df_list = []
    for file in tqdm(os.listdir(path)):##进度条
        file_path = os.path.join(path, file)
        df = pd.read_csv(file_path)
        df_list.append(df)
    df = pd.concat(df_list)
    return df

cPath = '.\August_data'
cPath = 'F:/BaiduNetdiskDownload/宁东电厂数据及分析要求/宁东脱销系统优化-上海交大/SCR数据-2020-1/8月数据' #F:/BaiduNetdiskDownload/宁东电厂数据及分析要求/宁东脱销系统优化-上海交大/SCR数据-2020-1/8月数据
uPath = str(cPath)#uPath = unicode(cPath,'utf-8')
dirs = os.listdir(TEST_PATH)
print(dirs)
test_df = get_data(cPath)
print(test_df.head())
test_df.to_csv(path_or_buf="test.csv",index=False)#保存为CSV文件

方法二 glob方法


#!/usr/bin/env python
coding=utf-8

import glob
import time
import csv
import pandas as pd
from tqdm import tqdm
a new file
#open all the CSV file
#遍历文件夹下所有csv文件
TEST_PATH = '.\August_data'
csv_list = glob.glob(f'{TEST_PATH}\*.csv')
print('共有%s个CSV文件'% len(csv_list))
print (csv_list)

def get_data():
    df_list = []
    for csv_file in csv_list:
        df = pd.read_csv(csv_file)
        df_list.append(df)
    df = pd.concat(df_list)
    print("Loading Oer")
    return df
get_data()

参考

Python 读取多个CSV文件整合到一个CSV文件

Python –读取多个CSV文件特定行写入到新文件

Python os.listdir() 方法

glob模块使用教程

glob模式匹配的规则Nz

pandas 之unique()函数与nunique()函数区别

总结

两个办法都挺好的，浅层原理都是，得到文件夹下的各个文件的名字，然后利用该名字做遍历去加载csv。

如果目录名字为中文需要转码处理：uPath = unicode(cPath,’utf-8′)，但python2中的unicode()函数在python3中会报错：Python3没有unicode()这个函数，换成了 str()函数，但如果是csv本身数据不合规的处理起来还是麻烦，本身这套打法没问题。

如果对您有用的话的话，啦啦啦麻烦点个赞吧(●ˇ∀ˇ●)~~

Original: https://blog.csdn.net/weixin_43332715/article/details/120578900
Author: 思考实践
Title: Python处理(加载、合并)多个csv文件

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/739069/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【目标检测】YOLOv5遇上知识蒸馏

前言模型压缩方法主要4种：网络剪枝(Network pruning) 稀疏表示(Sparse representation) 模型量化(Model quantification…

Python 2023年11月7日
0032
【Bluetooth|蓝牙开发】二、蓝牙开发入门

个人主页：董哥聊技术我是董哥，嵌入式领域新星创作者创作理念：专注分享高质量嵌入式文章，让大家读有所得！【所有文章汇总】 1、蓝牙基础概念蓝牙，是一种利用低功率无线电，支持…

Python 2023年10月16日
0052
Seata 1.5.2 源码学习（事务执行）

关于全局事务的执行，虽然之前的文章中也有所涉及，但不够细致，今天再深入的看一下事务的整个执行过程是怎样的。 TransactionManager io.seata.core.mod…

Python 2023年10月14日
0049
动手实践丨基于ModelAtrs使用A2C算法制作登月器着陆小游戏

摘要：在本案例中，我们将展示如何基于A2C算法，训练一个LunarLander小游戏。 LunarLander是一款控制类的小游戏，也是强化学习中常用的例子。游戏任务为控制登月器着…

Python 2023年10月24日
0073
Pandas处理日期数据

Pandas处理日期数据 * – 依据前缀查询 – 获取月周季度（针对index）* 获取年月日* to_period() 函数* date_range()…

Python 2023年8月18日
0067
Anaconda环境下换源快速安装pytorch

Anaconda环境下换源快速安装pytorch 换源安装pytorch * 1 更换清华源 2 添加镜像源 3 安装pytorch 换源安装pytorch 1 更换清华源需要在…

Python 2023年9月16日
0040
算法 | 详解斐波那契数列问题

本篇是学习了《趣学算法（第2版）》第一章之后总结的。上一篇讲到了等比数列求和问题，求(S_n = 1 + 2 + 2^2 + 2^3 + … + 2^{63}= ？…

Python 2023年10月18日
0041
Linux基本命令(3)

Linux基本命令(3) 📟作者主页：慢热的陕西人🌴专栏链接：Linux📣欢迎各位大佬👍点赞🔥关注🚓收藏，🍉留言本博客主要讲解了最后一部分常用的Linux指令和一些热键，另外还介…

Python 2023年10月7日
0032
卡塔尔世界杯-诸神黄昏

世界杯世界杯概述:国际足联世界杯（FIFA World Cup）简称”世界杯”，是世界上最高荣誉、最高规格、最高竞技水平、最高知名度的足球比赛，与奥运会并…

Python 2023年10月7日
0047
2、NumPy数组基本用法

NumPy数组基本用法 * – 1、numpy中的数组： – 2、创建数组（np.ndarray对象）： – 3、ndarray常用属性： &#…

Python 2023年8月29日
0065
python爬虫之Scrapy框架，基本介绍使用以及用框架下载图片案例

一、Scrapy框架简介 Scrapy是:由Python语言开发的一个快速、高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据，只需要实现少量的代码，就…

Python 2023年10月1日
0048
第六课 Python Web企业门户网站-缓存

10.1 开发”首页”模块 10.1.1 轮播横幅 10.1.2 企业概况 10.1.3 新闻动态 10.1.4 通知公告 10.1.5 科研基地 10.1…

Python 2023年8月5日
0066
【Python百日基础系列】Day14 – Pandas 文本数据处理及匿名函数和映射函数

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

Python 2023年8月9日
0067
纯前端 excel 导出

前端 excel 表格导出我们习惯了后端去处理表格，直接接口返回，那前端如何轻松的导出表格呢？文章目录 * – + 前端 excel 表格导出 + Ⅰ. 通过 j…

Python 2023年10月11日
0054
macOS安装Scrapy，不要踩坑了

文章目录 * – 安装Scrapy – + 1.使用Anaconda或Miniconda + 2.推荐使用虚拟环境安装 + 3.特定平台安装说明 + * 3…

Python 2023年10月1日
0061
文件概述

我们这里讨论的文件并不是文件夹中的纸质文件，特指计算机中的文件。那计算机中的文件到底是什么呢？什么是文件计算机文件是存储在存储器上的数据序列，可以包含任何数据内容。概念上，…

Python 2023年6月11日
0060

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Python处理(加载、合并)多个csv文件

方法一 for循环遍历+os.listdir(directory_path)+[ for file in tqdm] + os.path.join(path,file)

方法二 glob方法

参考

大家都在看