使用pandas遍历csv表格数据的效率问题（df.loc/iloc与df.at/iat的异同）

2023年8月20日上午8:38 • Python • 阅读 46

在处理数据量较大的表格（25万行）时，需要遍历表格中的每个值，前期使用df.loc进行遍历，不仅非常耗时，而且运行十几个小时程序经常崩溃。。。

解决方法

在网上搜索解决方案，使用df.at代替df.loc后，与之前十几个小时相比，现在几分钟就全部遍历完成！！！

特地搜索了一下loc与at的区别，loc和at都是利用index和列名进行检索，但 at更快。

df.iloc/loc的优势在于可以灵活的对数据进行 切片或选择性提取多个数值，例如：

df.loc[1:10,'weight']
df.loc[[1,3,6],'weight']

虽然 df.at/iat仅能进行 单个值的提取，但是在 对大量数据进行逐个遍历的场景下，效率才是第一生产力！

for i in range(len(str2num_list)):
    for j in range(len(data[str2num_list[i]])):
        if type(df.iat[j,i]) == str:
            df.iat[j,i] = 0   #此处使用df.iloc将大大降低效率

Access a single value for a row/column label pair.

Similar to loc, in that both provide label-based lookups. Use at if you only need to get or set a single value in a DataFrame or Series.

Original: https://blog.csdn.net/Hayreen/article/details/115198880
Author: Hayreen
Title: 使用pandas遍历csv表格数据的效率问题（df.loc/iloc与df.at/iat的异同）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/754661/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python的 numpy库学习总结和介绍(超详细)模块

目录前言 numpy是什么？一、创建数据容器 1.np.array(),通过传递一个列表，元祖来创建 2.np.zeros(),np.ones(),np.empty(),np….

Python 2023年8月24日
0061
educoder：实验十字典

第1关：统计文档中作者作品数量任务描述本关任务：编写一个能计算文档《中学诗词.txt》中各位作者作品数量的程序。遍历文档中每一行，提取作者的姓名，将其作为键加入到字典中，字典…

Python 2023年7月31日
0087
接口自动化测试框架：python+requests+pytest+allure实现

今年是以往10年中最坏的一年，是未来10年中最好的一年，同时也是自动化测试爆发的一年，自动化从18年开始萌芽之后自此功能测试打遍天下的日子已经一去不复返了。在自动化的领域里面，接口…

Python 2023年9月10日
0037
github项目自荐（django项目）

这篇文章来介绍一下我的一个GitHub项目，如果对这个项目有什么建议或者这个项目有什么bug请大家在评论区或者在Github issues给我建议，谢谢。 1.首先先上GitHub…

Python 2023年8月5日
0059
Python全栈工程师之从网页搭建入门到Flask全栈项目实战(7) – 在线问答系统

1.项目源码/业务逻辑百度网盘链接：链接：https://pan.baidu.com/s/13VNfrSJE6vcL3HP1J5T8ew 提取码：00s0，项目业务逻辑自行阅读 …

Python 2023年10月11日
0038
Django测试小工具平台开发（二）

一、编写django视图函数 Django 中的视图的概念是一类具有相同功能和模板的网页的集合。作用就是将数据写入到html模板文件中，然后返回给调用方。 #django项目根目…

Python 2023年8月6日
0054
django3项目内View实现增删改查

1.1命令框内创建新项目打开指定文件夹，在路径位置输入cmd打开命令行django-admin startproject 项目名创建项目 1.2在新项目内创建子应用 pytho…

Python 2023年8月4日
0048
初识Flask框架

python实现的轻量级web开发微框架 MTV模式 Flask虽然自带功能不多，但是扩展却极为丰富，小而美，方便快速开发 MTV模型介绍 Flask框架和Django框架相同，…

Python 2023年8月12日
0035
2022.04.17-高宝琪毕设阶段性汇报

第12次汇报 (2022.04.17) 实现了第三部分（分析数字化的心电数据）！并将二、三两部分（”纸质心电图数字化”和”分析数字化的心电数据…

Python 2023年8月10日
0063
[nginx]借助nginx实现自动获取本机IP

借助nginx，在自动化部署应用时获取本机ip 前言在用脚本自动化部署应用时，有的应用需要指定本机IP，网上找到的方案大多是过滤 ifconfig或者 ip命令的结果，这里提供一…

Python 2023年6月12日
0076
git clone的等价方法

git clone http://github.com/CosmosHua/locate new git clone http://github.com/CosmosHua/loc…

Python 2023年6月12日
0093
人脸识别系统——Dlib人脸识别

第1关：dlib人脸检测的基本原理编程要求：请在右侧编辑器中的BEGIN-END之间编写代码，使用Dlib识别人脸并输出识别结果： * – 计算已知图片所有人脸特征…

Python 2023年8月30日
0049
flask 调用python脚本_flaskpython脚本如何调用另一个flaskpython脚本

我是新来的烧瓶-py2neo-pyhon-neo4j，所以我需要一些帮助我有以下问题。运行/执行的main.py是视图.py我有另一个py脚本，其中我有一些表单的提交_data….

Python 2023年8月14日
0059
什么是边缘人工智能？

简言之，边缘人工智能是指以机器深度学习的形式通过运用边缘计算设备，该算法直接在边缘设备上运行。基于边缘计算设备可以通过数据学习独立提高其在给定任务中的性能，有时甚至超出了人类的能…

Python 2023年10月25日
0046
Python爬虫进阶（九）：http&scrapy请求与响应

目录前言 scrapy中的请求与响应 1 Request 2 FormRequest 3 JsonRequest 4 Response 5 TextResponse http中的…

Python 2023年10月4日
0078
dataframe批量替换值_Python之DataFrame按照规则批量修改某列的数据

在使用Python进行数据分析时，我们经常会看一个数据的分布，然后对数据进行处理。比如说有一个场景：以下数据是某个产品的提前预定期： import pandas as pd im…

Python 2023年8月7日
0057

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

使用pandas遍历csv表格数据的效率问题（df.loc/iloc与df.at/iat的异同）

解决方法

大家都在看