[Pandas] 数据迭代

2023年7月7日上午11:11 • 人工智能 • 阅读 57

1.迭代Series

Series本身是一个可迭代的对象，可直接对Series使用for语句来遍历它的值

import pandas as pd

df = pd.DataFrame([['liver','E',89,21,24,64],
                   ['Arry','C',36,37,37,57],
                   ['Ack','A',57,60,18,84],
                   ['Eorge','C',93,96,71,78],
                   ['Oah','D',65,49,61,86]
                  ],
                   columns = ['name','team','Q1','Q2','Q3','Q4'])
迭代指定的列
for i in df.name:
    print(i)

效果和上面相同
df.name.values返回array结构数据可用于迭代
for i in df.name.values:
    print(i)

输出结果:
liver
Arry
Ack
Eorge
Oah

迭代索引和指定的多列，使用python内置的zip函数将其打包为可迭代的zip对象

import pandas as pd

df = pd.DataFrame([['liver','E',89,21,24,64],
                   ['Arry','C',36,37,37,57],
                   ['Ack','A',57,60,18,84],
                   ['Eorge','C',93,96,71,78],
                   ['Oah','D',65,49,61,86]
                  ],
                   columns = ['name','team','Q1','Q2','Q3','Q4'])

迭代索引和指定的两列
for i, n, q in zip(df.index, df.name, df.Q1):
    print(i, n, q)

输出结果:
0 liver 89
1 Arry 36
2 Ack 57
3 Eorge 93
4 Oah 65

2. df.iterrows()

df.iterrows()生成一个可迭代对象，将DataFrame行作为(索引，行数据)组成的Series数据对进行迭代。在for语句中需要两个变量来承接数据:一个为索引变量，即使索引在迭代中不会使用(这种情况可用useless作为变量名);另一个为数据变量，读取具体列时，可以使用字典的方法和对象属性的方法

df.iterrows()是最常用、最方便的按行迭代方法

import pandas as pd
df = pd.DataFrame([['liver','E',89,21,24,64],
                   ['Arry','C',36,37,37,57],
                   ['Ack','A',57,60,18,84],
                   ['Eorge','C',93,96,71,78],
                   ['Oah','D',65,49,61,86]
                  ],
                   columns = ['name','team','Q1','Q2','Q3','Q4'])
迭代,使用name,Q1数据
for index, row in df.iterrows():
    print(index, row['name'], row.Q1)

输出结果:
0 liver 89
1 Arry 36
2 Ack 57
3 Eorge 93
4 Oah 65

3 df.itertuples()

df.itertuples()生成一个namedtuples类型数据，name默认名为Pandas，可以在参数中指定

与df.iterrows()相比,df.itertuples()运行速度会更快一些，推荐在数据量庞大的情况下优先使用

import pandas as pd

df = pd.DataFrame([['liver','E',89,21,24,64],
                   ['Arry','C',36,37,37,57],
                   ['Ack','A',57,60,18,84],
                   ['Eorge','C',93,96,71,78],
                   ['Oah','D',65,49,61,86]
                  ],
                   columns = ['name','team','Q1','Q2','Q3','Q4'])

for row in df.itertuples():
    print(row)

输出结果:
Pandas(Index=0, name='liver', team='E', Q1=89, Q2=21, Q3=24, Q4=64)
Pandas(Index=1, name='Arry', team='C', Q1=36, Q2=37, Q3=37, Q4=57)
Pandas(Index=2, name='Ack', team='A', Q1=57, Q2=60, Q3=18, Q4=84)
Pandas(Index=3, name='Eorge', team='C', Q1=93, Q2=96, Q3=71, Q4=78)
Pandas(Index=4, name='Oah', team='D', Q1=65, Q2=49, Q3=61, Q4=86)

以下是一些使用方法示例:

import pandas as pd

df = pd.DataFrame([['liver','E',89,21,24,64],
                   ['Arry','C',36,37,37,57],
                   ['Ack','A',57,60,18,84],
                   ['Eorge','C',93,96,71,78],
                   ['Oah','D',65,49,61,86]
                  ],
                   columns = ['name','team','Q1','Q2','Q3','Q4'])

不包含索引数据
for row in df.itertuples(index=False):
    print(row)

Pandas(name='liver', team='E', Q1=89, Q2=21, Q3=24, Q4=64)
Pandas(name='Arry', team='C', Q1=36, Q2=37, Q3=37, Q4=57)
Pandas(name='Ack', team='A', Q1=57, Q2=60, Q3=18, Q4=84)
Pandas(name='Eorge', team='C', Q1=93, Q2=96, Q3=71, Q4=78)
Pandas(name='Oah', team='D', Q1=65, Q2=49, Q3=61, Q4=86)

自定义name
namedtuples
for row in df.itertuples(index=False, name='Hudas'):
    print(row)

Hudas(name='liver', team='E', Q1=89, Q2=21, Q3=24, Q4=64)
Hudas(name='Arry', team='C', Q1=36, Q2=37, Q3=37, Q4=57)
Hudas(name='Ack', team='A', Q1=57, Q2=60, Q3=18, Q4=84)
Hudas(name='Eorge', team='C', Q1=93, Q2=96, Q3=71, Q4=78)
Hudas(name='Oah', team='D', Q1=65, Q2=49, Q3=61, Q4=86)

使用数据
for row in df.itertuples():
    print(row.Index, row.name)

0 liver
1 Arry
2 Ack
3 Eorge
4 Oah

4 df.items()

df.items()和df.iteritems()功能相同，它迭代时返回一个(列名，本列的Series结构数据),实现对列的迭代

如果需要对Series的数据再进行迭代，可嵌套for循环

import pandas as pd
df = pd.DataFrame([['liver','E',89,21,24,64],
                   ['Arry','C',36,37,37,57],
                   ['Ack','A',57,60,18,84],
                   ['Eorge','C',93,96,71,78],
                   ['Oah','D',65,49,61,86]
                  ],
                   columns = ['name','team','Q1','Q2','Q3','Q4'])

Series取前三个
for label, ser in df.items():
    print(label)
    print(ser[:3], end='\n\n')

输出结果:------------------------------------------------------------------------------
name
0    liver
1     Arry
2      Ack
Name: name, dtype: object

team
0    E
1    C
2    A
Name: team, dtype: object

Q1
0    89
1    36
2    57
Name: Q1, dtype: int64

Q2
0    21
1    37
2    60
Name: Q2, dtype: int64

Q3
0    24
1    37
2    18
Name: Q3, dtype: int64

Q4
0    64
1    57
2    84
Name: Q4, dtype: int64

#----------------------------------------------------------------------------------------

5 按列迭代

除了df.items()，如需要迭代一个DataFrame的列，可以直接对DataFrame迭代，会循环得到列名

import pandas as pd

df = pd.DataFrame([['liver','E',89,21,24,64],
                   ['Arry','C',36,37,37,57],
                   ['Ack','A',57,60,18,84],
                   ['Eorge','C',93,96,71,78],
                   ['Oah','D',65,49,61,86]
                  ],
                   columns = ['name','team','Q1','Q2','Q3','Q4'])

直接对DataFrame迭代
for column in df:
    print(column)

输出结果:
name
team
Q1
Q2
Q3
Q4

再利用df[列名]的方法迭代列
依次取出每个列
for column in df:
    print(df[column])

输出结果:------------------------------------------------------------------------------
0    liver
1     Arry
2      Ack
3    Eorge
4      Oah
Name: name, dtype: object
0    E
1    C
2    A
3    C
4    D
Name: team, dtype: object
0    89
1    36
2    57
3    93
4    65
Name: Q1, dtype: int64
0    21
1    37
2    60
3    96
4    49
Name: Q2, dtype: int64
0    24
1    37
2    18
3    71
4    61
Name: Q3, dtype: int64
0    64
1    57
2    84
3    78
4    86
Name: Q4, dtype: int64

#----------------------------------------------------------------------------------------

可对每个列的内容进行迭代:
for column in df:
    for i in df[column]:
        print(i)

输出结果:------------------------------------------------------------------------------
liver
Arry
Ack
Eorge
Oah
E
C
A
C
D
89
36
57
93
65
21
37
60
96
49
24
37
18
71
61
64
57
84
78
86

#----------------------------------------------------------------------------------------

可以迭代指定列
for i in df.name:
    print(i)

输出结果:
liver
Arry
Ack
Eorge
Oah

只迭代想要的列
l = ['name','Q1']
cols = df.columns.intersection(l)
for col in cols:
    print(col)

输出结果:
name
Q1

Original: https://blog.csdn.net/Hudas/article/details/123009927
Author: 山茶花开时。
Title: [Pandas] 数据迭代

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/676115/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

滤波器与时间延迟

滤波器设计方式分为IIR(递归滤波器)和FIR(非递归滤波器)两种。 IIR可以使用更少的阶数来实现与FIR相同的性能，在延迟方面，IIR在不同频率下的延迟不同，而FIR在每个频率…

人工智能 2023年6月28日
00116
用DESeq2包来对RNA-seq数据进行差异分析

用DESeq2包来对RNA-seq数据进行差异分析差异分析的套路都是差不多的，大部分设计思想都是继承limma这个包，DESeq2也不例外。 DESeq2是DESeq包的更新版本，…

人工智能 2023年7月16日
0058
动手实现深度学习（14）：卷积神经网络

本篇会实现一个名为 SampleNet的简单神经网络，该神经网络会使用到第九章实现的conv 操作和第十章中实现的pooling操作。SimpleNet是用来检验我们实现的Op …

人工智能 2023年6月4日
00103
线性回归算法【AIoT阶段三】

目录前言正文前言你好，感谢你能点进来本篇博客，本篇博客是正式进入AI世界的第一章，是【AIoT阶段三】的内容：线性回归算法，关于所有AIoT的详细介绍，详见博客： A…

人工智能 2023年6月16日
0091
Bert模型学习之句向量的简单应用

Bert模型学习之预训练模型的简单应用上文讲到，让自己的机器可以同时安装两个版本的python3.x，下面我们就可以正式运行Bert模型。一、框架安装 1.首先切换到版本3.6…

人工智能 2023年5月25日
0080
opencv实现人脸识别(c++实现)

1 说明本文章基于opencv + VS2015 实现人脸检测 2 效果可以直接打开摄像头对人脸进行识别，这些标识框也会跟随你的人脸移动。隐私问题，我这里对图片进行了识别。 ;…

人工智能 2023年7月20日
0069
python dataframe日期运算常见的报错及解决方法 – unsupported operand type(s) for -: ‘DatetimeArray‘ and ‘str‘等

1、背景描述：（日期加减计算经常遇到的报错）数据分析中要对日期进行计算，经常遇到这些报错或问题： TypeError: cannot subtract DatetimeArray…

人工智能 2023年7月6日
00114
EX10 BIASED ESTIMATION OF REGRESSION COEFFICIENTS

import numpy as np import pandas as pd import matplotlib.pyplot as plt import statsmodels….

人工智能 2023年6月18日
00101
C&W攻击算法

C&W是一种基于优化的攻击方式，它同时兼顾高攻击准确率和低对抗扰动的两个方面。首先对抗样本需要用优化的参数来表示，其次在优化的过程中，需要达到两个目标，目标一是对抗样本和对…

人工智能 2023年6月16日
00117
图神经网络的直推式(Transductive)学习与归纳(Inductive)学习

一般的定义如何理解 inductive learning 与 transductive learning? – 王晋东不在家的回答 – 知乎 https:…

人工智能 2023年6月26日
00112
我的Go并发之旅、02 基本并发原语

注：本文所有函数名为中文名，并不符合代码规范，仅供读者理解参考。 Goroutine Go程不是OS线程，也不是绿色线程（语言运行时管理的线程），而是更高级别的抽象，一种特殊的协程…

人工智能 2023年6月4日
0096
Python 实现朴素贝叶斯代码演示

朴素贝叶斯可以细分为三种方法：分别是伯努利朴素贝叶斯、高斯朴素贝叶斯和多项式朴素贝叶斯。下文就这三种方法进行详细讲解和演示。目录一、伯努利朴素贝叶斯方法 1.1 例子解答 1….

人工智能 2023年6月23日
0050
关于图像处理分析的一些理解

1.图像处理较为底层的操作，可以看成数据预处理（图像本身也是由像素数据组成的），常见的处理有：图像降噪，压缩，提升分辨率，边缘检测等彩色图像灰度化边缘检测：检测出图像中亮度变化显…

人工智能 2023年6月20日
0084
一个Springboot配置顺序问题，让我直接回滚代码了

问题回顾前天，日常上线了个小迭代。内容是：将接口A切换成了接口B，需求很小，QA也没想着测，就让我自测后走免测上线了。开发完成后，赶紧部署到测试环境验证了下，没啥问题，per…

人工智能 2023年6月28日
0090
基于pyqt的图像处理界面设计

以下是一个小白因为某个原因而学习pyqt的学习结果首先是环境（因为python的环境问题，花了不少时间，着实头痛了一阵，所以把各种版本写在前面，总之逢山开路遇水搭桥，度娘解决一切…

人工智能 2023年6月18日
0086
5个必知必会的 Python 数据合并技巧

大家好，前不久在我们技术交流群有群友提到最近他面试阿里70万总包的数据岗位，对方问 Pandas的 5种数据合并的函数，结果他只答出了 2个。那么，究竟是哪五个呢？今天，我们…

人工智能 2023年7月7日
0082

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

[Pandas] 数据迭代

大家都在看