series选取值_pandas中dataFrame的取值和计算操作

2023年8月6日下午8:48 • Python • 阅读 41

dataFrame中的值以矩阵的形式存在，在访问值时需要带上行索引或者列索引。

1、dataFrame简单的取值方法

import pandas as pd

def createDataFrame():

d = {

‘a’:[1,2,3,4,5],

‘b’:[6,2,3,6,0],

‘c’:[4,2,3,6,7],

‘d’:[5,3,2,4,5],

‘e’:[6,7,4,5,8]

df = pd.DataFrame(d)

打印出dataFrame

print(df)

if name == ‘main‘:

createDataFrame()

(1)输出前3行数据

print(df.head(3))

打印结果为：

a b c d e

0 1 6 4 5 6

1 2 2 2 3 7

2 3 3 3 2 4

(2)输出后2行数据：

print(df.tail(2))

打印结果为：

a b c d e

3 4 6 6 4 5

4 5 0 7 5 8

(3)输出第3行数据：

loc通过标签来选择数据

print(df.loc[2])#这里的2表示行索引

iloc通过位置来选择数据

print(df.iloc[2])#这里的2表示行位置

打印结果

a 3

b 3

c 3

d 2

e 4

(4)输出第2列数据

print(df[‘b’])

打印输出

0 6

1 2

2 3

3 6

4 0

从dataFrame里取出的行或列的类型为Series，其可以看做为一个字典，对Series取值：

x = df.iloc[2]

print(x[2])

打印输出

可以自荐将Series转换为一个list

x = list(df.iloc[2])

(5)查看行名

print(df.index)

打印输出：

RangeIndex(start=0, stop=5, step=1)

(6)查看列名

print(df.columns)

打印输出：

Index([‘a’, ‘b’, ‘c’, ‘d’, ‘e’], dtype=’object’)

(6)查看所有数据值

print(df.values)

打印输出：

[[1 6 4 5 6]

[2 2 2 3 7]

[3 3 3 2 4]

[4 6 6 4 5]

[5 0 7 5 8]]

(7)查看行列数

print(df.iloc[:,0].size) #行数

print(df.columns.size) #列数

打印输出：

2、复杂的dataFrame取值操作(对dataFrame中的数据进行筛选)

创建一个dataFrame例子：

import numpy as np

import pandas as pd

def GroupbyDemo():

df = pd.DataFrame({‘key1’: [1, 2, 1, 2, 1],

‘key2’: [10, 20, 30, 40, 50],

‘data1’: np.random.randn(5),

‘data2’: np.random.randn(5)})

print(df)

if name == ‘main‘:

GroupbyDemo()

打印结果：

key1 key2 data1 data2

0 1 10 0.510140 -0.272037

1 2 20 1.303937 -0.296393

2 1 30 0.984371 0.005988

3 2 40 -1.257891 -1.089489

4 1 50 0.129426 -1.011806

(1)筛选某列中大于某一值得数据：

print(df[df.key1>1])

打印结果为：

key1 key2 data1 data2

1 2 20 1.006815 -1.191766

3 2 40 0.392499 -0.906492

(2)筛选第一列大于1且第二列大于30的数据

print(df[(df.key1>1) & (df.key2>30)])

打印结果为：

key1 key2 data1 data2

3 2 40 0.681879 0.206709

(3)筛选第一列大于1或第二列大于30的数据

print(df[(df.key1>1) | (df.key2>30)])

打印结果为：

key1 key2 data1 data2

1 2 20 -2.454197 1.091813

3 2 40 0.481552 0.763660

4 1 50 1.639578 0.740787

3、对dataFrame进行函数操作

(1)转置

print(df.T)

输出结果：

0 1 2 3 4

a 1 2 3 4 5

b 6 2 3 6 0

c 4 2 3 6 7

d 5 3 2 4 5

e 6 7 4 5 8

4、删除dataFrame中的某行

(1)删除索引为ac的2行

data.drop(index=list(‘ac’))

data.drop(index=[‘a’,’c’])

(2)删除列名为1,3的2列

data.drop([1,3],axis=1)

5、遍历dataframe

for index, row in df.iterrows():

print(row[‘Sigma’])

输出一个值

Original: https://blog.csdn.net/weixin_31233537/article/details/112864824
Author: 杨奎元-深动
Title: series选取值_pandas中dataFrame的取值和计算操作

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/738399/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

18-基于CentOS7搭建RabbitMQ3.10.7集群镜像队列+HaProxy+Keepalived高可用架构

集群架构虚拟机规划 IP hostname 节点说明端口控制台地址 192.168.247.150 rabbitmq.master rabbitmq master 5672 …

Python 2023年10月20日
0051
python模块import导入

python模块import导入模块导入分为python内置模块（或者第三方模块）导入和自定义模块导入。模块导入方法可以总结为5大导入方法，下面以python内置模块角度来举例介…

Python 2023年8月27日
0071
联邦学习：联邦多视角学习在跨领域推荐中的应用

1 导引 1.1 跨域推荐模型推荐系统中常常面临冷启动和用户交互数据稀疏的问题。解决这个问题的一个手段就是对用户在多个领域(domain)的日志数据联合起来进行建模，这里的多个领…

Python 2023年10月29日
0045
异常与等待

强制等待 Time.sleep(5) 暂停整个页面程序缺点：非常死板不灵活，一般用在代码调试隐性等待 Implicitly_wait()秒隐性等待：设置一个最长等待时间，如果在规…

Python 2023年9月15日
0043
python使用matplotlib制作精美的饼图

目录成品代码详细的分析 * 字体大小设置设置标签值颜色设置突出显示设置绘图区第一个子图的绘制设置刻度位置美化最后记得成品首先上最终成品 ; 代码图1的展…

Python 2023年9月2日
0058
图像灰度化处理

文章目录 1. 图像灰度化 2. 图像灰度化处理方法 * 2.1 最大值法 2.2 平均值法 2.3 加权平均法 3. 图像灰度化处理方法的Python实现 * 3.1 最大值法 …

Python 2023年8月2日
0088
Python的22个万用公式，你确定不看看吗

前言在大家的日常python程序的编写过程中，都会有自己解决某个问题的解决办法，或者是在程序的调试过程中，用来帮助调试的程序公式。小编通过几十万行代码的总结处理，总结出了22个…

Python 2023年11月8日
0055
python包合集-cffi

cffi是连接Python与c的桥梁，可实现在Python中调用c文件。cffi为c语言的外部接口，在Python中使用该接口可以实现在Python中使用外部c文件的数据结构及函数…

Python 2023年11月1日
0056
Python的Matplotlib绘图嵌入PyQt5界面（GUI）方法

利用业余时间刚刚学习Python两个月左右，涉及工作中将计算数据图形化，最后又想将图形插入GUI。先记一下流水账。首先，针对工作任务完成了面向过程编程，用matplotlib的p…

Python 2023年9月1日
0077
IPv6（计算机网络-网络层）

目录 IPv6 的特点 IPv6 数据报的格式 IPv6 分组的格式 IPv6 的扩展首部从计算机本身发展以及从互联网规模和网络传输速率来看，现在 IPv4已很不适用。要解决 …

Python 2023年10月8日
0048
c语言练习1：输入三个整数a,b,c，请把这3个数由小到大输出

代码如下： #include //#define _CRT_SECURE_NO_WARNINGS 1 void min_to_max() { int a, b, c,temp; p…

Python 2023年6月10日
00110
DataFrame详解——缺失数据处理

缺失数据处理方法解释DataFrame.backfill([axis, inplace, limit, …])后向填充，等同于 DataFrame.fillna(me…

Python 2023年8月7日
0048
python进行敏感性分析（SALib库)

Original: https://www.cnblogs.com/tuixiulaozhou/p/16723058.htmlAuthor: 退休的老周Title: python进…

Python 2023年6月9日
0098
JAVA中让Swagger产出更加符合我们诉求的描述文档，按需决定显示或者隐藏指定内容

大家好，又见面啦。在前一篇文档《JAVA中自定义扩展Swagger的能力，自动生成参数取值含义说明，提升开发效率》中，我们探讨了如何通过自定义注解的方式扩展swagger的能力让…

Python 2023年10月22日
0051
Python数据分析(七) —— numpy数组的计算与转置

本文主要讲述numpy数组的计算与转置，讲相同尺寸数组的运算与不同尺寸数组的运算，同时介绍数组转置的三种方法。numpy数组的操作比较枯燥，但是都很实用，在很多机器学习、深度学习算…

Python 2023年8月27日
0044
python-*arg，**kwargs在pytest中的使用

本文章引自其他文章，这里主要讲下在pytest中封装接口的使用。详细的使用可以看下原文章：https://www.cnblogs.com/cwind/p/8996000.html简…

Python 2023年9月14日
0052

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

series选取值_pandas中dataFrame的取值和计算操作

打印出dataFrame

loc通过标签来选择数据

iloc通过位置来选择数据

打印结果

打印输出

从dataFrame里取出的行或列的类型为Series，其可以看做为一个字典，对Series取值：

打印输出

可以自荐将Series转换为一个list

输出一个值

大家都在看