python dataframe两列相乘_在pandas/python的dataframe中组合两列文本

2023年8月8日下午1:52 • Python • 阅读 65

小数据集(150行)[”.join(i) for i in zip(df[“Year”].map(str),df[“quarter”])]

或稍慢但更紧凑：df.Year.str.cat(df.quarter)

较大的数据集(150行)df[‘Year’].astype(str) + df[‘quarter’]

更新：计时图Pandas 0.23.4

python dataframe两列相乘_在pandas/python的dataframe中组合两列文本

让我们在200K行DF上测试一下：In [250]: df

Out[250]:

Year quarter

0 2014 q1

1 2015 q2

In [251]: df = pd.concat([df] * 10**5)

In [252]: df.shape

Out[252]: (200000, 2)

更新：使用Pandas 0.19.0的新计时

计时无CPU/GPU优化(从最快到最慢排序)：In [107]: %timeit df[‘Year’].astype(str) + df[‘quarter’]

10 loops, best of 3: 131 ms per loop

In [106]: %timeit df[‘Year’].map(str) + df[‘quarter’]

10 loops, best of 3: 161 ms per loop

In [108]: %timeit df.Year.str.cat(df.quarter)

10 loops, best of 3: 189 ms per loop

In [109]: %timeit df.loc[:, [‘Year’,’quarter’]].astype(str).sum(axis=1)

1 loop, best of 3: 567 ms per loop

In [110]: %timeit df[[‘Year’,’quarter’]].astype(str).sum(axis=1)

1 loop, best of 3: 584 ms per loop

In [111]: %timeit df[[‘Year’,’quarter’]].apply(lambda x : ‘{}{}’.format(x[0],x[1]), axis=1)

1 loop, best of 3: 24.7 s per loop

计时使用CPU/GPU优化：In [113]: %timeit df[‘Year’].astype(str) + df[‘quarter’]

10 loops, best of 3: 53.3 ms per loop

In [114]: %timeit df[‘Year’].map(str) + df[‘quarter’]

10 loops, best of 3: 65.5 ms per loop

In [115]: %timeit df.Year.str.cat(df.quarter)

10 loops, best of 3: 79.9 ms per loop

In [116]: %timeit df.loc[:, [‘Year’,’quarter’]].astype(str).sum(axis=1)

1 loop, best of 3: 230 ms per loop

In [117]: %timeit df[[‘Year’,’quarter’]].astype(str).sum(axis=1)

1 loop, best of 3: 230 ms per loop

In [118]: %timeit df[[‘Year’,’quarter’]].apply(lambda x : ‘{}{}’.format(x[0],x[1]), axis=1)

1 loop, best of 3: 9.38 s per loop

回答@anton vbr的贡献

Original: https://blog.csdn.net/weixin_42370927/article/details/114360180
Author: 打盹儿的番茄
Title: python dataframe两列相乘_在pandas/python的dataframe中组合两列文本

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/742401/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Pandas之数据结构解析——Series的介绍

作为数据分析师，在日常生活中我们会接触到各种各样的需求，其中excel更必不可少，面对庞大数据量，快速的需求我们该如何处理，这时Pandas就显得举足轻重，可以快速有效的处理表格数…

Python 2023年8月7日
0054
深度学习环境、框架搭建(Conda,Pytorch,PyChram，jupyter)

本文描述了深度学习所需要的一些环境搭建和框架安装一、Conda的安装和虚拟环境的创建；二、Pytorch不同版本的安装(CPU和GPU); 三、PyCharm的安装和虚拟环境的…

Python 2023年9月9日
0054
Ubuntu部署Django项目方法详解

配置镜像源就不说了，前面的文章好像已经讲过如何配置镜像源，如果你没配置镜像源，下载回很慢很慢的。一、更新操作系统和安装依赖包 1-分别执行一下命令，更新安装包 sudo apt-…

Python 2023年8月5日
0060
6.Django设计模式及模版层

目录 1 Django设计模式 1.1 MVC模式 1.2 MTV模式 2 模版层 2.1 模版配置 2.2 加载模版 2.2.1 方案一 loader 2.2.2 方案二直接r…

Python 2023年8月4日
0062
使用django admin显示外键关联下拉选项，并在点击保存后将外键关联值更新到本表中

首先，我这个想增加这个模型数据时有一个下拉选项是Customer表中的字段，然后想通过选择该选项保存后，把这个选项的值添加到本表中的customer_name字段。第一个红框处是外…

Python 2023年8月4日
0062
python教程：一个 list 使用 for 遍历，边循环边删除的问题

今天由于要对一个 list 数据类型写一个循环删除的程序（这是小编第一次对于 list 操作），但发现一个奇异问题，来，我们来看看代码跟效果：初始化一个 list 列表，为了下边…

Python 2023年5月23日
0078
conda基本操作

１、创建虚拟环境： Anaconda创建环境：比如，创建pyhon＝3.6的版本环境取名叫 nlp conda create -n nlp python=3.6 2 、删除虚拟环…

Python 2023年9月9日
0060
Numpy数组基本切片语法

基本切片语法是 i:j:k，对应 start:stop:step其中 i 是起始索引，j 是停止索引，k 是步子（k!=0）少爷四步法判断切片范围1.判断 i，j 是否有缺，有缺…

Python 2023年8月25日
0050
Pandas库回顾与分享（二）

Pandas库是一个专门用于数据分析的开源Python库，有Series（序列）和DataFrame（数据框）这两种数据结构。 6 索引对象的其他功能与Python常用数据结构相…

Python 2023年8月21日
0056
初学Python：使用Pygame开发一款线上对弈益智游戏（服务器+线程）

机缘：突然觉得我应该学习一项新编程语言了前段时间将自己以前的以前用VB和ASP编写的几个小程序，申请了软著，收到证书后，突然有种想学习新编程语言的冲动。于是买了Python编程从…

Python 2023年9月23日
0049
全网最详细numpy的argmin与argmax解析（一次性理解np.argmin）

本文以np.argmin()进行讲解，np.argmax()与之类似，np.argmin()求最小值对应的索引，np.argmax()求最大值对应的索引首先看一下官方注释 de…

Python 2023年8月2日
0055
免费访问google搜索google学术等网站（保姆级图文）

404. 抱歉，您访问的资源不存在。 [TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:…

Python 2023年6月3日
0086
2021/9/2

在win10下安装模块需要管理员权限，cmd用管理员运行，然后再开始 pip install pygame Exception:Traceback (most recent ca…

Python 2023年9月25日
0038
windows上后台运行程序

在Linux上我们可以通过 nohup & 来在后台运行程序或者命令在windows上我们也可以有类似的操作那就是通过 start /b 我们可以通过 start /? 来…

Python 2023年8月15日
0073
Pandas基础入门知识点总结

目录 1、pandas 常用类 1.1 Series 1.1.1创建 Series 1.1.2 访问 Series 数据 1.1.3 更新、插入和删除 1.2 DataFrame …

Python 2023年8月18日
0040
ImageNet1K的下载与使用

0、前言 2、val集 * 2.1 下载 2.2 处理 0、前言 ImageNet不用多说，它包含了非常多的图片，总共有2w多个分类，但是显然太多。所以一般更常用的是ImageNe…

Python 2023年10月10日
0084

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

python dataframe两列相乘_在pandas/python的dataframe中组合两列文本

大家都在看