pythonforin替换字符_如何在pandas.Dataframe中替换字符串的一部分？

2023年8月17日下午7:30 • Python • 阅读 68

我试图替换pd.Dataframe中所有字符串的一部分,但它不起作用.

我的数据示例：

HLAA0101

HLAA0201

HLAA0202

HLAA0203

HLAA0205

我想要获得什么：

A0101

A0201

A0202

A0203

A0205

我的代码：

mhc = train_csv.mhc

for i in mhc:

i[0:2].replace(‘HLA’, ‘ ‘)

print(mhc)

但它不起作用.

最佳答案选项1：

df[‘mhc’] = df[‘mhc’].str[3:]

选项2：

df[‘mhc’] = df[‘mhc’].str.replace(r’^HLA’,”)

选项3：

df[‘mhc’] = df[‘mhc’].str.extract(r’HLA(.*)’, expand=False)

选项4 :(注意：有时列表理解比字符串/对象dtypes的内部向量化方法更快)

df[‘mhc’] = [s[3:] for s in df[‘mhc’]]

所有选项都会产生相同的结果：

In [26]: df

Out[26]:

mhc

0 A0101

1 A0201

2 A0202

3 A0203

4 A0205

时间为50.000行DF：

In [29]: df = pd.concat([df] * 10**4, ignore_index=True)

In [30]: %timeit df[‘mhc’].str[3:]

35.9 ms ± 3.18 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

In [31]: %timeit df[‘mhc’].str.replace(r’^HLA’,”)

162 ms ± 3.04 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

In [32]: %timeit df[‘mhc’].str.extract(r’HLA(.*)’, expand=False)

164 ms ± 4.87 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

In [33]: %timeit [s[3:] for s in df[‘mhc’]]

14.6 ms ± 18.6 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

In [34]: df.shape

Out[34]: (50000, 1)

结论：列表理解方法获胜.

Original: https://blog.csdn.net/weixin_30945845/article/details/112960922
Author: 1360785665
Title: pythonforin替换字符_如何在pandas.Dataframe中替换字符串的一部分？

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/752371/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python大数据-电商产品评论情感数据分析

目录一、项目背景二、项目目标三、分析方法与分析过程四、数据清洗数据抓取评论去重分词停用词词云图绘制五、数据分析评论数据情感倾向分析匹配情感词修正情感倾向LDA模型进行主题分析寻找…

Python 2023年7月31日
0056
React学习8（DOM的diff算法）

1.虚拟DOM中Key的作用 Key是虚拟DOM对象中的标识，当状态中的数据发生变化时，react会根据新数据生成新的虚拟 DOM,随后,react进行新虚拟Dom与旧虚拟DOM的…

Python 2023年8月9日
0051
pandas 两列组成字典格式；map使用；修改某一列的格式；agg聚合函数；assign函数；列表列拆分成多列

1、两列组成字典格式 df[["a", "b"]].set_index("a").to_dict()["b&q…

Python 2023年8月18日
0059
Vscode+anaconda环境使用numpy时候报错

问题描述：在使用Vscode+anaconda环境导入numpy或opencv包时候，报错报错描述：请求确认python版本与numpy版本；找不到对应模块等反反复复网上找了好…

Python 2023年8月24日
0037
深度学习：多层感知机和异或问题(Pytorch实现)

感知机模型假设输入空间(\mathcal{X}\subseteq \textbf{R}^n)，输出空间是(\mathcal{Y}={-1,+1})．输入(\textbf{x}\i…

Python 2023年10月29日
0077
Python3教程：多线程的使用教程

Python中使用线程有两种方式：函数或者用类来包装线程对象。函数式：调用 _thread 模块中的start_new_thread()函数来产生新线程。语法如下: 参数说明: …

Python 2023年11月2日
0056
畸变矫正、透视变换加速(OpenCV C++)

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 弹尽粮绝，会员救园：…

Python 2023年10月18日
0054
python-map()函数基本用法

最近经常遇到一个问题：输入端在同一行输入两个整型数字，并用空格间隔，问如何方便快捷的将这两个变量分别赋予给x1,x2？新手小白，由于不知道map（）函数的用法，便想要用仅有的知识…

Python 2023年11月1日
0031
Python实战项目2——自动获取酷狗音乐工具

🤵‍♂️ 个人主页@老虎也淘气个人主页✍🏻作者简介：Python学习者🐋 希望大家多多支持我们一起进步！😄如果文章对你有帮助的话，欢迎评论 💬点赞👍🏻 收藏 📂加关注今天分享p…

Python 2023年11月5日
0039
使用 Apache Hudi 实现 SCD-2（渐变维度）

数据是当今分析世界的宝贵资产。在向最终用户提供数据时，跟踪数据在一段时间内的变化非常重要。渐变维度 (SCD) 是随时间推移存储和管理当前和历史数据的维度。在 SCD 的类型…

Python 2023年10月18日
0046
给大四毕业生的建议——春招、留学、考公

零、前言在大四这样一个关键的阶段，我相信大家已经深思熟虑，为自己的人生选择了一条相对合适的道路。对我们专业而言，绝大多数同学选择了「考研」，仅有少数同学选择出国、考公、就业。在这…

Python 2023年10月16日
0034
VMware虚拟机安装Ubuntu 2022最新版详细图文安装教程(VMware虚拟机安装+Ubuntu下载+VMware虚拟机配置运行)

名人说：君子生非异也，善假于物也。——荀子Code_流苏(CSDN)o(‐＾▽＾‐)o很高兴你打开了这篇博客，跟着步骤一步步尝试安装吧。✧ 目录 * – 一、简单介绍 …

Python 2023年11月5日
0040
hashlib.md5()函数来筛选出系统重复文件并移除…

常常在下载网络素材时有很多的重复文件乱七八糟的，于是想实现一个去重的操作。【阅读全文】主要实现思路就是遍历出某个文件夹包括其子文件夹下面的所有文件，最后，将所有文件通过MD5函…

Python 2023年11月9日
0043
实训——基于大数据Hadoop平台的医疗平台项目实战

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年8月2日
0067
Tomcat的安装与Maven依赖Servlet的使用

Tomcat的安装与Maven依赖Servlet的使用 🍎一.Tomcat应用 * 🍒1.1什么是Tomcat 🍒1.2Tomcat下载安装 🍒1.3 IDEA插件Smart To…

Python 2023年11月7日
0030
python测试开发django-187.Bootstrap模态框(modal)如何在关闭时触发事件

前言 Bootstrap 模态框 (modal) 在关闭时，如何触发一些事件?比如重置表单，或者重置表单的校验。Bootstrap 模态框 (modal) 提供了4个显示和隐藏模态…

Python 2023年8月3日
0070

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pythonforin替换字符_如何在pandas.Dataframe中替换字符串的一部分？

大家都在看