Python对字符数据进行清洗

import re
mystr = "hahaAAA哈哈綂123./!#鱫愛"
str1 = ''.join(re.findall('[\u4e00-\u9fa5]',mystr)) # 只保留汉字
print(str1)
str2 = ''.join(re.findall('[a-z]',mystr)) # 只保留小写字母
print(str2)
str3 = ''.join(re.findall('[0-9]',mystr)) # 只保留数字
print(str3)
str4 = ''.join(re.findall('[\u4e00-\u9fa5a-zA-Z0-9]',mystr)) # 只保留字母,汉字和数字
print(str4)
str5 = ''.join(re.findall('[^\u4e00-\u9fa5^a-z^A-Z^0-9]',mystr))# 只保留除了汉字、字母、数字以外的字符
print(str5)

Original: https://www.cnblogs.com/cnpolaris/p/14457397.html
Author: CNPolaris
Title: Python对字符数据进行清洗

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/712106/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 零食里的营养成分表百分比什么意思

    原文: http://www.nhc.gov.cn/ewebeditor/uploadfile/2013/02/20130204161215710.pdf 来看看花生的: Orig…

    技术杂谈 2023年5月31日
    0112
  • day6

    24.两两交换链表的节点 注意,首先是判断后面够不够两个节点。依然是使用虚拟节点。有一个需要注意的地方:要更新pre节点。 19.删除链表的倒数第 N 个结点 删除其中的节点,可以…

    技术杂谈 2023年7月10日
    0108
  • Badger简单使用

    badger 是 dgraph 开源的 LSMTree 的 KV 引擎,它相比 leveldb 有 KV 分离、事务、并发合并等增强,是 go 生态中比较生产级的存储引擎了。 要开…

    技术杂谈 2023年7月24日
    064
  • 【主流技术】Spring Boot中的微信支付(小程序)

    前言 微信支付是企业级项目中经常使用到的功能,作为后端开发人员,完整地掌握该技术是十分有必要的。 logo 一、申请流程和步骤 图1-1 注册微信支付账号 获取微信小程序APPID…

    技术杂谈 2023年7月10日
    0125
  • java学习之MybBaits

    0x00前言 我前面使用的jdbc和jdbc的工具类集成的但是它们在少部分代码的情况下会会简单,但是以后如果项目较大jdbc的固定代码会很难维护,如果使用框架会简单很多,也标志着j…

    技术杂谈 2023年6月21日
    099
  • 面向对象编程-基础

    面向对象是一种”建模思想” 把现实中的各种事物”虚拟化到程序中”(定义类就是一种封装) 类:对现实生活中一类具有共同属性和行为的事物…

    技术杂谈 2023年6月21日
    085
  • 简单易懂讲IO

    流式 IO 是传统 IO,通过构造输入输出流,讲信息从一个地方读取,输出到另一个地方。常见的有读取文件以及写入文件。 基本 API 流失 IO 基本可以分为两个门派,一个以 Inp…

    技术杂谈 2023年7月25日
    097
  • curl 获取请求响应时间

    curl -o /dev/null -s -w ‘%{time_connect}:%{time_starttransfer}:%{time_total}’ …

    技术杂谈 2023年5月30日
    075
  • 面向对象ooDay7

    .精华笔记:1)成员内部类: 应用率不高1.1)类中套类,外面的称为外部类,里面的称为内部类1.2)内部类通常只服务于外部类,对外不具备可见性1.3)内部类对象通常在外部类中创建1…

    技术杂谈 2023年7月11日
    060
  • canvaskit默认字体更改

    博客园 :当前访问的博文已被密码保护 请输入阅读密码: Original: https://www.cnblogs.com/bigben0123/p/15213977.htmlAu…

    技术杂谈 2023年5月31日
    092
  • nmake

    http://t.zoukankan.com/liangxiaofeng-p-3247968.html Original: https://www.cnblogs.com/hshy…

    技术杂谈 2023年5月31日
    0100
  • 如何编写更棒的代码:11个核心要点

    学习一种新的编程语言是一件很有趣的事情,你将学会用新的很酷的方式解决问题。如果让一个对某种语言很专业的人去学另外一种语言,很多时候会让人心有余而力不足。举个例子,让一个Java开发…

    技术杂谈 2023年5月31日
    081
  • PHP——SWOOLE发送串口指令

    公司开发智慧公厕。发送指令,研究了一周。头都大了。总结如下。 $in_data = "FF 03 00 00 00 64 51 FF"; $in_data = …

    技术杂谈 2023年5月31日
    086
  • 实现Kubernetes可观测性的3个最佳工具

    一个管理和实施得当的可观测性系统为DevOps提供了细化的洞察力,可用于调试和治愈复杂系统。可观察性将监控、警报和日志与指标可视化及其分析相结合。它允许开发团队详细了解Kubern…

    技术杂谈 2023年6月1日
    0105
  • 《新媒体营销精华:精准定位+爆款打造+匠心运营+内容变现》笔者的新书,欢迎各位粉丝上京东购买

    《新媒体营销精华:精准定位+爆款打造+匠心运营+内容变现》本书共分7 章。第1 章主要阐述新媒体营销概论,以统领全局的视角让读者对新媒体形成初步认知;第2 章重点讲解新媒体营销定位…

    技术杂谈 2023年5月30日
    092
  • PDF转换OFD(Java实用版)

    前言: 在项目中用到了,就写一下哈 OFD简介 百度百科:https://baike.baidu.com/item/OFD/56227163?fr=aladdin OFD(Open…

    技术杂谈 2023年6月21日
    0102
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球