自动化办公:手机号码提取器,使用正则表达式轻松提取文本文件中的手机号码

关于手机号码的提取,其实真正有用的部分就是re模块提供的正则表达式。使用正则表达式就能轻松地匹配到手机号码,由于功能比较简单这次并没有采用UI界面的方式来实现该功能。

【阅读全文】

自动化办公:手机号码提取器,使用正则表达式轻松提取文本文件中的手机号码

步骤1:编写控制台输入函数。

[En]

Step 1: write a console input function.

path = input('请输入需要提取手机号码的文件路径(.txt):\n')

步骤2:读取包含手机号的文本文件。

[En]

Step 2: read the text file containing the mobile phone number.

def read_text(path):
    '''
    读取文本文件
    :param path: 文本文件路径
    :return: 返回文本
    '''
    file = open(path,encoding="utf-8")
    text = file.read()
    file.close()
    return text

第三步:使用常规匹配来匹配文本中的电话号码并返回。

[En]

Step 3: use a regular match to match the phone number in the text and return.

import re  # 导入正则表达式处理模块

def get_phone(text):
    '''
    使用正则表达式提取文本中的手机号
    :param text: 原始文本
    :return: 手机号数组
    '''
    phones = re.findall(r'(13\d{9}|14[5|7]\d{8}|15\d{9}|166{\d{8}|17[3|6|7]{\d{8}|18\d{9})', text)
    return phones

第四步:执行功能函数。

text = read_text(path)  # 执行文本文件读取函数

result = get_phone(text)  # 执行文本正则匹配手机号函数

from pprint import pprint  # 导入pprint打印接口

pprint(result)

使用方法,启动.py文件之后输入包含手机号码的.txt文件路径就能完成手机号码的提取。

准备好包含手机号码的文本文件(.txt文件)。

我是公众号:[Python 集中营] 15934689023,其中包含手机号码。
我是公众号:[Python 集中营] 15934689024,其中包含手机号码。
我是公众号:[Python 集中营] 15934689025,其中包含手机号码。
我是公众号:[Python 集中营] 15934689026,其中包含手机号码。
我是公众号:[Python 集中营] 15934689027,其中包含手机号码。
我是公众号:[Python 集中营] 15934689028,其中包含手机号码。
我是公众号:[Python 集中营] 15934689029,其中包含手机号码。
我是公众号:[Python 集中营] 15934689030,其中包含手机号码。
我是公众号:[Python 集中营] 15934689031,其中包含手机号码。
我是公众号:[Python 集中营] 15934689032,其中包含手机号码。
我是公众号:[Python 集中营] 15934689033,其中包含手机号码。
我是公众号:[Python 集中营] 15934689034,其中包含手机号码。
我是公众号:[Python 集中营] 15934689035,其中包含手机号码。
我是公众号:[Python 集中营] 15934689036,其中包含手机号码。
我是公众号:[Python 集中营] 15934689037,其中包含手机号码。
我是公众号:[Python 集中营] 15934689038,其中包含手机号码。
我是公众号:[Python 集中营] 15934689039,其中包含手机号码。
我是公众号:[Python 集中营] 15934689040,其中包含手机号码。

返回的结果是一个只有一个手机号码的数组文件。

[En]

The return result is an array file with only a mobile phone number.

['15934689023',
 '15934689024',
 '15934689025',
 '15934689026',
 '15934689027',
 '15934689028',
 '15934689029',
 '15934689030',
 '15934689031',
 '15934689032',
 '15934689033',
 '15934689034',
 '15934689035',
 '15934689036',
 '15934689037',
 '15934689038',
 '15934689039',
 '15934689040',
 '15934689041',
 '15934689042',
 '15934689043',
 '15934689044',
 '15934689045',
 '15934689046',
 '15934689047',
 '15934689048',
 '15934689049',
 '15934689050',
 '15934689051',
 '15934689052',
 '15934689053']

自动化办公:手机号码提取器,使用正则表达式轻松提取文本文件中的手机号码

【往期精彩】

刚刚发现的可视化动态图库ipyvizzu,太好看了!

记住这些windows网络操作命令,轻松搞定自己的电脑网络!

word文档样式批量处理,久违了!

python 如何在多层循环中使用break/continue!

用python为心爱的人制作520照片墙,已成功做出效果图!

Original: https://www.cnblogs.com/lwsbc/p/16357020.html
Author: Python集中营
Title: 自动化办公:手机号码提取器,使用正则表达式轻松提取文本文件中的手机号码

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/499421/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Linux 下搭建 Kafka 环境

    Linux 下搭建 Kafka 环境 作者:Grey 原文地址: 博客园:Linux 下搭建 Kafka 环境 CSDN:Linux 下搭建 Kafka 环境 环境要求 操作系统:…

    Python 2023年10月18日
    0109
  • Anaconda快速安装pytorch几分钟离线快速安装一定可行 下载缓慢conda install offline pytorch cudatoolkit slowly

    Anaconda快速安装pytorch几分钟离线快速安装一定可行 Ananconda是一个集成管理python环境的工具。只是安装pytorch的时候,慢得让人怀疑人生,甚至需要一…

    Python 2023年9月8日
    078
  • Python Web前后端分离框架Django+Vue搭建

    Python Web前后端分离框架Django+Vue搭建 对前面所学知识的归纳整理,感兴趣的可以看看,欢迎指正。 一、前后端分离框架介绍 本项目基于 Python 的 Web 框…

    Python 2023年8月4日
    0124
  • 爬虫框架Scrapy(1)Scrapy框架安装与项目开发

    文章目录 * – 一. Scrapy框架简介 – + * 1. Scrapy 框架介绍 * 2. 数据处理流程 – 二. Scrapy 及其依赖…

    Python 2023年10月5日
    071
  • 深圳二手房房价分析及预测

    *分析目标: 通过处理后的房价数据,筛选对房价有显著影响的特征变量。 确定特征变量,建立深圳房价预测模型并对假设情景进行模拟 *数据预处理 `pythonimport pandas…

    Python 2023年8月17日
    096
  • 【python游戏制作】僵尸来袭 ~ 快来一起创造植物叭~

    前言 哈喽!大家好,我是魔王呐~ 看到下面这一段话,大家是不是会想起你在某种时候玩过的一款游戏呐~ 一魅惑菇 晃着脑袋生产阳光的向日葵,突突突吐着子弹的豌豆射手!​ 行动迟缓种类丰…

    Python 2023年8月2日
    095
  • 将图片保存到mysql数据库并展示在前端页面

    小编使用python中的django框架来完成! 1,首先用pycharm创建django项目并配置相关环境 这里小编默认项目都会创建 settings.py中要修改的两处配置 D…

    Python 2023年8月6日
    0111
  • python 绘制3D图

    python 绘制3D图 1.散点图 * 代码 输入的数据格式 2.三维表面 surface * 代码 输入的数据格式 scatter + surface图形展示 3. 三维瀑布图…

    Python 2023年8月29日
    0103
  • 1.Series和DataFrame

    0.文件的导入和导出 ① Excel 1.导入表格 df=pd.read_excel(‘1月.xlsx’,sheet_name=’莫寒’) 不指定sheet则导入第一张 2.导入指…

    Python 2023年8月7日
    080
  • django 静态文件static路径没问题,就是加载不了框架

    在我学习jango的过程中我按照正常情况在前导入{% load static %} 然后在插入 再然后就在bootstrap网站导入框架。如图所示 {% load static %…

    Python 2023年8月5日
    0131
  • 万字泣血解析割韭菜内情,程序员别老想着做副业

    前言 最近有准备一篇干货,但想了想还是先放放,眼看年关将近,写点其他对大家有用的内容。今年见了不少人被割韭菜,下半年尤为严重,这种情形甚至在技术行业蔓延,令人深感大环境的复杂变化,…

    Python 2023年10月16日
    077
  • 现代 CSS 之高阶图片渐隐消失术

    在过往,我们想要实现一个图片的渐隐消失。最常见的莫过于整体透明度的变化,像是这样: div { width: 300px; height: 300px; background: u…

    Python 2023年10月13日
    063
  • pygame实现井字棋——2.逻辑实现

    前言 我们在上一篇博客中实现了九宫格的绘制,为我们打下了基础。这次我们来实现基本的逻辑,比如判断输赢、玩家和电脑分别下棋的逻辑。 下棋 玩家 我们之前在 Lattice类中,有一个…

    Python 2023年9月20日
    081
  • Python练习实例022

    问题:两个乒乓球队进行比赛,各出三个。甲队为a, b, c三个,乙队为x, y, z三个。已抽签决定比赛名单。有人向队员打听比赛的名单。a说他不和x比,c说他不和x, z比,请编程…

    Python 2023年6月11日
    0104
  • 菜鸟逆袭记

    菜鸟逆袭记 * – 自我介绍 – 学习编程的计划 – 未来展望 自我介绍 我叫陈雨,来自湖北襄阳。现就读于浙江海洋大学,计算机科学与技术专业.我…

    Python 2023年11月7日
    095
  • 并发编程Bug起源:可见性、有序性和原子性问题

    以前古老的 DOS操作系统,是单进行的系统。系统每次只能做一件事情,完成了一个任务才能继续下一个任务。每次只能做一件事情,比如在听歌的时候不能打开网页。所有的任务操作都按照串行的方…

    Python 2023年10月23日
    098
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球