Python自动化办公之手机号提取
作者:Python 发布时间:2022-12-26 11:31:46
关于手机号码的提取,其实真正有用的部分就是re模块提供的正则表达式。使用正则表达式就能轻松地匹配到手机号码,由于功能比较简单这次并没有采用UI界面的方式来实现该功能。
第一步:写一个控制台输入函数。
path = input('请输入需要提取手机号码的文件路径(.txt):\n')
第二步:读取包含手机号码的文本文件。
def read_text(path):
'''
读取文本文件
:param path: 文本文件路径
:return: 返回文本
'''
file = open(path,encoding="utf-8")
text = file.read()
file.close()
return text
第三步:使用正则匹配文本中的手机号并返回。
import re # 导入正则表达式处理模块
def get_phone(text):
'''
使用正则表达式提取文本中的手机号
:param text: 原始文本
:return: 手机号数组
'''
phones = re.findall(r'(13\d{9}|14[5|7]\d{8}|15\d{9}|166{\d{8}|17[3|6|7]{\d{8}|18\d{9})', text)
return phones
第四步:执行功能函数。
text = read_text(path) # 执行文本文件读取函数
result = get_phone(text) # 执行文本正则匹配手机号函数
from pprint import pprint # 导入pprint打印接口
pprint(result)
使用方法,启动.py文件之后输入包含手机号码的.txt文件路径就能完成手机号码的提取。
准备好包含手机号码的文本文件(.txt文件)。
我是公众号:[Python 集中营] 15934689023,其中包含手机号码。
我是公众号:[Python 集中营] 15934689024,其中包含手机号码。
我是公众号:[Python 集中营] 15934689025,其中包含手机号码。
我是公众号:[Python 集中营] 15934689026,其中包含手机号码。
我是公众号:[Python 集中营] 15934689027,其中包含手机号码。
我是公众号:[Python 集中营] 15934689028,其中包含手机号码。
我是公众号:[Python 集中营] 15934689029,其中包含手机号码。
我是公众号:[Python 集中营] 15934689030,其中包含手机号码。
我是公众号:[Python 集中营] 15934689031,其中包含手机号码。
我是公众号:[Python 集中营] 15934689032,其中包含手机号码。
我是公众号:[Python 集中营] 15934689033,其中包含手机号码。
我是公众号:[Python 集中营] 15934689034,其中包含手机号码。
我是公众号:[Python 集中营] 15934689035,其中包含手机号码。
我是公众号:[Python 集中营] 15934689036,其中包含手机号码。
我是公众号:[Python 集中营] 15934689037,其中包含手机号码。
我是公众号:[Python 集中营] 15934689038,其中包含手机号码。
我是公众号:[Python 集中营] 15934689039,其中包含手机号码。
我是公众号:[Python 集中营] 15934689040,其中包含手机号码。
返回结果是一个只有手机号码的数组文件。
['15934689023',
'15934689024',
'15934689025',
'15934689026',
'15934689027',
'15934689028',
'15934689029',
'15934689030',
'15934689031',
'15934689032',
'15934689033',
'15934689034',
'15934689035',
'15934689036',
'15934689037',
'15934689038',
'15934689039',
'15934689040',
'15934689041',
'15934689042',
'15934689043',
'15934689044',
'15934689045',
'15934689046',
'15934689047',
'15934689048',
'15934689049',
'15934689050',
'15934689051',
'15934689052',
'15934689053']
来源:https://www.cnblogs.com/lwsbc/p/16357020.html


猜你喜欢
- 第7个PPT的代码是用 JS 去设置 CSS,这与“不同浏览器解析DOM不同”没有任何关系,是CSS的兼容性!而且用JS去直接设样式是技术理
- 如下所示:#随机数的使用import random #导入randomrandom.randint(0,9)#制定随机数0到9i=rando
- 刚刚在学习些测试报告的时候,出现一个路径的问题,找了很久的原因,竟然是少了一个反斜杠引起的,在此顺便记录一下正反斜杠的作用。在Python中
- MySQL是一个小巧玲珑但功能强大的数据库,目前十分流行。但是官网给出的安装包有两种格式,一个是msi格式,一个是zip格式的。很多人下了z
- 一、朋友圈九宫格效果图二、图片基本操作打开要处理的图片判断打开的图片是否为正方形如果是正方形,就进行九等分,如果不是正方形,先用白色填充为正
- 今天的主题!最近很多朋友问起pyecharts,尤其是地理坐标图的制作,都说被其图形之美给吸引到了。刚好今天也有同事问起来,那么今天就以py
- 概念第一步:计算一个梯度 Ix,Iy第二步:整合矩阵,计算特征值第三步:比较特征值的大小第四步: 非极大值抑制,把真正的角点留下来,角点周围
- Checkbutton(多选按钮)组件用于实现确定是否选择的按钮。Checkbutton 组件可以包含文本或图像,你可以将一个 Python
- 本文实例讲述了Thinkphp5框架实现获取数据库数据到视图的方法。分享给大家供大家参考,具体如下:这是学习thinkhp5的基础篇笔记。这
- 本文实例为大家分享了python五子棋游戏的具体代码,供大家参考,具体内容如下目录简介实现过程结语简介使用python实现pygame版的五
- 最近因项目需要用ACCESS做数据库开发WEB项目看论坛上还许多人问及ACCESS被注入的安全问题许多人解决的方法仍然是用Replace替换
- 受<! #include file="filename.asp" --> 宏限制必须存在该文件并且会预先编译
- 文件名全小写,可使用下划线包应该是简短的、小写的名字。如果下划线可以改善可读性可以加入。如mypackage。模块与包的规范同。如mymod
- 无聊统计了下列表去重到底有多少种方法。下面小编给大家总结一下,具体内容详情如下;开发中对数组、列表去重是非常常见的需求,对一个list中的i
- 看代码吧~import numpy as np a = np.array([[1,1,1],[2,2,2],[3,3,3], [4,4,4]
- 示例代码: BulkStockBll bll = new BulkStockBll(); DataSet ds = bll.GetBulkS
- assert(断言)用于判断一个表达式,在表达式条件为 false 的时候触发异常。断言可以在条件不满足程序运行的情况下直接返回错误,而不必
- 1.选择File -> Settings2.选择 File and Code Templates -> Files ->
- pytest官方文档fixtures调用既然fixtures是给执行测试做准备工作的,那么pytest如何知道哪些测试函数 或者 fixtu
- 给定list,如何以空格/逗号等符号以分隔符输出呢?一般的,简单的for循环可以打印出list的内容:l=[1,2,3,4]for i in