Python中请不要再用re.compile了
作者:青南 发布时间:2021-08-30 23:57:51
前言
如果大家在网上搜索Python 正则表达式,你将会看到大量的垃圾文章会这样写代码:
import re
pattern = re.compile('正则表达式')
text = '一段字符串'
result = pattern.findall(text)
这些文章的作者,可能是被其他语言的坏习惯影响了,也可能是被其他垃圾文章误导了,不假思索拿来就用。
在Python里面,真的不需要使用re.compile!
为了证明这一点,我们来看Python的源代码。
在PyCharm里面输入:
import re
re.search
然后Windows用户按住键盘上的Ctrl键,鼠标左键点击search,Mac用户按住键盘上的Command键,鼠标左键点击search,PyCharm会自动跳转到Python的re模块。在这里,你会看到我们常用的正则表达式方法,无论是findall还是search还是sub还是match,全部都是这样写的:
_compile(pattern, flag).对应的方法(string)
例如:
def findall(pattern, string, flags=0):
"""Return a list of all non-overlapping matches in the string.
If one or more capturing groups are present in the pattern, return
a list of groups; this will be a list of tuples if the pattern
has more than one group.
Empty matches are included in the result."""
return _compile(pattern, flags).findall(string)
如下图所示:
然后我们再来看compile:
def compile(pattern, flags=0):
"Compile a regular expression pattern, returning a Pattern object."
return _compile(pattern, flags)
如下图所示:
看出问题来了吗?
我们常用的正则表达式方法,都已经自带了compile了!
根本没有必要多此一举先re.compile再调用正则表达式方法。
此时,可能会有人反驳:
如果我有一百万条字符串,使用使用某一个正则表达式去匹配,那么我可以这样写代码:
texts = [包含一百万个字符串的列表]
pattern = re.compile('正则表达式')
for text in texts:
pattern.search(text)
这个时候,re.compile只执行了1次,而如果你像下面这样写代码:
texts = [包含一百万个字符串的列表]
for text in texts:
re.search('正则表达式', text)
相当于你在底层对同一个正则表达式执行了100万次re.compile。
Talk is cheap, show me the code.
我们来看源代码,正则表达式re.compile调用的是_compile,我们就去看_compile的源代码,如下图所示:
红框中的代码,说明了_compile自带缓存。它会自动储存最多512条由type(pattern), pattern, flags)组成的Key,只要是同一个正则表达式,同一个flag,那么调用两次_compile时,第二次会直接读取缓存。
综上所述,请你不要再手动调用re.compile了,这是从其他语言(对的,我说的就是Java)带过来的陋习。
来源:https://juejin.im/post/5d144231f265da1bb67a2a29


猜你喜欢
- ROW_NUMBER()说明:返回结果集分区内行的序列号,每个分区的第一行从 1 开始。语法:ROW_NUMBER () OVER ( [
- 在MySQL中,使用auto_increment类型的id字段作为表的主键,并用它作为其他表的外键,形成“主从表结构”,这是数据库设计中常见
- 条形图是用宽度相同的条形的高度或长短来表示数据多少的图形。用来绘制离散的数据,能够一眼看出各个数据的大小,比较数据之间的差异。绘制一个简单的
- 锁是指在某组资源中,两个或两个以上的线程在执行过程中,在争夺某一资源时而造成互相等待的现象,若无外力的作用下,它们都将无法推进下去,死时就可
- <?php /** * Global Function * * @a
- 引言:闲来想到冒泡排序中的列表数据的排序,就想试试用随机数生成一个列表来排序试试,于是做了一下实验,本人实在是属于入门阶段,研究了一下终究还
- 近来学习tp5的过程中,项目中有个发帖功能,选择主题图片。如下:利用原始的文件上传处理,虽然通过原始js语句能实时显示上传图片,但是这样的话
- 前言分享一个Vue前端导出Excel文件的方法。记录学习!功能需求:将表格的全部数据导出Excel格式的文件前端:Vue3+Element-
- 使用如下命令为 ubuntu 系统安装 virtualenvsudo apt-get install python-virtualenv当我
- 以下所有例子中结构定义如下:type User struct { Id_ bson.ObjectId `bson:
- 昨天微信小程序(应用号)内测的消息把整个技术社区炸开了锅,我也忍不住跟了几波,可惜没有内测资格,听闻破解版出来了,今天早上就着原来的项目资源
- 引言今天给大家推荐的是web应用安全防护方面的一个包:csrf。该包为Go web应用中常见的跨站请求伪造(CSRF)攻击提供预防功能。cs
- 思路:创建浏览器驱动对象加载登录页面等待页面加载完毕切换到用户名和密码登录模式输入手机号, 注意此处需要等待并获取输入框输入密码点击验证按钮
- mysql 下载安装配置 5.7.20 / 5.7.21,供大家参考,具体内容如下1、下载mysql,下载地址选择操作系统和版本,我是64位
- 本文实例讲述了php7 参数、整形及字符串处理机制修改。分享给大家供大家参考,具体如下:参数处理机制修改一、重复参数命名不再支持。重复的参数
- 构思学生管理系统 应该包含老师注册登录 管理学生信息(增删改查)还有数据持久化因为数据存入JSON文件 增删改查都需要读取和修改文件所以需要
- 使用pyinstaller可以把.py文件打包为.exe可执行文件,命令为:pyinstaller hello.py打包后有两个文件夹,一个
- 本文实例介绍了实现js选项卡切换效果的详细代码,分享给大家供大家参考,具体内容如下思路: 1、获取元素;
- 1.tqdm模块是python进度条库, 主要分为两种运行模式1.1基于迭代对象运行: tqdm(iterator)import timef
- 当项目里用npm安装了babel-cli之类的包时,webstorm在索引node_modules文件时,会卡死接近这个问题的办法是把nod