python正则表达式常见的知识点汇总
作者:Begin?to?change 发布时间:2023-10-02 18:56:21
一、介绍
正则表达式是一个特殊的字符序列,计算机科学的一个概念。通常被用来检索、替换那些符合某个模式(规则)的文本。
许多程序设计语言都支持利用正则表达式进行字符串操作。在Python中需要通过正则表达式对字符串进行匹配的时候,可以使用re模块。re 模块使 Python 语言拥有全部的正则表达式功能。
二、查找方法的使用
1、match方法(只匹配字符串开头)
re.match尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。如果匹配成功,返回的是一个Match对象,要想获得其值要调用group()方法
group(0)返回的是整个匹配的所有内容(默认为0)
函数语法:
re.match(pattern,string,flags=0)
2、search方法(扫描整个字符串,找到第一个匹配)
re.search 扫描整个字符串并返回第一个成功的匹配。
函数语法:
re.search(pattern, string, flags=0)
3、re.match与re.search的区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。
4、findall方法(扫描整个字符串,找到所有的匹配)
在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。
注意: match 和 search 是匹配一次 findall 匹配所有。
语法格式:
re.findall(pattern,string,flags=0)
示例:
5、finditer方法(扫描整个字符串,找到所有的匹配,并返回一个可迭代对象)
和 findall 类似,在字符串中找到正则表达式所匹配的所有子串,并把它们作为一个迭代器返回
ret = re.finditer(r'\d+','he23ll34') # 得到的结果是一个可迭代对象
for x in ret: # 遍历 ret 取出里面的每一项匹配
print(x.group(), x.span()) # 匹配对象里的group保存了匹配的结果
三、re.Match类介绍
当我们调用re.match
方法、re.search
方法,或者对re.finditer
方法的结果进行迭代时,拿到的数据类型都是re.Match
对象。
四、正则表达式模式
1、非打印字符
2、特殊字符
3、定位符
4、限定符
五、替换
语法:
re.sub(pattern,repl,string,count=0)
六、贪婪模式和非贪婪模式
Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符;
非贪婪则相反,总是尝试匹配尽可能少的字符。
在*,?,+,{m,n}
后面加上 ?
使贪婪变成非贪婪。
七、示例
1、匹配用户名
用户名匹配:由数字、大小写字母、下划线_
和中横线-
组成,长度为4到14位,并且不能以数字开头。
^在括号外就是开头,在括号里就是取反
\D匹配一个非数字字符,等价于[^0-9]
[a-z0-9A-Z_\-]{3,13}表示可取范围为a-z的小写字母和数字0-9以及下划线中横线都可以,写在中括号里面的是与的关系,最后的大括号代表的是其匹配长度为[3-13](左闭右闭)(因为开头已经有一位是确定的了,所以后面的长度为[3-13])
r'^\D[a-z0-9A-Z_\-]{3,13}', 'sH_8'
2、匹配手机号
根据手机号的规则,对手机号前三位的格式进行了限制,因为有几种格式都可以,条件之间的关系为或,正则表达式中用|表示
r'^((13[0-9])|(14[5|7])|(15([0-3]|[5-9]))|(18[0,5-9]))\d{8}$'
3、匹配0~99之间的数字
开头是【1-9】中的一个数,个数为0或者1均可
后面的是【0-9】中的一个数,个数为0或者1
r'^[1-9]?[0-9]?$'
来源:https://blog.csdn.net/qq_41404557/article/details/124823119


猜你喜欢
- 1 端口映射举个例子来说明一下端口映射的作用。有A、B、C三台计算机,A、B互通,B、C互通,但是A、C不通,这个时候在C上开了一个Web服
- 一、time时间模块import time1 、时间戳:time.time()时间戳(timestamp):时间戳表示的是从1970年1月1
- 前言怎么样使用Python提高自己的工作效率,今天就给大家分享这个吧。我们经常用pandas读入读写excel文件,经常会遇到一个excel
- dict.setdefault(key, default=None) --> 有key获取值,否则设置 key:default,并返回
- Python字典设置默认值我们都知道,在 Python 的字典里边,如果 key 不存在的话,通过 key 去取值是会报错的。>>
- 认证登录django.contrib.auth中提供了许多方法,这里主要介绍其中的三个:1 authenticate(**cre
- 有一个需求, 需要从数据库中导出两张表的数据到同一个excel中鉴于是临时的业务需求, 直接使用Navicat 进行查询并导出数据.数据涉及
- 用header 发送cookie header("Set-Cookie: testcookie=中文
- 两者在使用效果上没有任何区别,都是为了将实例化后的vue挂载到指定的dom元素中。如果在实例化vue的时候指定el,则该vue将会渲染在此e
- 人生苦短,我用python!为什么很多人喜欢用python,因为包多呀,各种调包。但是调包有的时候也调的闹心,因为安装包不是失败就是很慢,很
- 如何向 pandas.DataFrame 添加新的列或行通过指定新的列名/行名来添加,或者用pandas.DataFrame的assign(
- 今天是五一劳动节,可是我们劳动人民的节日哦。很多大网站都设计了特殊的logo来表示向每一位普通的劳动者致敬!下面就让我们看看这些logo吧!
- 目录一、安装Py2neo二、连接Neo4j数据库1. 使用graph.run执行Cypher语句创建节点2. 使用Node数据结构创建节点3
- 1.需求描述编写一个 Python 程序,每次下载压缩包形式的文件后,自动将内部文件解压到当前文件夹后将压缩包删除,通过本案例可以学到的知识
- 共轭转置共轭转置The symbols (·)T , (·)∗, and (·)H are,respectively, the transp
- 元组:# 元组,一种不可变的序列,在创建之后不能做任何的修改# 1.不可变# 2.用()创建元组类型,数据项用逗号来分割# 3.可以是任何的
- SQL 事件探查器数据列 SQL &
- 本文实例讲述了javascript设计模式 – 原型模式原理与应用。分享给大家供大家参考,具体如下:介绍:在日常的开发过程中,我们经常会利用
- 当我们准备建立一个Web站点时,就必须向域名登记机构申请一个Internet域名,因此,我们通常希望了解自己准备使用的域名是否已经被注册,这
- 前言在前两篇文章中都使用HttpRequest这个http包来做api的请求然后github上面还有一个更有名,星星更多,社区也更活跃的ht