Python正则表达式中group与groups的用法详解
作者:专注算法的马里奥学长 发布时间:2022-02-13 16:16:27
在Python中,正则表达式的group和groups方法是非常有用的函数,用于处理匹配结果的分组信息。
group方法是re.MatchObject类中的一个函数,用于返回匹配对象的整个匹配结果或特定的分组匹配结果。而groups方法同样是re.MatchObject类中的函数,它返回的是所有分组匹配结果组成的元组。在本文中,我们将详细讲解group和groups的用法和使用场景。
1 .group函数
1.1 返回整个匹配结果
当group方法不带参数时,它将返回整个匹配结果。例如,以下代码将匹配字符串中的数字和字母,并返回整个匹配结果:
import re
text = "abc123def456"
pattern = "\w+"
match = re.search(pattern, text)
print(match.group())
这段函数将输出abc123def456
在这个例子中,正则表达式\w+匹配了整个字符串中的所有数字和字母,group方法返回了整个匹配结果。这也是group最基本的用法。
1.2 返回指定分组的匹配结果
该函数默认传参为0,传入参数0(默认值)将返回整个匹配的子串,而传入参数1将返回第一个匹配的捕获组(即正则表达式中用括号括起来的部分)。
当正则表达式中包含分组时,group方法可以用于返回指定分组的匹配结果。每个分组都可以通过小括号括起来,用于将匹配结果分成多个组,可以通过在group方法中指定分组编号来获取指定分组的匹配结果。例如,以下代码将匹配字符串中的数字和字母,并返回匹配到的第一个数字和字母:
import re
text = "abc123def456"
pattern = "(\d+)(\w+)"
match = re.search(pattern, text)
print(match.group(1))
print(match.group(2))
这段代码的输出是:
在这个例子中,正则表达式(\d+)(\w+)匹配了字符串中的一个或多个数字和字母。(\d+)匹配了一个或多个数字,(\w+)匹配了一个或多个字母。group(1)返回了匹配到的第一个分组的结果,即数字,而group(2)返回了匹配到的第二个分组的结果,即字母。
同时,哲理的小括号也起到了分组的功能,关于小括号的用法可参考这篇文章:
Python正则表达式语法快速入门
1.3 处理没有匹配结果的情况
当正则表达式没有匹配到字符串中的任何内容时,调用group方法将会抛出AttributeError异常。因此,在调用group方法之前,应该先使用re.search等方法进行匹配,并使用返回值检查是否有匹配结果。例如,以下代码使用re.search方法查找字符串中是否包含“123”这个数字:
import re
text = "abc456def"
pattern = "\d+"
match = re.search(pattern, text)
if match:
print(match.group())
else:
print("No match")
在这个例子中,正则表达式\d+匹配一个或多个数字,但是字符串中并没有符合该模式的内容。因此,match变量的值为None,程序通过判断match是否为None来判断是否有匹配结果。
2. groups函数
groups方法是re.MatchObject类的一个函数,用于返回所有分组匹配结果组成的元组。该方法不接受任何参数。例如,以下代码将匹配字符串中的电话号码,并返回其中的区号和电话号码:
import re
text = "My phone number is (123)456-7890"
pattern = r"\((\d{3})\)(\d{3}-\d{4})"
match = re.search(pattern, text)
print(match.groups())
输出:
在这个例子中,正则表达式((\d{3}))(\d{3}-\d{4})匹配了字符串中的电话号码,其中小括号用于将正则表达式分成两个分组,分别匹配区号和电话号码。groups方法返回一个元组,其中包含所有分组的匹配结果。
3. group和groups的使用场景
group和groups方法常常用于处理正则表达式中的分组匹配结果。在处理正则表达式的过程中,有时需要将匹配结果按照一定的规则进行分组,以便更方便地处理这些结果。
例如,在使用正则表达式处理文本时,有时需要提取其中的某些信息,比如电话号码、电子邮件地址、URL等等。这些信息往往具有一定的规律,可以使用正则表达式进行匹配,然后使用group和groups方法将匹配结果按照一定的规则进行分组,便于进行进一步的处理。
此外,group和groups方法还可以用于替换匹配结果。在替换匹配结果时,可以使用分组来保留一些信息,然后使用group和groups方法将分组匹配结果进行组合,生成新的字符串。
来源:https://blog.csdn.net/nkufang/article/details/128997440


猜你喜欢
- 漏洞的产生原因代码层过滤不严。应用程序直接或间接使用了动态执行命令的危险函数,并且这个函数的运行参数是可控的系统的漏洞造成命令注入漏洞的本质
- 🥩数据采集🍖确定网址王者新赛季马上就要开始了,大家都开始冲榜了,准备拿一个小省标,那么,本文,就来练习获取各地最低战力的爬虫采集实战。确定好
- 本文为官方文档译文,官方文档现已非机器翻译 https://docs.microsoft.com/zh-cn/aspnet/core/fun
- Python的绘图库也允许用户创建优雅的图形,本章给大家介绍的是关于ggplot绘制画图的技巧,ggplot2建立在grid系统上,这个系统
- 由衷的感叹,js真是烦。学到现在,渐渐理解了什么是:语言都是通用的,没有好不好,只有擅长不擅长。继承,多态,甚至指针,c能实现,c++,ja
- views,中设置请求的类型class LawDetailView(View): def get(self, request, law_id
- 很早就在这里看到过解决方案,与嗷嗷讨论后发现这个方案还是很可靠的。当然,唯一的缺点就是每一个属性都要去Hack,但我在很多实践中,只用‘修正
- 1、引言小丝:鱼哥, 请教你个问题。小鱼:你觉得你得问题,是正儿八经的吗?小丝:那必须的, 人都正经,何况问题呢?小鱼:那可不敢说, 你得问
- 开始之前,安利一本正在看的书《站在两个世界的边缘》,作者程浩,上帝丢给他太多理想,却忘了给他完成理想的时间。OK,有兴趣的可以看一看。nod
- python 中提供一种用于对函数固定属性的函数(与数学上的偏函数不一样)# 通常会返回10进制int('12345') &
- 用户不想输入账号密码,一键登录 <label for="" @click="LoginDL&q
- 一、摘要Python使用被称为异常 的特殊对象来管理程序执行期间发生的错误。每当发生让Python不知所措的错误时,它都会创建一个异常对象。
- 数据驱动模式的测试好处相比普通模式的测试就显而易见了吧!使用数据驱动的模式,可以根据业务分解测试数据,只需定义变量,使用外部或者自定义的数据
- 学习了css一段时间,现在对css的一些技巧进行一次小结.希望能对那些刚学习css的新手们带来帮助.一、关于注释在创建xhtml+CSS网站
- 之前写了一篇flask开发环境搭建,今天继续,进行一个实战小项目-blog系统。blog系统很简单,只有一个页面,然后麻雀虽小五脏俱全。这里
- sympy版本:1.2假设求解矩阵方程AX=A+2X其中求解之前对矩阵方程化简为(A−2E)X=A令B=(A−2E)使用qtconsole输
- 阅读上一篇:什么是名字空间<meta http-equiv="Content-Type" co
- 大家都知道在Dreamwerver中可以很方便地实现记录集的分页显示,但是生成的代码的确很庞大,影响了网页的显示速度,看起来条理也不是很清晰
- 先看看结果吧,去bilibili上拿到的图片=-=第一步,导入模块import requestsfrom bs4 import Beauti
- 今天在pycharm中手贱,点击了项目exclude,直接懵逼,项目东西找不到了,奶奶的如图一番操作后如图所示,捣鼓了很久,恢复方法点击se