Python正则表达式re.search()用法详解
作者:IT之一小佬 发布时间:2021-08-28 03:24:46
re.search():匹配整个字符串,并返回第一个成功的匹配。如果匹配失败,则返回None
pattern: 匹配的规则,
string : 要匹配的内容,
flags 标志位 这个是可选的,就是可以不写,可以写, 比如要忽略字符的大小写就可以使用标志位
flags : 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:
re.I 忽略大小写
re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
re.M 多行模式
re.S 即为 . 并且包括换行符在内的任意字符(. 不包括换行符)
re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
re.X 为了增加可读性,忽略空格和 # 后面的注释
示例代码:【检查字符串是否以 "Long" 开头并以 "China" 结尾】
import re
s = "Long live the people's Republic of China"
ret = re.search("^Long.*China$", s)
print(ret)
print(ret.group())
print(ret[0])
运行结果:
示例代码:【在字符串中搜索第一个空白字符】
import re
s = "Long live the people's Republic of China"
ret = re.search("\s", s)
print(ret)
print(ret.start())
运行结果:
示例代码:【如果search未匹配到,返回None】
import re
s = "Long live the people's Republic of China"
ret = re.search("USA", s)
print(ret)
运行结果:
示例代码:【忽略大小写】
import re
s = "Long live the people's Republic of China"
# ret1 = re.search('long', s) 这行代码直接报错
ret1 = re.search('l', s)
print(ret1)
print(ret1.span())
print(ret1.string)
print(ret1.group())
print("*" * 50)
ret2 = re.search('long', s, re.I)
print(ret2)
print(ret2.span())
print(ret2.string)
print(ret2.group())
运行结果:
示例代码:【group()的使用】
import re
s = 'abc123def456ghi789'
ret_compile = re.compile("([a-z]*)([0-9]*)([a-z]*)")
print(ret_compile)
ret = ret_compile.search(s)
print(ret)
print(ret.group())
print(ret.group(0)) # group()和group(0) 一样匹配的是整体
print(ret.group(1)) # 匹配第1个小括号的内容
print(ret.group(2)) # 匹配第2个小括号的内容
print(ret.group(3)) # 匹配第3个小括号的内容
运行效果:
示例代码:【group()分组的使用】
import re
s = 'abc123def456ghi789'
ret_compile = re.compile("(?P<num1>[a-z]*)(?P<num2>[0-9]*)(?P<num3>[a-z]*)")
print(ret_compile)
ret = ret_compile.search(s)
print(ret)
print(ret.group())
print(ret.group(0)) # group()和group(0) 一样匹配的是整体
print(ret.group(1)) # 匹配第1个小括号的内容
print(ret.group(2)) # 匹配第2个小括号的内容
print(ret.group(3)) # 匹配第3个小括号的内容
print("*" * 100)
print(ret.group())
print(ret.group("num1")) # 这里效果等同于group(1)
print(ret.group("num2")) # 这里效果等同于group(3)
print(ret.group("num3")) # 这里效果等同于group(3)
运行效果:
总结:为匹配方便,能用search就不用match,match方法限定匹配时,头部必须是一致的
匹配演练:最后我们做些匹配演练,实战下
import re
html='''<div id="songs-list">
<h2 class="title">经典老歌</h2>
<p class="introduction">
经典老歌列表
</p>
<ul id ="list" class="list-group">
<li data-view="2">一路上有你</li>
<li data-view="7">
<a href="/2.mp3" singer="任贤齐">沧海一声笑</a>
</li>
<li data-view="4" class="active">
<a href="/3.mp3" singer="齐秦">往事随风</a>
</li>
<li data-view="6"><a href="/4.mp3" singer="beyond">光辉岁月</a></li>
<li data-view="5"><a href="/5.mp3" singer="陈惠琳">记事本</a></li>
<li data-view="5">
<a href="/6.mp3" singer="邓丽君"><i class="fa fa-user"></i>但愿人长久</a>
</li>
</ul>
</div>
'''
上面是html代码,要求匹配出 第3个li标签中的齐秦 往事随风 ,代码如下:
result = re.search('<li.*?active.*?singer="(.*?)">(.*?)</a>',html,re.S)#re.S确保.能匹配到换行符
if result:
print(result.group(1),result.group(2))
结果:
齐秦 往事随风
我们还要求匹配出第二个li标签中的内容 任贤齐 沧海一声笑
result = re.search('<li.*?singer="(.*?)">(.*?)</a>',html,re.S)
if result:
print(result.group(1),result.group(2))
结果:
任贤齐 沧海一声笑
如果匹配时候不需要匹配换行符,那么参数中就没必要带re.S,比如匹配第4个和第5个li标签中的歌手和歌名。但是re.search也仅仅是返回一个符合匹配的结果。如果我们要返回符合匹配的所有结果,要用到re.findall。这一节的re.search就说到这里。
总结
来源:https://blog.csdn.net/weixin_44799217/article/details/122069415


猜你喜欢
- 维护脚本一例,写得有点乱,只是作为一个实例,演示如何快速利用工具快速达到目的:应用到:shell与python数据交互、数据抓取,编码转换#
- 如下所示:device = torch.device("cuda:0" if torch.cuda.is_availab
- PDOStatement::fetchColumnPDOStatement::fetchColumn — 从结果集中的下一行返回单独的一列。
- python使用pyecharts库画地图数据可视化导库中国地图代码结果世界地图代码结果省级地图代码结果地级市地图代码结果导库from py
- 在开始安装SQL Server 2005数据库过程中,出现了下面的错误,安装不能继续进行:The SQL Server System Con
- IWinter 是一个路由转控制器的 node 库,只解决一个问题:为了让使用者以更优雅的姿势进行路由的编写。支持在 Express 和 K
- 先来看一个老掉牙的故事:福特说,我在设计汽车之前,到处去问人们“需要一个什么样的更好的交通工具?”,几乎所有人的答案都是 ── 一匹“更快的
- ajax开发中, 常遇到下面的几种情况: 1 服务端需要返回一段普通文本给客户端 2 服务端需要返回一段HTML代码给客户端 3 服务端需要
- 这里是说watch调用methods里方法的时候,页面经常会报找不到方法这个时候一定要在watch里去输出一下this,看看this包裹的壳
- ES6 开始,js 新增了剩余参数语法、展开语法等,它们有个共同之处就是都以 ... 这么个符号为前缀,好像很多地方都可以用到,但实际上又不
- 目录1.自定义行索引2. 按普通索引选择数据2.1 按普通索引选择单行数据2.2 按行索引选择多行数据3.按位置索引选择数据3.2 按位置索
- 以前工作的时候由于Oracle8i数据库经常出现用户过多的错误,由于数据量大,经常出现ORA:12500错误,但主要原因是访问过多而引起的,
- PyCharm使用jre,所以设置内存使用的情况和eclipse类似。编辑PyCharm安装目录下PyCharm 4.5.3\bin下的py
- 本文的JS效果是在鼠标点击ITEM标签的时候,实现下方的内容跟随滚动切换的效果,我们先来看下运行后的效果图。以下是脚本之家原创的运行代码:&
- 一:代码实现class TreeNode: """节点类""&q
- 1、GET方式: # -*- coding: utf-8 -*-#!/usr/bin/python# filename
- python 判断是否为正小数和正整数的实例实现代码:def check_float(string): #支付时,输入的金额可能
- 前言mysql中的explain命令可以用来查看sql语句是否使用了索引,用了什么索引,有没有做全表扫描。可以帮助我们优化查询语句。expl
- 有两个服务器,装了两个数据库,一个是主的,一个是备用的,下面的的功能就将主数据库的数据库,实时同步到备份数据库上,使他们的数据内容,基本上保
- 1、Golang指针在介绍Golang指针隐式间接引用前,先简单说下Go 语言的指针 (Pointer),一个指针可以指向任何一个值的内存地