python正则表达式常见的知识点汇总
作者:Begin?to?change 发布时间:2023-10-02 18:56:21
一、介绍
正则表达式是一个特殊的字符序列,计算机科学的一个概念。通常被用来检索、替换那些符合某个模式(规则)的文本。
许多程序设计语言都支持利用正则表达式进行字符串操作。在Python中需要通过正则表达式对字符串进行匹配的时候,可以使用re模块。re 模块使 Python 语言拥有全部的正则表达式功能。
二、查找方法的使用
1、match方法(只匹配字符串开头)
re.match尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。如果匹配成功,返回的是一个Match对象,要想获得其值要调用group()方法
group(0)返回的是整个匹配的所有内容(默认为0)
函数语法:
re.match(pattern,string,flags=0)
2、search方法(扫描整个字符串,找到第一个匹配)
re.search 扫描整个字符串并返回第一个成功的匹配。
函数语法:
re.search(pattern, string, flags=0)
3、re.match与re.search的区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。
4、findall方法(扫描整个字符串,找到所有的匹配)
在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。
注意: match 和 search 是匹配一次 findall 匹配所有。
语法格式:
re.findall(pattern,string,flags=0)
示例:
5、finditer方法(扫描整个字符串,找到所有的匹配,并返回一个可迭代对象)
和 findall 类似,在字符串中找到正则表达式所匹配的所有子串,并把它们作为一个迭代器返回
ret = re.finditer(r'\d+','he23ll34') # 得到的结果是一个可迭代对象
for x in ret: # 遍历 ret 取出里面的每一项匹配
print(x.group(), x.span()) # 匹配对象里的group保存了匹配的结果
三、re.Match类介绍
当我们调用re.match
方法、re.search
方法,或者对re.finditer
方法的结果进行迭代时,拿到的数据类型都是re.Match
对象。
四、正则表达式模式
1、非打印字符
2、特殊字符
3、定位符
4、限定符
五、替换
语法:
re.sub(pattern,repl,string,count=0)
六、贪婪模式和非贪婪模式
Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符;
非贪婪则相反,总是尝试匹配尽可能少的字符。
在*,?,+,{m,n}
后面加上 ?
使贪婪变成非贪婪。
七、示例
1、匹配用户名
用户名匹配:由数字、大小写字母、下划线_
和中横线-
组成,长度为4到14位,并且不能以数字开头。
^在括号外就是开头,在括号里就是取反
\D匹配一个非数字字符,等价于[^0-9]
[a-z0-9A-Z_\-]{3,13}表示可取范围为a-z的小写字母和数字0-9以及下划线中横线都可以,写在中括号里面的是与的关系,最后的大括号代表的是其匹配长度为[3-13](左闭右闭)(因为开头已经有一位是确定的了,所以后面的长度为[3-13])
r'^\D[a-z0-9A-Z_\-]{3,13}', 'sH_8'
2、匹配手机号
根据手机号的规则,对手机号前三位的格式进行了限制,因为有几种格式都可以,条件之间的关系为或,正则表达式中用|表示
r'^((13[0-9])|(14[5|7])|(15([0-3]|[5-9]))|(18[0,5-9]))\d{8}$'
3、匹配0~99之间的数字
开头是【1-9】中的一个数,个数为0或者1均可
后面的是【0-9】中的一个数,个数为0或者1
r'^[1-9]?[0-9]?$'
来源:https://blog.csdn.net/qq_41404557/article/details/124823119
猜你喜欢
- 本文实例讲述了php mysql procedure实现获取多个结果集的方法。分享给大家供大家参考,具体如下:protected funct
- 标量(scalar)数据类型标量(scalar)数据类型没有内部组件,他们大致可分为以下四类:. number. character. da
- 如果网站只开了80端口,你会发现下面的方法是比较有用的,其中用的方法几乎都不是我发现的,文总包括一些注入时的个人经验和技巧方法可以说有4种(
- 阅读上一篇:定义网页的语言编码 用web标准设计网站,过渡的方法主要是采用XHTML+CSS,css样式表是必不可少的。这就要求所有网页设计
- python中基本数据类型和其他的语言占用的内存空间大小有很大差别import sysa = 100b = Truec = 100Ld =
- itchat是python开源第三方库,用于搭建微信机器人,几十行代码就能帮你实现自动的处理所有信息。比如,添加好友,搭建自动回复机器人,还
- 简介scrapy 是一个 python 下面功能丰富、使用快捷方便的爬虫框架。用 scrapy 可以快速的开发一个简单的爬虫,官方给出的一个
- 这篇文章主要介绍了python线程信号量semaphore使用解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价
- 代码#!/usr/bin/env python# -*- coding: utf-8 -*-# @File : HtmlParser.py#
- 不知各位是否有手写代码的习惯。例如:要在一个单元格插入一段CSS代码,或者一段Javascript代码,怎么做才比较快捷方便呢?虽然Drea
- 终于构建出了第一个神经网络,Keras真的很方便。之前不知道Keras这么方便,在构建神经网络的过程中绕了很多弯路,最开始学的TensorF
- asp防止用户同时登陆的方法,实现这个功能可有两种方式:1.使用application用application对象:如果做的是大型社区,可能
- 0x00 前言eval是Python用于执行python表达式的一个内置函数,使用eval,可以很方便的将字符串动态执行。比如下列代码:&g
- 本人刚开始学习python,看了一段时间视频教程之后,决定做一个小游戏来巩固一下知识点,就做了一个文字版飞行棋,暂不具备图形界面。把代码贴出
- 本文实例讲述了python中管道用法。分享给大家供大家参考。具体如下:#!coding=utf-8import multiprocessin
- 前言风玫瑰是由气象学家用于给出如何风速和风向在特定位置通常分布的简明视图的图形工具。它也可以用来描述空气质量污染源。风玫瑰工具使用Matpl
- 前言验证码的种类有很多,它是常用的一种反爬手段,包括:图片验证码,滑块验证码,等一些常见的验证码场景。识别验证码的python 库有很多,用
- 网页给人最直观的感受就是它的页面框架与构造,就像一座大楼的主体框架与形态,你可能记不起东方明珠塔和艾菲尔铁塔是用什么颜色或什么材料涂的外墙,
- Google Chrome,又喜欢逛豆瓣,Google Chrome支持User Scripts了,但是我写的那几个插件在Chrome下又跑
- 常用方法浅拷贝copya = {"ilpy1": {"company": "aaa&quo