正则表达式学习笔记
作者:深空 来源:蓝色理想 发布时间:2008-04-15 07:44:00
标签:正则表达式,javascript,笔记
最近在学习正则,一些比较有用的东西怕忘记,记下来,比较乱,想一条记录一条:
//匹配文本,这个偶尔比较好用,但是要小心字符中包含\E
$str = '[a-z]';
$str = preg_replace('/\G[a-z]\E/', '', $str);
echo $str; //打印空,全被替换掉了,相关大概就是preg_quote功能
复制内容到剪贴板代码:
//给匹配结果命名,这样在匹配结果中就可以用这个名称来获取值
$str = 'abc123abc';
preg_match('/(?P<num>\d )/', $str, $arr);
echo $arr['num']; //相当于echo $arr[1]
//仅用于分组的括号,匹配内容不会被变量捕获,有时候需要这样提高执行效率
$str = 'abc123abc';
preg_match('/abc(?:\d )/', $str, $arr);
echo $arr[1]; //除了$arr[0]外没有$arr[1]了,不会赋予\1
//插入的好帮手,向前、向后锚点搜索位置,每3位添加一个逗号
$str = 'fdfad123456789fdfd';
$str = preg_replace('/(?<=\d)(?=(\d{3}) (?!\d))/', ',', $str);
echo $str; //打印 fdfad123,456,789fdfd
//以最少的结果匹配
$str = 123456;
preg_match('/\d /', $str, $arr);
echo $arr[0]; //是人都知道是123456吧
preg_match('/\d ?/', $str, $arr);
echo $arr[0]; //这次是1
//一个比较有用的,可以判断前面的是否有匹配过,比如下边的例子,可以忽略等号右边是否有单引号双引号或者什么都没有
$str = <<<HTML
<font size=12></font>
<font size='13'></font>
<font size="14"></font>
<font size="15></font>
HTML;
preg_match_all('/<font\s size=([\'"]?)(\d )\1[^>]*>/', $str, $arr);
print_r($arr);
/*
Array
(
[0] => 12
[1] => 13
[2] => 14
)
*/
//部分模式修饰符,模式修饰符也可以放在表达式中的
//这里匹配符合XHTML规范的style里的颜色值,大写的STYLE被忽略了,但是里面的color可以大小写无所谓
$str = '<b style="COLOR:red"></b><b STYLE="color:blue"></b><b style="color:green"></b>';
preg_match_all('/style=([\'"]?)(?i)color:(\w )\1(?-i)/', $str, $arr);
print_r($arr[2])
//也可以把匹配内容放到里面,用:隔开,就不用写结束(?-i)
//preg_match_all('/style=([\'"]?)(?i:color:(\w ))\1/', $str, $arr);
//再看一例子
$str = '<B>Style</B>';
preg_match('/<B>(?i:style)<\/B>/', $str, $arr);
print_r($arr); //可以匹配到
$str = '<B>Style</b>';
preg_match('/<B>(?i:style)<\/B>/', $str, $arr);
print_r($arr); //什么都没匹配到
//单词检索,可惜只能用在英文
$str = 'I\'m a teacher';
preg_match_all('/\b[a-z] \b/i', $str, $arr);
print_r($arr)
复制内容到剪贴板代码:
//u修饰符,按unicode匹配
$str = '你您';
$str = preg_replace('/[你您]/', 'you', $str);
echo $str; //被拆开了,打印4次you
//看下面加上u修饰符后的效果,该修饰符需要编码utf-8否则会报错
//我的文本都是gb2312,所以要转成utf-8
$str = iconv('gb2312', 'utf-8', '你您');
$regex = iconv('gb2312', 'utf-8', '/[你您]/u');
$str = preg_replace($regex, 'you', $str);
echo $str; //打印2次you
//x模式修饰符,可以忽略空白和加注释
$str = 'test Test';
preg_match('/test #只匹配小写的test/x', $str, $arr);
print_r($arr);
复制内容到剪贴板代码:
//排除环视(?<!...) (?!...)、忽略优先 *? ? ?? 的复合使用
$str = 'test <B>test1<B> test2</B>';
preg_match('/<B>(?:.(?<!<B>))*<\/B>/i', $str, $arr);
//或者 preg_match('/<B>(?:(?!<B>).)*<\/B>/i', $str, $arr);
print_r($arr)
//当时这样写应付不了 $str = 'test <B>test1<B> test2</B> test3</B>';
//改写一下正则既可 preg_match_all('/<B>(?:(?!<\/?B>).)*<\/B>/i', $str, $arr);
//根据上面来完成一个最简单的UBB替换
$str = 'test [b]test1[b] test2[/b] test3[/b]test';
$str = preg_replace('/\[B\]((?:(?!\[\/?B\]).)*)\[\/B\]/i', '<b>\1</b>', $str);
$str = preg_replace('/\[B\]((?:(?!\[\/?B\]).)*)\[\/B\]/i', '<b>\1</b>', $str);
print_r($str)
//如果已经确认回朔并不会有匹配结果,可以使用固化分组来放弃备用状态提高效率
$str = 'Subject';
preg_match('/(\w ):/', $str, $arr);
//用以下方法代替
//在第一组匹配规则匹配到文本末尾t时匹配结束,启用第二组匹配规则:并不会找到结果,所以这个时候回朔查找,但是\w不会包含:,所以可以直接放弃,
preg_match('/(?>\w ):/', $str, $arr);
0
投稿
猜你喜欢
- sql中经常用like进行模糊查询,而模糊查询就要用到百分号“%”,下划线“_”这些通配符,其中“%”匹配任意多个字符,“_”匹配单个字符。
- 注:MySQL5.7破解root密码,跳过密码认证登录到数据库,直接修改表中的密码即可,但是MySQL 8.0则不可以这样修改root密码,
- MySQL添加新用户,见文章底部。按照正常思维,创建用户和设置密码什么的,应该是一个动作完成的。然而事实并非如此。我每次都是通过在网上找代码
- 一、os模块os 模块是 Python中的一个内置模块,也是 Python中整理文件和目录最为常用的模块。该模块提供了非常丰富的方法用来处理
- 最近给卫生局做一个表格上传/可视化系统,算是小有成果。今天把项目中的文件拖拽上传模块分离出来,做了一个独立的小demo,并把相关代码打包上传
- 写桌面程序或有些特殊操作的,经常需要访问剪切板。python有专用的模块,可以很方便简单的操作剪切板如下:#coding:utf-8impo
- 由于js的代码逻辑越来越重,一个js文件可能会有上千行,十分不利于开发与维护。最近正在把逻辑很重的js拆分成模块,在一顿纠结是使用requi
- 丢弃现有MySQL的表是很容易的。但是需要非常小心,删除任何现有的一个表后将无法恢复,因为数据丢失。语法:下面是通用的SQL语法丢弃(删除)
- 忘了在哪看到一位编程大牛调侃,他说程序员每天就做两件事,其中之一就是处理字符串。相信不少同学会有同感。几乎任何一种编程语言,都把字符串列为最
- 设置表名为中文1.设置Models.py文件class Post(models.Model): name = models.CharFiel
- 前言本文将给大家简单介绍关于区块链(BlockChain)的相关知识,并用Python做一简单实现。下面话不多说,来一起看看详细的介绍:什么
- 介绍该数独可能只填充了部分数字,其中缺少的数字用 . 表示。注意事项一个合法的数独(仅部分填充)并不一定是可解的。我们仅需使填充的空格有效即
- 前言有时候正则表达式不只是匹配一下什么数字/邮箱/身份证/日期等等,还需要匹配某一段文字,并按照既定格式提取其中的某些值.场景一:提取SAM
- 没有展开时点击展开之后<div class="flashread_item_box_time">  
- Linux Centos 下使用yum 命令安装mysql实现步骤1. 查看服务器中有没有安装过Mysql1. 查看有没有安装包: &nbs
- 网上大部分的免费asp程序使用的是access数据库。但是access数据库作为一个中小型的单机数据库系统,在承担访问量、数据量大的网站应用
- 本文实例讲述了Python实现基于TCP UDP协议的IPv4 IPv6模式客户端和服务端功能。分享给大家供大家参考,具体如下:由于目前工作
- FTP一般流程FTP对应PASV和PORT两种访问方式,分别为被动和主动,是针对FTP服务器端进行区分的,正常传输过程中21号端口用于指令传
- 近年,不论是正在快速增长的直播,远程教育以及IM聊天场景,还是在常规企业级系统中用到的系统提醒,对websocket的需求越来越大,对web
- 在输出代码行中,加入“index=False”如下:m_pred_survived.to_csv("clasified.csv&q