Oracle 10G:PL/SQL正规表达式(正则表达式)手册(5)
来源:asp之家 发布时间:2009-07-02 12:33:00
匹配参数选项
您可能已经注意到了正则表达式操作符和函数包含一个可选的匹配参数。这个参数控制是否区分大小写、换行符的匹配和保留多行输入。
正则表达式的实际应用
您不仅可以在队列中使用正则表达式,还可以在使用 SQL 操作符或函数的任何地方(比如说在 PL/SQL 语言中)使用正则表达式。您可以编写利用正则表达式功能的触发器,以验证、生成或提取值。
接下来的例子演示了您如何能够在一次列检查约束条件中应用 REGEXP_LIKE 操作符来进行数据验证。它在插入或更新时检验正确的社会保险号码格式。如 123-45-6789 和 123456789 之类格式的社会保险号码对于这种列约束条件是可接受的值。有效的数据必须以三个数字开始,紧跟着一个连字符,再加两个数字和一个连字符,最后又是四个数字。另一种表达式只允许 9 个连续的数字。竖线符号 (|) 将各个选项分开。
ALTER TABLE students
ADD CONSTRAINT stud_ssn_ck CHECK
(REGEXP_LIKE(ssn,
'^([[:digit:]]{3}-[[:digit:]]{2}-[[:digit:]]{4}|[[:digit:]]{9})$'))
由 ^ 和 $ 指示的开头或结尾的字符都是不可接受的。确保您的正则表达式没有分成多行或包含任何不必要的空格,除非您希望格式如此并相应地进行匹配。表 12 说明了该正则表达式示例的各个组成部分。
将正则表达式与现有的功能进行比较
正则表达式有几个优点优于常见的 LIKE 操作符和 INSTR、SUBSTR 及 REPLACE 函数的。这些传统的 SQL 函数不便于进行模式匹配。只有 LIKE 操作符通过使用 % 和 _ 字符匹配,但 LIKE 不支持表达式的重复、复杂的更替、字符范围、字符列表和 POSIX 字符类等等。此外,新的正则表达式函数允许检测重复出现的单词和模式交换。这里的例子为您提供了正则表达式领域的一个概览,以及您如何能够在您的应用程序中使用它们。
实实在在地丰富您的工具包
因为正则表达式有助于解决复杂的问题,所以它们是非常强大的。正则表达式的一些功能难于用传统的 SQL 函数来仿效。当您了解了这种稍显神秘的语言的基础构建程序块时,正则表达式将成为您的工具包的不可缺少的一部分(不仅在 SQL 环境下也在其它的编程语言环境下)。为了使您的各个模式正确,虽然尝试和错误有时是必须的,但正则表达式的简洁和强大是不容置疑的。
附表见下页:
表 1:定位元字符
元字符 说明
^ 使表达式定位至一行的开头
$ 使表达式定位至一行的末尾
表 2:量词或重复操作符 量词 说明
* 匹配 0 次或更多次
? 匹配 0 次或 1 次
+ 匹配 1 次或更多次
{m} 正好匹配 m 次
{m,} 至少匹配 m 次
{m, n} 至少匹配 m 次但不超过 n 次
表 3:预定义的 POSIX 字符类 字符类 说明
[:alpha:] 字母字符
[:lower:] 小写字母字符
[:upper:] 大写字母字符
[:digit:] 数字
[:alnum:] 字母数字字符
[:space:] 空白字符(禁止打印),如回车符、换行符、竖直制表符和换页符
[:punct:] 标点字符
[:cntrl:] 控制字符(禁止打印)
[:print:] 可打印字符
表 4:表达式的替换匹配和分组 元字符 说明
| 替换 分隔替换选项,通常与分组操作符 () 一起使用
( ) 分组 将子表达式分组为一个替换单元、量词单元或后向引用单元(参见“后向引用”部分)
[char] 字符列表 表示一个字符列表;一个字符列表中的大多数元字符(除字符类、^ 和 - 元字符之外)被理解为文字
表 5:REGEXP_LIKE 操作符 语法 说明
REGEXP_LIKE(source_string, pattern
[, match_parameter]) source_string 支持字符数据类型(CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2 和 NCLOB,但不包括 LONG)。pattern 参数是正则表达式的另一个名称。match_parameter 允许可选的参数(如处理换行符、保留多行格式化以及提供对区分大小写的控制)。
表 6:REGEXP_INSTR 函数 语法 说明
REGEXP_INSTR(source_string, pattern
[, start_position
[, occurrence
[, return_option
[, match_parameter]]]]) 该函数查找 pattern ,并返回该模式的第一个位置。您可以随意指定您想要开始搜索的 start_position。 occurrence 参数默认为 1,除非您指定您要查找接下来出现的一个模式。return_option 的默认值为 0,它返回该模式的起始位置;值为 1 则返回符合匹配条件的下一个字符的起始位置。
表 7: 5 位数字加 4 位邮政编码表达式的说明 语法 说明
必须匹配的空白
[:digit:] POSIX 数字类
] 字符列表的结尾
{5} 字符列表正好重复出现 5 次
( 子表达式的开头
- 一个文字连字符,因为它不是一个字符列表内的范围元字符
[ 字符列表的开头
[:digit:] POSIX [:digit:]类
[ 字符列表的开头
] 字符列表的结尾
{4} 字符列表正好重复出现 4 次
) 结束圆括号,结束子表达式
? ? 量词匹配分组的子表达式 0 或 1 次,从而使得 4 位代码可选
$ 定位元字符,指示行尾
表 8:REGEXP_SUBSTR 函数 语法 说明
REGEXP_SUBSTR(source_string, pattern
[, position [, occurrence
[, match_parameter]]]) REGEXP_SUBSTR 函数返回匹配模式的子字符串。
表 9: REGEXP_REPLACE 函数 语法 说明
REGEXP_REPLACE(source_string, pattern
[, replace_string [, position
[,occurrence, [match_parameter]]]]) 该函数用一个指定的 replace_string 来替换匹配的模式,从而允许复杂的“搜索并替换”操作。
表 10:后向引用元字符 元字符 说明
\digit 反斜线 紧跟着一个 1 到 9 之间的数字,反斜线匹配之前的用括号括起来的第 digit 个子表达式。
(注意:反斜线在正则表达式中有另一种意义,取决于上下文,它还可能表示 Escape 字符。
表 11:模式交换正则表达式的说明 正则表达式项目 说明
( 第一个子表达式的开头
. 匹配除换行符之外的任意单字符
* 重复操作符,匹配之前的 . 元字符 0 到 n 次
) 第一个子表达式的结尾;匹配结果在 \1
中获取(在这个例子中,结果为 Ellen。)
必须存在的空白
( 第二个子表达式的开头
. 匹配除换行符之外的任意单个字符
* 重复操作符,匹配之前的 . 元字符 0 到 n 次
) 第二个子表达式的结尾;匹配结果在 \2
中获取(在这个例子中,结果为 Hildi。)
空白
( 第三个子表达式的开头
. 匹配除换行符之外的任意单字符
* 重复操作符,匹配之前的 . 元字符 0 到 n 次
) 第三个子表达式的结尾;匹配结果在 \3
中获取(在这个例子中,结果为 Smith。)
表 12:社会保险号码正则表达式的说明 正则表达式项目 说明
^ 行首字符(正则表达式在匹配之前不能有任何前导字符。)
( 开始子表达式并列出用 | 元字符分开的可替换选项
[ 字符列表的开头
[:digit:] POSIX 数字类
] 字符列表的结尾
{3} 字符列表正好重复出现 3 次
- 连字符
[ 字符列表的开头
[:digit:] POSIX 数字类
] 字符列表的结尾
{2} 字符列表正好重复出现 2 次
- 另一个连字符
[ 字符列表的开头
[:digit:] POSIX 数字类
] 字符列表的结尾
{4} 字符列表正好重复出现 4 次
| 替换元字符;结束第一个选项并开始下一个替换表达式
[ 字符列表的开头
[:digit:] POSIX 数字类
] 字符列表的结尾
{9} 字符列表正好重复出现 9 次
) 结束圆括号,结束用于替换的子表达式组
$ 定位元字符,指示行尾;没有额外的字符能够符合模式


猜你喜欢
- 1. 图信号处理知识图卷积神经网络涉及到图信号处理的相关知识,也是由图信号处理领域的知识推导发展而来,了解图信号处理的知识是理解图卷积神经网
- 本文实例为大家分享了python实现大文本文件分割的具体代码,供大家参考,具体内容如下开发环境Python 2实现效果通过文件拖拽或文件路径
- 1. timeit.timeit(stmt=‘pass', setup=‘pass', timer=<default
- 前言:在使用DDT数据驱动+HTMLTestRunner输出测试报告时遇到过2个问题:1、生成的测试报告中,用例名称后有dict() -&g
- 前言一、情景描述情景一:文件夹内有很多excel数据,包含的数据格式一样,我们需要提取每个文件中指定的几列数据汇总到一个文件中(因为是按列索
- 简介除ide的执行方式外,命令行的方式执行Python脚本是参数化程序执行的一种常见且简单的方法,正确处理命令行参数,可以提供给包含某种参数
- 一、多线程共享全局变量首先我们来回忆下在函数中修改全局变量的情况。在一个函数中,对全局变量进行修改的时候,到底是否需要使用 global 进
- JDBC连接MySQLJDBC连接MySQL加载及注册JDBC驱动程序Class.forName("com.mysql.jdbc.
- 方法一:<script language="JavaScript"> <!--
- 前言为了保证数据的一致完整性,任何一个数据库都存在锁定机制。锁定机制的优劣直接应想到一个数据库系统的并发处理能力和性能,所以锁定机制的实现也
- 获取所有文章数据o := orm.NewOrm()qs := o.QueryTable("Article")12获取总条
- 引言在刚入门python时,模块化编程、模块、类库等术语常常并不容易理清。尤其是Modules(模块)和Packages(包),在impor
- 复习回顾我们已经对Python内置模块-time中知道时间格式目前有三种。时间戳结构化时间字符串时间本期,我们将继续深入对time模块中所涉
- PPT链接说实话,看到这个题目时我觉得这有什么好讨论的,肯定会是场一边倒的讨论。因为个人比较倾向于短命名,简单优雅,可能是出于程序员的洁癖,
- 图像融合按照一定的比例将两张图片融合在一起addWeighted()方法:参数1第一张图片矩阵参数2第一张图片矩阵的权重参数3第二张图片矩阵
- 总结类的定义很久以前,语言都是面向过程的,经过计算机科学家的探索,出现了面向对象。面向对象可以解释生活中很多东西。比如人,人就是个对象,有参
- 如何避免磁盘临时表因为内存储引擎不支持TEXT和BLOB数据类型, 使用到BLOB和TEXT列的查询和使用隐式临时表的查询将不得不使用MyI
- DNA序列ACTGATCGATTACGTATAGTATTTGCTATCATACATATATATCGATGCGTTCAT求其互补DNA序列。在
- PyQt5 事件处理机制PyQt为事件处理提供了两种机制:高级的信号与槽机制,以及低级的事件处理机制。信号与槽可以说是对事件处理机制的高级封
- 本文实例讲述了微信小程序学习笔记之本地数据缓存功能。分享给大家供大家参考,具体如下:前面介绍了微信小程序获取位置信息操作。这里再来介绍一下微