SQL语句中的正则表达式
正则表达式
REGEXP_LIKE执⾏正则表达式匹配
SELECT FIRST_NAME
FROM EMPLOYEES
WHERE REGEXP_LIKE(FIRST_NAME,'^al(an|yss)a$','i');--al之后是an或yss
SELECT FIRST_NAME
FROM EMPLOYEES
WHERE REGEXP_LIKE(FIRST_NAME,'^al(.){2}a$','i');--中间有任意⼀个字母出现两次
SELECT FIRST_NAME
FROM EMPLOYEES
WHERE REGEXP_LIKE(FIRST_NAME,'^al[^y]+a$','i');--第三个字母不允许是y⼀直匹配
REGEXP_REPLACE执⾏正则表达式替换
SELECT PHONE_NUMBER,REGEXP_REPLACE(PHONE_NUMBER,'\.','-')AS PHONE FROM EMPLOYEES;--必须要加转义字符\ 不加的话  ‘.’代表任意字符
REGEXP_INSTR搜索出现的位置
SELECT STREET_ADDRESS,
REGEXP_INSTR(STREET_ADDRESS,'[[:alpha:]]')AS FIRST_ALPHA_POSITION,--任何字母第⼀次出现的位置
REGEXP_INSTR(STREET_ADDRESS,'[[:digit:]]')AS FIRST_ALPHA_POSITION,--任何数字第⼀次出现的位置
REGEXP_INSTR(STREET_ADDRESS,'[[:alnum:]]')AS FIRST_ALPHA_POSITION--任何数字或字母第⼀次出现的位置
FROM LOCATIONS;
使⽤REGEXP_SUBSTR控制字符输出
SELECT STREET_ADDRESS,
REGEXP_SUBSTR(STREET_ADDRESS, ' [^ ]+ ')AS ROAD1,
REGEXP_SUBSTR(STREET_ADDRESS, '[^ ]+ ')AS ROAD2,
REGEXP_SUBSTR(STREET_ADDRESS, '[^ ]+')AS ROAD3,
REGEXP_SUBSTR(STREET_ADDRESS, ' [^ ]+(.)+')AS ROAD4,
REGEXP_SUBSTR(STREET_ADDRESS, '[[:alpha:]]')AS ROAD5,
REGEXP_SUBSTR(STREET_ADDRESS, '[[:alpha:]]+')AS ROAD6,
REGEXP_SUBSTR(STREET_ADDRESS, '[[:alpha:]]+(.)')AS ROAD7,
REGEXP_SUBSTR(STREET_ADDRESS, '[[:alpha:]]+(.)+')AS ROAD8
FROM LOCATIONS;
.
regexp like 匹配⽀持字符集中的任何字符,除了空
+  匹配前⾯的⼦表达式⼀次或多次
|  指明两项之内的⼀个选择
‘i’不区分⼤⼩写的匹配
[[:alpha:]]任何字母
[[:digit:]]任何数字
[[:alnum:]]任何字母和数字
[[:space:]]任何空格
⼦表达式
SELECT
REGEXP_INSTR
('0123456789',  --源字符
'(123)(4(56)(78))',--⽤于匹配的表达式
1,              --开始搜索的位置
1,              --第⼏次匹配上
0,              --0返回第⼀个出现位置;1下⼀个起始位置
'i',            --⼤⼩写不敏感
1)RESULT              --第⼏个表达式
FROM DUAL;
⼦表达式中有括号即为⼀个表达式
如(123(4(56)(78)))中(123(4(56)(78)))为第⼀个⼦表达式
(4(56)(78))为第⼆个表达式(56)为第三个(78)为第四个
Check约束和正则表达式:⽰例
ALTER TABLE EMP8
ADD CONSTRAINT EMAIL_ADDR
CHECK(REGEXP_LIKE(email,'@')) NOVALIDATE;
INSERT INTO EMP8 VALUES
(500,'Christian','Patal','ChrisP2creme',
1234567890,'12-Jan-2004','HR-REP',2000,null,102,40);
select * from t50 where REGEXP_LIKE(email,'[^@][@][[:alnum:]]+([\.][[:alnum:]]+|[\.][[:alnum:]]+[\.][[:alnum:]]+)[^\.]$');
ALTER TABLE t50 ADD CONSTRAINT email_addr CHECK(REGEXP_LIKE(email,'[^@][@][[:alnum:]]+([\.][[:alnum:]]+|[\.][[:alnum:]]+[\.] [[:alnum:]]+)[^\.]$')) NOVALIDATE;
表 1:定位元字符
元字符
说明
^
使表达式定位⾄⼀⾏的开头
$
使表达式定位⾄⼀⾏的末尾
表 2:量词或重复操作符
量词
说明
*
匹配 0 次或更多次
?
匹配 0 次或 1 次
匹配 1 次或更多次
{m}
正好匹配 m 次
{m,}
⾄少匹配 m 次
{m, n}
⾄少匹配 m 次但不超过 n 次
表 3:预定义的 POSIX 字符类
字符类
说明
[:alpha:]
字母字符
[:lower:]
⼩写字母字符
[:upper:]
⼤写字母字符
[:digit:]
数字
[:alnum:]
字母数字字符
[:space:]
空⽩字符(禁⽌打印),如回车符、换⾏符、竖直制表符和换页符
[:punct:]
标点字符
[:cntrl:]
控制字符(禁⽌打印)
[:print:]
可打印字符
表 4:表达式的替换匹配和分组
元字符
说明
|
替换
分隔替换选项,通常与分组操作符 () ⼀起使⽤
( )
分组
将⼦表达式分组为⼀个替换单元、量词单元或后向引⽤单元(参见“”部分)
[char]
字符列表
表⽰⼀个字符列表;⼀个字符列表中的⼤多数元字符(除字符类、^ 和 - 元字符之外)被理解为⽂字
表 5:REGEXP_LIKE 操作符
语法
说明
REGEXP_LIKE(source_string, pattern
[, match_parameter])
source_string ⽀持字符数据类型(CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2 和 NCLOB,但不包括 LONG)。pattern 参数是正则表达式的另⼀个名称。match_parameter 允许可选的参数(如处理换⾏符、保留多⾏格式化以及提供对区分⼤⼩写的控制)。
表 6:REGEXP_INSTR 函数
说明
REGEXP_INSTR(source_string, pattern
[, start_position
[, occurrence
[, return_option
[, match_parameter]]]])
该函数查 pattern ,并返回该模式的第⼀个位置。您可以随意指定您想要开始搜索的 start_position。 occurrence 参数默认为 1,除⾮您指定您要查接下来出现的⼀个模式。return_option 的默认值为 0,它返回该模式的起始位置;值为 1 则返回符合匹配条件的下⼀个字符的起始位置。
表 7: 5 位数字加 4 位表达式的说明
语法
说明
必须匹配的空⽩
[:digit:]
POSIX 数字类
]
字符列表的结尾
{5}
字符列表正好重复出现 5 次
(
⼦表达式的开头
-
⼀个⽂字连字符,因为它不是⼀个字符列表内的范围元字符
[
字符列表的开头
[:digit:]
POSIX [:digit:]类
[
字符列表的开头
]
字符列表的结尾
{4}
字符列表正好重复出现 4 次
)
结束圆括号,结束⼦表达式
?
? 量词匹配分组的⼦表达式 0 或 1 次,从⽽使得 4 位代码可选
$
定位元字符,指⽰⾏尾
表 8:REGEXP_SUBSTR 函数
语法
说明
REGEXP_SUBSTR(source_string, pattern
[, position [, occurrence
[, match_parameter]]])
REGEXP_SUBSTR 函数返回匹配模式的⼦字符串。
表 9: REGEXP_REPLACE 函数
语法
说明
REGEXP_REPLACE(source_string, pattern
[, replace_string [, position
[,occurrence, [match_parameter]]]])
该函数⽤⼀个指定的 replace_string 来替换匹配的模式,从⽽允许复杂的“搜索并替换”操作。表 10:后向引⽤元字符
元字符
说明
\digit
反斜线
紧跟着⼀个 1 到 9 之间的数字,反斜线匹配之前的⽤括号括起来的第 digit 个⼦表达式。
(注意:反斜线在正则表达式中有另⼀种意义,取决于上下⽂,它还可能表⽰ Escape 字符。表 11:模式交换正则表达式的说明
正则表达式项⽬
说明
(
第⼀个⼦表达式的开头
.
匹配除换⾏符之外的任意单字符
*
重复操作符,匹配之前的 . 元字符 0 到 n 次
)
第⼀个⼦表达式的结尾;匹配结果在 \1
中获取(在这个例⼦中,结果为 Ellen。)
必须存在的空⽩
(
第⼆个⼦表达式的开头
.
匹配除换⾏符之外的任意单个字符
*
重复操作符,匹配之前的 . 元字符 0 到 n 次
)
第⼆个⼦表达式的结尾;匹配结果在 \2
中获取(在这个例⼦中,结果为 Hildi。)
空⽩
(
第三个⼦表达式的开头
.
匹配除换⾏符之外的任意单字符
*
重复操作符,匹配之前的 . 元字符 0 到 n 次
)
第三个⼦表达式的结尾;匹配结果在 \3
中获取(在这个例⼦中,结果为 Smith。)
表 12:社会保险号码正则表达式的说明
正则表达式项⽬
说明
^
⾏⾸字符(正则表达式在匹配之前不能有任何前导字符。)
(
开始⼦表达式并列出⽤ | 元字符分开的可替换选项

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。