SQL的查询语句中,有时会需要引进正则表达式为其复杂搜索指定模式。下⾯给出⼀些Regexp在MYSQL语句中应⽤(⾮全部):
1) ^
匹配字符串的开始部分。
mysql> SELECT 'fo\nfo' REGEXP '^fo$'; -> 0mysql> SELECT 'fofo' REGEXP '^fo'; -> 1
2) $
匹配字符串的结束部分。
mysql> SELECT 'fo\no' REGEXP '^fo\no$'; -> 1mysql> SELECT 'fo\no' REGEXP '^fo$'; -> 0
regex匹配 3) .
匹配任何字符(包括回车和新⾏)。
mysql> SELECT 'fofo' REGEXP '^f.*$'; -> 1mysql> SELECT 'fo\r\nfo' REGEXP '^f.*$'; -> 1
4) [:character_class:]
在括号表达式中(使⽤[和]),[:character_class:]表⽰与术语类的所有字符匹配的字符类。标准的类名称是:
alnum
⽂字数字字符
alpha
⽂字字符
blank
空⽩字符
cntrl
控制字符
digit
数字字符
graph
图形字符
lower
⼩写⽂字字符
print
图形或空格字符
punct
标点字符
space
空格、制表符、新⾏、和回车
upper
⼤写⽂字字符
xdigit
⼗六进制数字字符
它们代表在ctype(3)⼿册页⾯中定义的字符类。特定地区可能会提供其他类名。字符类不得⽤作范围的端点。
mysql> SELECT 'justalnums' REGEXP '[[:alnum:]]+'; -> 1
mysql> SELECT '!!' REGEXP '[[:alnum:]]+'; -> 0
5) [[:<:>:]]
这些标记表⽰word边界。它们分别与word的开始和结束匹配。word是⼀系列字字符,其前⾯和后⾯均没有字字符。字字符是alnum类中的字母数字字符或下划线(_)。
mysql> SELECT 'a word a' REGEXP '[[:<:>:]]'; -> 1mysql> SELECT 'a xword a' REGEXP '[[:<:>:]]'; -> 0要想在正则表达式中使⽤特殊字符的⽂字实例,应在其前⾯加上2个反斜杠“\”字符。MySQL解析程
序负责解释其中⼀个,正则表达式库负责解释另⼀个。例如,要想与包含特殊字符“+”的字符串“1+2”匹配,在下⾯的正则表达式中,只有最后⼀个是正确的:
mysql> SELECT '1+2' REGEXP '1+2'; -> 0mysql> SELECT '1+2' REGEXP '1\+2'; -> 0mysql> SELECT '1+2' REGEXP '1\\+2'; -> 1 其他的有关Regexp的语法,可直接参考下表:字符含意
\ 做为转意,即通常在"\"后⾯的字符不按原来意义解释,如/b/匹配字符"b",当b前⾯加了反斜杆后/\b/,转意为匹配⼀个单词的边界。
-或-
对正则表达式功能字符的还原,如"*"匹配它前⾯元字符0次或多次,/a*/将匹配a,aa,aaa,加了"\"后,/a\*/将只匹配"a*"。 ^ 匹配⼀个输⼊或⼀⾏的开头,/^a/匹配"an A",⽽不匹配"An a"
$ 匹配⼀个输⼊或⼀⾏的结尾,/a$/匹配"An a",⽽不匹配"an A"
* 匹配前⾯元字符0次或多次,/ba*/将匹配b,ba,baa,baaa
+ 匹配前⾯元字符1次或多次,/ba*/将匹配ba,baa,baaa
? 匹配前⾯元字符0次或1次,/ba*/将匹配b,ba
(x) 匹配x保存x在名为$1...$9的变量中
x|y 匹配x或y
{n} 精确匹配n次
{n,} 匹配n次以上
{n,m} 匹配n-m次
[xyz] 字符集(character set),匹配这个集合中的任⼀⼀个字符(或元字符)
[^xyz] 不匹配这个集合中的任何⼀个字符
[\b] 匹配⼀个退格符
\b 匹配⼀个单词的边界
\B 匹配⼀个单词的⾮边界
\cX 这⼉,X是⼀个控制符,/\cM/匹配Ctrl-M
\d 匹配⼀个字数字符,/\d/ = /[0-9]/
\D 匹配⼀个⾮字数字符,/\D/ = /[^0-9]/
\n 匹配⼀个换⾏符
\r 匹配⼀个回车符
\s 匹配⼀个空⽩字符,包括\n,\r,\f,\t,\v等
\S 匹配⼀个⾮空⽩字符,等于/[^\n\f\r\t\v]/
\t 匹配⼀个制表符
\v 匹配⼀个重直制表符
\w 匹配⼀个可以组成单词的字符(alphanumeric,这是我的意译,含数字),包括下划线,如[\w]匹配"$5.98"中的5,等于[a-zA-Z0-9]
\W 匹配⼀个不可以组成单词的字符,如[\W]匹配"$5.98"中的$,等于[^a-zA-Z0-9]。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论