JS正则表达式之特殊符号
在正则表达式中,许多标点符号具有特殊含义,⽐较难记,现归纳备个份:
这些符号有:^ $ . * + - ? = ! : | \ / ( ) [ ] { }
1.“[ ]”表⽰字符类: 即括号⾥是个字符集:如/[abc]/,表⽰和含有a,b,c任何⼀个字母的字符串都匹配。
注:特殊字符类:\s表⽰空格符、制表符、Unicode空⽩符。\S表⽰⾮Unicode空⽩符。(也可⾃定义Unicode字符类:如:
/[\u4E00-\u9FA5]/表⽰只匹配中⽂字符。)
\w 任何单字字符,相当于[a-zA-X0-9_];\W与\w相反。
\d 任何数字,相当于[0-9];\D与\w相反。
\b在字符类中使⽤表⽰退格符。[\b]则表⽰退格直接量。\b可以⽤来指定匹配位置,也可称为锚;如:
查⼀个句⼦⾥的单词 java , 可以使⽤/\bjava\b/;\B与其相反。
2.“-"表⽰连字符,如[a-z];
3."."表⽰除换⾏符和其他Unicode⾏终⽌符之外的任意字符。
4."^"具有两重含义:开始标记和⾮,如:/^a/表⽰以a开始的字符,当在[]中时:/[^a]/表⽰⾮a的所有字符。
5."$"表⽰字符结尾。如:/^abc$/表⽰以c结束的字符。
6.”{}"表⽰重复上⼀项。如/\d{2,4}/表⽰数字出现两次,最多出现4次。如/3{2,4}/匹配33...;;;不匹配3和4个3相连以上的了。它的三种格式如下{n,m}表⽰⾄少3次,最多m次;{n,}⾄少n次;{n}恰好n次。
7."?"表⽰{0,1}。
8."+"表⽰{1,}。
9."*"表⽰{0,}。
注:⾮贪婪的重复(如??,+?,*?,{1,5}?只匹配第⼀个。)
10."|"表⽰分割,即或的含义。如:/ab|cd|ef/匹配含有ab或cd或ef的字符串。
js中文正则表达式11."()"包含三重⽤途:⼀是定义⼦表达式。⼆是在完整的模式中定义⼦模式。三是⼦表达式的引⽤。
⼦模式的定义可以从⽬标串中抽取和括号中的⼦模式相匹配的部分。
⼦模式的表达式的引⽤是指:可识别⼦模式的编号,提取它。如/(abc)\sis\s(string\w*)/;⾥⾯含有两个字表达式:可通过
\1指(abc);\2指(string\w*); 应⽤如:/['"][^'"]*['"]/不能取前后同样的引号,可以这样写:/[('")
[^'"]*\1]/,可起到约束作⽤。
注:若想()⾥的不想被记忆,可采⽤(?:.....),将不会对其编号。
还有(?=p),(?!p)如下:
如/(javascript)?(?=\:)/ 表⽰匹配javascript:,但不包含:;它不匹配javascript,因为他有个条件就是后要接:;
(?!p)反前向声明,要求接下来的字符不与模式p匹配,与(?=p)相反。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论