Nodejs正则表达式概述
1. 概念
正则表达式描述了⼀种字符串匹配的模式,可以⽤来检查⼀个字符串是否含有某种⼦串、将匹配的⼦串做替换或者从某个字符串中取出符合某个条件的⼦串的等。
2.创建正则表达式
⽅式⼀:字⾯量创建⽅式
var reg = /pattern/flags
⽅式⼆:构造函数实例创建⽅式
var reg = new RegExp(pattern, flags)
说明:
pattern 正则表达式
flags 标识(修饰符)
修饰符主要有:
i 忽略⼤⼩写匹配
m 多⾏匹配(即在到达⼀⾏⽂本末尾时还会继续寻下⼀⾏中是否与正则匹配的项)
g 全局匹配(模式应⽤于所有的字符串),⽽⾮在到第⼀个匹配项时停⽌
注意:
字⾯量创建⽅式特殊含义的字符不需要转义,实例创建⽅式需要转义
⽰例:
var reg1 = new RegExp('\d'); // 表⽰的 d (如果需要\,必须转义\\)
var reg2 = new RegExp('\\d'); // 表⽰的 \d
var reg3 = /\d/; // 表⽰的 \d
3. 元字符
元字符主要分为代表特殊含义的字符与代表次数的量词元字符
特殊含义的元字符
\d : 0-9之间的任意⼀个数字 \d只占⼀个位置
\w : 数字,字母 ,下划线 0-9 a-z A-Z _
\s : 空格或者空⽩等
\D : 除了\d
\W : 除了\w
\S : 除了\s
. : 除了\n之外的任意⼀个字符
\ : 转义字符
| : 或者
() : 分组
\n : 匹配换⾏符
\b : 匹配边界 字符串的开头和结尾 空格的两边都是边界 => 不占⽤字符串位数 ^ : 限定开始位置 => 本⾝不占位置
$ : 限定结束位置 => 本⾝不占位置
[a-z] : 任意字母 []中的表⽰任意⼀个都可以
[^a-z] : ⾮字母 []中^代表除了
[abc] : abc三个字母中的任何⼀个 [^abc]除了这三个字母中的任何⼀个字符次数的量词元字符
* : 0到多个
+ : 1到多个
: 0次或1次 可有可⽆
{n} : 正好n次;
{n,} : n到多次
{n,m} : n次到m次
4. N o dejs中和正则相关的⼀些⽅法
- st(str) //⽤来验证字符串是否符合正则 符合返回true 否则返回false ⽰例:
var str = 'hello';
var reg = /\w+/; // 模式:匹配1到多个的数字、字母、下划线
console.st(str)); // true
- () //⽤来捕获符合规则的字符串
⽰例:
var str = 'tom287aaa879bbb666';
var reg = /\d+/;
console.(str));
// 返回数组中 [0:"287", index:3, input:"tom287aaa879bbb666"]
// 0 : "123" 表⽰我们捕获到的字符串
// index: 3 表⽰捕获开始位置的索引
js中文正则表达式// input: tom287aaa879bbb666 表⽰原有的字符串
标识符 g 作⽤
var str = 'abc123cba456aaa789';
var reg = /\d+/g; //此时加了标识符g
console.log(reg.lastIndex) // lastIndex : 0
console.(str)) // ["123", index: 3, input: "abc123cba456aaa789"]
console.log(reg.lastIndex) // lastIndex : 6
console.(str)) // ["456", index: 9, input: "abc123cba456aaa789"]
console.log(reg.lastIndex) // lastIndex : 12
console.(str)) // ["789", index: 15, input: "abc123cba456aaa789"]
console.log(reg.lastIndex) // lastIndex : 18
console.(str)) // null
console.log(reg.lastIndex) // lastIndex : 0
注意:
每次调⽤exec⽅法时,捕获到的字符串都不相同
lastIndex :这个属性记录的就是下⼀次捕获从哪个索引开始。
当未开始捕获时,这个值为0。
如果当前次捕获结果为null。那么lastIndex的值会被修改为0.下次从头开始捕获。
⽽且这个lastIndex属性还⽀持⼈为赋值。
- str.match(reg) 如果匹配成功,就返回匹配成功的数组,如果匹配不成功,就返回null 如果正则表达式没有标识符 g 则exec与match功能⼀样的
如果正则表达式有标识符 g 则exec与match有明显区别
当全局匹配时,match⽅法会⼀次性把符合匹配条件的字符串全部捕获到数组中,
如果想⽤exec来达到同样的效果需要执⾏多次exec⽅法。
⽰例:
var str = 'abc123cba456aaa789';
var reg = /\d+/g;
console.(str)); // ["123", index: 3, input: "abc123cba456aaa789"] console.log(str.match(reg)); // ["123", "456", "789"]
- place() 正则去匹配字符串,匹配成功的字符去替换成新的字符串
语法:place(reg,newStr);
⽰例:
var str = 'b123bc456d';
var res = place(/\d/g,'Q')
console.log(res) // "bQQQbcQQQd" 将所有的数字替换字符Q
5. 正则的特性 - 贪婪性 与 懒惰性
贪婪性
所谓的贪婪性就是正则在捕获时,每⼀次会尽可能多的去捕获符合条件的内容。
如果我们想尽可能的少的去捕获符合条件的字符串的话,可以在量词元字符后加?
懒惰性
懒惰性则是正则在成功捕获⼀次后不管后边的字符串有没有符合条件的都不再捕获。
如果想捕获⽬标中所有符合条件的字符串的话,我们可以⽤标识符g来标明是全局捕获
⽰例:
var str = '123aaa456';
var reg = /\d+/; //只捕获⼀次,⼀次尽可能多的捕获
var res = str.match(reg)
console.log(res) // ["123", index: 0, input: "123aaa456"]
reg = /\d+?/g; //解决贪婪性、懒惰性
res = str.match(reg)
console.log(res) // ["1", "2", "3", "4", "5", "6"]
6. 正则运算符的优先级
正则表达式从左到右进⾏计算,并遵循优先级顺序,这与算术表达式⾮常类似。
相同优先级的会从左到右进⾏运算,不同优先级的运算先⾼后低。
下⾯是常见的运算符的优先级排列
依次从最⾼到最低说明各种正则表达式运算符的优先级顺序:
\ : 转义符
(), (?:), (?=), [] => 圆括号和⽅括号
*, +, ?, {n}, {n,}, {n,m} => 量词限定符
^, $, \任何元字符、任何字符
| => 替换,"或"操作
字符具有⾼于替换运算符的优先级,⼀般⽤ | 的时候,为了提⾼ | 的优先级,我们常⽤()来提⾼优先级如: 匹配 food或者foot的时候 reg = /foo(t|d)/ 这样来匹配
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论