js正则捕获exec和match,正则检测test,正则替换replace,四
者全解析
⾸先⽤⼀张表来总说对⽐
注:pattern 为RegExp的实例, str 为String的实例
⽤法说明返回值
<(str)根据pattern对str进⾏正则匹配返回匹配结果数组,如匹配不到返回null
str.match(pattern)根据pattern对str进⾏正则匹配返回匹配结果数组,如匹配不到返回null
要注意的是:test和exec是正则表达式对象的操作⽅法,match和replace是字符串的操作⽅法
另外,这⾥插⼊⼀点,md的表格语法
Markdown 制作表格使⽤ | 来分隔不同的单元格,使⽤ - 来分隔表头和其他⾏。
语法如下:
| 表头 | 表头 |
| ---- | ---- |
| 单元格 | 单元格 |
| 单元格 | 单元格 |
很多教程,都会遗忘⼀点,什么叫正则实例,⾸先要弄清正则对象
var reg = /\d+/;
//使⽤dir函数,来查看reg的类型
console.dir(reg)
查看输出结果,完全的了解正则对象
其他三个函数,⽐较简单吧,这⾥主要研究 exec⽅法
⾸先,语法和中⽂意思:
<(str) 就是正则对象,去捕获⼀个字符串,返回⼀个数组,数组包含四部分,还是打印⼀下吧。哦,还是看别⼈写的优秀教程吧。exec: 正则捕获
每⼀次捕获的时候,都是先进⾏默认的匹配,如果没有匹配成功的,捕获的结果是null;只有有匹配的内容,我们才能捕获到,捕获到的内容是⼀个数组。
捕获的内容格式
1. 捕获的内容是⼀个数组。
数组中的第⼀项是当前⼤正则捕获的内容。
index: 捕获内容在字符串中开始的索引位置。
input: 捕获的原始字符串。
var reg = /\d+/;
var str = "derrickrose";
var res = (str);
console.log(res); // null
var str = "derrick20rose21";
var res = (str);
console.log(res); // [0:"20", index:7, input: "derrick20rose21"]
console.log(reg.lastIndex); // 0
// 第⼆次通过exec捕获的内容还是第⼀个内容
var res = (str);
console.log(res); // [0:"20", index:7, input: "derrick20rose21"]
console.log(reg.lastIndex); // 0, 说明第⼆次捕获的时候也是从字符串索引0处开始查的
正则捕获的特点
1. 懒惰性 -> 每⼀次执⾏exec,只捕获第⼀个匹配的内容,在不经过任何处理的情况下,在执⾏多次捕获后,匹配的还是第⼀个内容。
lastIndex: 是正则每⼀次捕获在字符串中开始查的位置,默认值是0。
2. 如何解决懒惰型?-> 在正则的末尾加⼀个修饰符 "g"。
修饰符: g, i, m:
global(g): 全局匹配。
ignoreCase(i): 忽略⼤⼩写匹配。
multiline(m): 多⾏匹配。
原理: 加了全局修饰符"g",正则每⼀次捕获结束后,lastIndex的值都变为了最新的值,下⼀次捕获从最新的位置开始查,这样就可以把所有需要捕获的内容都获取到了。
var reg = /\d+/g;
var str = "derrick20rose21";
console.log(reg.lastIndex); // 0
console.(str)); // ["20..
console.log(reg.lastIndex); // 9
console.(str)); // ["21..
console.log(reg.lastIndex); // 15
console.(str)); // null
3. ⾃⼰编写程序,获得正则的所有内容,注意,⼀定不要忘记加 "g"。
var reg = /\d+/g;
var str = "derrick20rose21";
var ary = [];
var res = (str);
while (res) {
ary.push(res[0]);
res = (str);
}
console.log(ary);
4. 贪婪性:正则每⼀次捕获都是按照都是按照最长的结果来捕获的,例如2符合正则,20也符合正则,但是默认的捕获的是20。
var reg = /\d+/g; // -> 出现1到第⼀个0-9之间的数字
var str = "derrick20rose21";
console.(str)); // ["20".....]
5. 如何解决正则的贪婪性 -> 在量词元字符后⾯添加⼀个 ? 即可。
在正则中有很多的作⽤:
放在⼀个普通的元字符后⾯,代表出现0-1次 /\d?/ 出现0-1次数字 -> 数字可能出现也可能不出现。
放在⼀个量词元字符后⾯是取消捕获时候的贪婪性。
var reg = /\d+?/g;
var str = "derrick20rose21";
console.(str)); // ["2".....]
var ary = [];
var res = (str);
while (res) {
ary.push(res[0]);
res = (str);
}
console.log(ary);
字符串中的match⽅法 -> 把所以和正则匹配的字符都获取到。
var reg = /\d+?/g;
var str = "derrick20rose21";
var ary = str.match(reg);
console.log(ary);
虽然在当前的情况下,match⽐exec更加简洁,但是match中存在⼀些⾃⼰处理不了的问题: 在分组捕获到情况下,match只能捕获到⼤正则匹配的内容,⽽对于⼩正则捕获的内容是⽆法获取的。
分组捕获
正则分组:
1. 改变优先级
2. 分组引⽤
// \2 代表和第⼆个分组出现⼀模⼀样的内容
// \1 代表和第⼀个分组出现⼀模⼀样的内容
// ⼀模⼀样: 和对应的分组中的内容的值都要⼀样
var reg = /^(\w)\1(\w)\2$/;
console.st("zzff")); // -> true
console.st("z0f_")); // -> false
3. 分组捕获 -> 正则在捕获的时候,不仅仅把⼤正则匹配的内容捕获到,⽽且还可以把⼩分组匹配的内容捕获到。
js中文正则表达式(?:)在分组中,?: 的意思是只匹配不捕获。
var reg = /^(\d{2})(\d{4})(\d{4})(\d{2})(?:\d{2})(\d)(?:\d|X)$/;
var str = "122726188803810391";
console.(str)); // -> ary = ["122726188803810391",...]
// 数组中的第⼀项ary[0]: ⼤正则匹配的内容
// ary[1]: -> 第⼀个分组捕获的内容
// ary[2]: -> 第⼆个分组捕获的内容
// ...
console.log(str.match(reg)); // -> match 和 exec获取的结果是⼀样的
var reg = /derrick(\d+)/g;
var str = "derrick20rose30derrick40";
// ⽤exec执⾏三次,每⼀次不仅仅把⼤正则匹配的获取到,⽽且还可以获取第⼀个分组匹配的内容
console.(str));
console.(str));
console.(str));
// ⽽match只能捕获⼤正则匹配的内容
console.log(str.match(reg));
关于正则分组和捕获建议参考
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论