正则表达式(regex)贪婪模式、懒惰模式使⽤⽅法
正则表达式贪婪匹配模式,对于初学者,往往也很容易出错。有时候需要匹配⼀个段代码内容,发现匹配与想要不⼀致。发现原来,跟贪婪模式有关系。如下,我们看下例⼦:
什么是贪婪模式
字符串有: “<h3>abd</h3><h3>bcd</h3>”,我们想匹配<h3>…</h3>内容,正则表达式如下:
1、h3开头与结尾,”<h3>待添加</h3>” <h3></h3>都作为普通字符
2、中间可以出现任意字符,个数可以是0个或者多个,正则表达式可以⽤:.* ,“.”代表任意字符,默认模式不匹配换⾏,”*” 重复前⾯字符0个或者多个。
3、最终我们考虑结果将是:”<h3>.*</h3>” ,也可以是:”<h3>.{0,}</h3>” {}代表,重复前⾯指定个数字符,以下⽤到是,正则表达式调试⼯具截图,软件可以看:正则表达式⼯具推荐(学习⼯具、测试⼯具)
2种结果都⼀样,这是我们不希望得到的,我们希望从左边开始,第⼀个出现</h3>,就开始匹配。以上这种模式,是贪婪模式,也是正则表达式默认以这个⽅法匹配。表⽰重复字符,操作符,默认都是贪婪模式,如:.*,.+,.{1,},.{0,} 都会匹配最⼤长度字符。正则表达式元字符,量词默认⾸先最⼤匹配字符串,这些量词有:+,*,?,{m,n} 。⼀开始匹配,就直接匹配到最长字符串。
什么是懒惰模式
既然上⾯⼏种,表⽰字符重复个数,元字符默认都是贪婪模式。如果,我们需要最⼩长度匹配,也就是懒惰模式,怎么样写正则表达式呢?其实,正则表达式⾥⾯通⽤⽅法是,在表⽰重复字符元字符,后⾯加多⼀个”?”字符即可。上⾯正则表达式可以写成:”<h3>.*?</h3>”,或者”<h3>.{0,}?</h3>” 都可以。
regex匹配懒惰模式,就匹配到我们需要字符串了。
总结:正则表达式,表⽰字符串重复个数元字符,'?,+,*,{}' 默认都会选择贪婪模式,会最⼤长度匹配
字符串,⽽要切换到懒惰模式,就只是在该元字符,后⾯加多⼀个”?” 即可切换到⾮贪婪模式(懒惰模式)。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论