Python正则表达式:最短匹配
最短匹配应⽤于:假如有⼀段⽂本,你只想匹配最短的可能,⽽不是最长。
例⼦
⽐如有⼀段html⽚段,'<a>this is first label</a><a>the second label</a>',如何匹配出每个a标签中的内容,下⾯来看下最短与最长的区别。代码
>>> import re
>>> str = '<a>this is first label</a><a>the second label</a>'
>>> print re.findall(r'<a>(.*?)</a>', str)  # 最短匹配
['this is first label', 'the second label']
>>> print re.findall(r'<a>(.*)</a>', str)
['this is first label</a><a>the second label']
解释
例⼦中,模式r''的意图是匹配被包含的⽂本,但是正则表达式中*操作符是贪婪的,因此匹配操作会查出最长的可能。python正则表达式不包含
但是在*操作符后⾯加上?操作符,这样使得匹配变成⾮贪婪模式,从⽽得到最短匹配。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。