Re数零阶模拟准则
re模块
在Python中,我们可以使用内置的re模块来使用正则表达式。与大多数编程语言相同,正则表达式里使用斜杠作为转义字符,这就可能造成反斜杠困扰。Python里的原生字符串很好地解决了这个问题,只需要在字符串前面加上'r'前缀。
re模块的一般使用步骤:
使用compile函数将正则表达式的字符串形式编译为一个Pattern对象
通过Pattern对象提供的一系列方法对文本进行匹配查
compile函数
compile函数用于编译正则表达式,生成一个Pattern对象。必须传入的第一个参数是'规则字符串',另外可以通过第二个参数(flags)来指定匹配模式。
常见的匹配模式:
re.I(re.IGNORECASE):忽略大小写
正则化英文re.M(MULTILINE):多行模式
re.S(DOTALL):点任意匹配模式,改变'.'的行为,可以匹配
match方法
match方法用于查字符串的头部(也可以指定起始位置),它是一次匹配,只要到了一个匹配的结果就返回,而不是查所有匹配的结果。
它的一般使用形式如下:
match(string[,pos[,endpos]])
其中,string是待匹配的字符串,pos和endpos是可选参数,指定字符串的起始和终点位置,默认值分别是0和len(字符串长度)。因此,当你不指定pos和endpos时,match方法默认匹配字符串的头部。
当匹配成功时,返回一个Match对象,如果没有匹配上,则返回None。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论