python正则元字符的含义--688IT编程网

python正则元字符的含义练习的时候使⽤linux+ipython，

python的元字符

# 元字符：

# . ^ $ * + ? {} [] \ | ()

注：\w还可以匹配下划线和汉字

[ab\d]表⽰只要匹配该集合中的任⼀⼀个表达式都OK

注意并不是按照集合的顺序来匹配的。⽽是返回第⼀个符合条件的字符串

注：^$匹配的是⾏⾸和⾏尾， \A\Z匹配的是字符串的⾸尾【没整没明⽩】

*？ +? ??

⾸先明确⼀点，他们必须结合左右的正则进⾏匹配，左边必须有内容，右边可以没有，即为''

?? =（匹配字符1？）？匹配字符2，字符1{0,1}+字符2，字符1出现次数<=1，字符2出现次数>=1

In [149]: re.match(r'\w??\d','123wer123') # 第⼀个\d即数字之前，\w匹配最少可以⼀次都不匹配，返回第⼀个数字

Out[149]: <re.Match object; span=(0, 1), match='1'>

In [150]: re.match(r'\w??\d','w123wer123') # 第⼀个\d数字之前，\w最少可以只匹配⼀次，返回⼀个字母+第⼀个数字

Out[150]: <re.Match object; span=(0, 2), match='w1'>

In [151]: re.match(r'\w??\d','wx123wer123') # 第⼀个\d数字之前，\w最少会匹配超过⼀次，最终匹配失败，返回None

In [152]: re.match(r'\w??\d','wxwer') #\d没匹配到，所以最终匹配失败，返回None

In [153]: re.match(r'\w??','wxwer') #　在第⼀个''之前，\w最少可以只匹配0次，最多匹配1次, ⾮贪婪模式选择最少匹配次数，\w匹配0次，所以返回''

Out[153]: <re.Match object; span=(0, 0), match=''>

*? = 其实可以拆分看字符1*?字符2，相当于（字符1*）？字符2，字符1{0,}+第⼀个字符2, 字符1次数>=0，字符2出现次数>=1

In [154]: re.match(r'\w*?\d','123wer123') # \w匹配0次，返回第⼀个数字

Out[154]: <re.Match object; span=(0, 1), match='1'>

In [155]: re.match(r'\w*?\d','wx123wer123') # \w匹配2次，返回2个字母+⼀个数字

Out[155]: <re.Match object; span=(0, 3), match='wx1'>

In [156]: re.match(r'\w*?\d','wxe') # \d没有匹配项，最终匹配失败，返回None

In [157]: re.match(r'\w*?','wxe') # 遇到第⼀个''之前\w可以最多匹配三个，最少可以⼀次都不匹配，⾮贪婪模式按\w匹配次数最少的来, \w匹配0次，最终返回''

Out[157]: <re.Match object; span=(0, 0), match=''>

+？=（字符1+）？字符2，字符1{1,}+第⼀个字符2，字符1出现次数>=1，字符2出现次数>=1

In [160]: re.match(r'\w+?\d','%123wer123') # \w匹配0次，最终匹配失败，返回None

In [161]: re.match(r'\w+?\d','wsx123wer123') #\w匹配3次，最后返回三个字母+第⼀个数字

Out[161]: <re.Match object; span=(0, 4), match='wsx1'>

In [162]: re.match(r'\w+?\d','wsxwer') # \d匹配0次，最终匹配失败，返回None

In [163]: re.match(r'\w+?','wsxwer') # 遇到第⼀个''之前，\w在这⾥最多可以匹配6次，最好必须匹配⼀次，⾮贪婪模式就是按最少的次数来，所以返回第⼀个字母+''，即第⼀个字母Out[163]: <re.Match object; span=(0, 1), match='w'>

In [165]: re.match(r'w+?\w','wsxwer') # 注意返回的是ws⽽不是wsxwe，w+表⽰w可以出现1到多次，ws中w只匹配⼀次，wsxwe却匹配了2次，⾮贪婪模式就是捡w匹配次数最少的来，所以返回ws

Out[165]: <re.Match object; span=(0, 2), match='ws'>

看如下⽰例应该能更好的理解

理解了*？，+？就更好理解了，单独使⽤同{1}，配合后⾯的表达式使⽤的时候意味着如果能匹配到后⾯的表达式则前⾯⽆限长匹配，

如果不能匹配到后⾯⼀个表达式则只返回匹配到的第⼀个字符

|单独使⽤只匹配左右紧邻的表达式，可以和（）结合使⽤

如下⽰例可以看出分组结合|的妙⽤， r'1cb|ab' 只能匹配到1cbb和1cab

但是r'1(cb|ab)'则表⽰匹配1cb和1ab，是把ab和cb当做⼀个整体

引⽤编号分组和别名分组，如果分组⽐较多的时候建议⽤别名分组

\元字符表⽰匹配元字符本⾝

^ 脱字符，匹配输⼊字符串的开始的位置

整个字符串的第⼀个字符

$ 匹配输⼊字符串的结束位置

整个字符串结束字符，但如果最后⼀个是换⾏符那按照倒数第⼆个也可以匹配到，当然直接按照换⾏符也可以匹配到

\b 表⽰单词的边界，\B与\b相反

\d 匹配0~9的数字

\D 匹配数字以外的字符

\w 匹配字母或数字或下划线或汉字等

字符串截取倒数第二个\W与\w的含义相反，是匹配特殊字符的

\s 匹配任意的空⽩符，包括空格，制表符(Tab)，换⾏符等，\S匹配⾮空⽩字符

688IT编程网

python正则元字符的含义

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

python正则元字符的含义

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式