Python正则表达式分组优先级--688IT编程网

Python正则表达式分组优先级

正则表达式的符号

⼀.元字符

1. . 通配符：可代指任意⼀个符号，除换⾏符

import re

print(re.findall('a..x','scdcdabnxmn'))

#输出：

['abnx']

2. ^ 在字符串开头匹配

import re

print(re.findall('^a..x','ascxdcdabnxmn'))

#输出

['ascx']

3. $ 在字符串结尾匹配

import re

print(re.findall('a..x$','ascxdcdabnxamnx'))

['amnx']

1. 重复0到⽆穷次

import re

print(re.findall('m*','ascxdcmmmmmdabnxamnx'))

#输出

['', '', '', '', '', '', 'mmmmm', '', '', '', '', '', '', 'm', '', '', '']

1. 重复1到⽆穷次

import re

print(re.findall('m+','ascxdcmmmmmdabnxamnx'))

#输出

['mmmmm', 'm']

6. ？结尾数据匹配0或1次

import re

print(re.findall('xdc?','ascxdcccmmmmmdabnxamnx'))

#输出

['xdc']

7. {a,b} 结尾数据匹配 a到b次

import re

print(re.findall('xdm{2,3}','ascxdmmmmmdabnxxdmmnx'))

#输出

'xdmmm', 'xdmm']

8. []或， []中不可加元字符。在[]中有特殊意义的字符有：-（表⽰范围）,^（表⽰取反）,\ （表⽰转义，去格式化）

import re

print(re.findall('x[yz]','hiuhwfxyndvkfjxz'))

#输出

['xy', 'xz']

9. \ 表⽰转义符，放在特殊字符前可将特殊字符变成普通字符

10. | 或表⽰或：

import re

s='abekwjbnkcdndnv'

print(re.findall('kw|c',s))

#输出：

['kw', 'c']

11. （）表⽰分组，分组内的内容为整体

import re

print(re.findall('x(dm)','ascxdmxdmxdmmmdabnxxdmmnx'))

#输出：

['dm', 'dm', 'dm', 'dm']

13. findall+分组：优先匹配分组⾥的内容

f=re.findall('www\.(baidu|163)','www.baidu')

print(f)

#输出

['baidu']

14. 有名分组：？Ppattern 匹配⽅式将⽤pattern在字符串⾥匹配到的内容以键值对的形式输出，name为key，pattern匹配到的结果为

value

import re

s='alex23xiaoming35xiaohong56'

print(re.search('(?P<name>[a-z]+)(?P<age>\d+)',s).groupdict('name'))

#输出

{'name': 'alex', 'age': '23'}

字符表

re模块下的⽅法：

1. re.findall(pattern, string) pattern是正则表达式，string 是需要匹配的字符串

返回所有符合条件的, 返回列表返回所有符合条件的, 返回列表

2. obj=re.search(pattern, string) 到⼀个即停⽌寻，返回⼀个对象，通过三种⽅法调⽤：

#实例：

import re

obj=re.search('a(..)x','scdcdabnxmn')

print(type(obj))

print(obj)

up())

ups())

updict())

#输出

<re.Match object; span=(5, 9), match='abnx'>

abnx

('bn',)

{}

3. re.match（pattern，string）从开头匹配，返回⼀个对象，调⽤同search

4. re.split(pattern,string) 按正则表达式搜索到的结果分割字符串，结果中不包含分隔符

import re

s='alexm23xiaoming35mxiaohongm56'

print(re.split('\d\w',s))

#输出

python正则表达式不包含['alexm', 'xiaoming', 'mxiaohongm', '']

5. re.sub（‘需要替换的对象’,‘替换的内容’，s，n替换次数）：替换

import re

s='abchjh9vjhfe8kjqv3bj'

print(re.sub('\d+','A',s))

#输出：

abchjhAvjhfeAkjqvAbj

6. repile(pattern) 编译正则表达式

import re

s='abchjh933737vjhfe8kjqv3bj'

com=repile('\d+')

#两种使⽤⽅法

print(com.findall(s))

print(re.findall(com,s))

#输出

['933737', '8', '3']

7. re.finditer() 返回迭代器，迭代对象是re.Match对象，调⽤⽅法如search和match

import re

s='abchjh933737vjhfe8kjqv3bj'

it=re.finditer('\d+',s)

print(type(it))

print(type(next(it)))

print(next(it).group())

#输出：

8. findall+分组：优先匹配分组⾥的内容

f=re.findall('www\.(baidu|163)','www.baidu')

print(f)

#输出

['baidu']

9. 在分组加？：去优先级

import re

f=re.findall('www\.(?:baidu|163)','www.baidu')

print(f)

#输出

['www.baidu']

10. re.S: 匹配时⾃动换⾏

正则表达式中，“.”的作⽤是匹配除“\n”以外的任何字符，也就是说，它是在⼀⾏中进⾏匹配。这⾥的“⾏”是以“\n”进⾏区分的。a字符串有每⾏的末尾有⼀个“\n”，不过它不可见。

如果不使⽤re.S参数，则只在每⼀⾏内进⾏匹配，如果⼀⾏没有，就换下⼀⾏重新开始，不会跨⾏。⽽使⽤re.S参数以后，正则表达式会将这个字符串作为⼀个整体，将“\n”当做⼀个普通的字符加⼊到这个字符串中，在整体中进⾏匹配。

import re

a = '''asdfsafhellopass:

234455

worldafdsf

'''

b = re.findall('hello(.*?)world',a)

c = re.findall('hello(.*?)world',a,re.S)

print 'b is ' , b

print 'c is ' , c

#输出：

b is []

c is ['pass:\n\t234455\n\t']

#辨析：优先级/去优先级/贪婪匹配/⾮贪婪匹配

⼀些例⼦感受区别：

import re

print(re.findall('m(.*?)','ascxdcmmmmmdabnxamnx')) #优先匹配分组⾥的内容

['', '', '', '', '', '']

print(re.findall('m.+?','ascxdcmmmmmdabnxamnx')) #

['mm', 'mm', 'md', 'mn']

print(re.findall('m*?','ascxdcmmmmmdabnxamnx'))

['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']

print(re.findall('m(?:.*?)','ascxdcmmmmmdabnxamnx')) #去优先级

['m', 'm', 'm', 'm', 'm', 'm']

print(re.findall('m.*?','ascxdcmmmmmdabnxamnx'))

['m', 'm', 'm', 'm', 'm', 'm']

import re

print(re.findall('m(.*?)x','ascxdcmmmmmdabnxamnx')) #优先匹配分组⾥的内容，尽可能少的匹配

['mmmmdabn', 'n']

print(re.findall('m(.*)x','ascxdcmmmmmdabnxamnx')) #优先匹配分组⾥的内容，尽可能多的匹配

['mmmmdabnxamn']

688IT编程网

Python正则表达式分组优先级

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

Python正则表达式分组优先级

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式