golangre正则排除特定字符串if什么开头_Python中re模块知识点总结

⼀、什么是正则表达式？

b：匹配单词边界，w和W之间

B：匹配⾮单词边界，[^b]

5.匹配分组

|：匹配左右任意⼀个表达式

(...)：被括起来的表达式作为⼀个分组，从表达式左边开始，每遇到⼀个'('，编号+1。分组表达式作为⼀个整体，后⾯可接数量词。表达式中的|仅在该分组中有效

(?P)：分组，除了原有的编号以外，再给分组取⼀个别名

(?P=)：引⽤别名为的分组匹配到的字符串

：引⽤编号为的分组匹配到的字符串

6.特殊构造(不作为分组)

(?:...)：(...)的不分组版本，⽤于使⽤'|'或后⾯接上数量词，⽐如(?:[1-9]?d|100)表⽰匹配数字0-100，(?:abc){2}表⽰匹配abcabc 剩下的⼀些不常见，略

三、re模块

在 Python中，我们可以使⽤内置的 re 模块来使⽤正则表达式。与⼤多数编程语⾔相同，正则表达式⾥使⽤''作为转义字符，这就可能造成反斜杠困扰。Python⾥的原⽣字符串很好地解决了这个问题，只需要在字符串前⾯加上'r'前缀。

re模块的⼀般使⽤步骤：

1. 使⽤ compile() 函数将正则表达式的字符串形式编译为⼀个 Pattern 对象

2. 通过 Pattern 对象提供的⼀系列⽅法对⽂本进⾏匹配查

1pile函数

compile 函数⽤于编译正则表达式，⽣成⼀个 Pattern 对象。必须传⼊的第⼀个参数是'规则字符串'，另外可以通过第⼆个参数(flags)来指定匹配模式。

常见的匹配模式：

1. re.I(re.IGNORECASE): 忽略⼤⼩写

2. re.M(MULTILINE): 多⾏模式，改变'^'和'$'的⾏为

3. re.S(DOTALL): 点任意匹配模式，改变'.'的⾏为，可以匹配''

import re

# 将正则表达式编译成 Pattern对象，并指定匹配模式为点任意匹配模式

pattern = repile(r'd+',re.S)

2.Pattern 对象的⼀些常⽤⽅法

match⽅法

match ⽅法⽤于查字符串的头部(也可以指定起始位置)，它是⼀次匹配，只要到了⼀个匹配的结果就返回，⽽不是查所有匹配的结果。

它的⼀般使⽤形式如下：

match(string[, pos[, endpos]])

其中，string 是待匹配的字符串，pos 和 endpos 是可选参数，指定字符串的起始和终点位置，默认值分别是 0 和 len (字符串长度)。因此，当你不指定 pos 和 endpos 时，match ⽅法默认匹配字符串的头部。

当匹配成功时，返回⼀个 Match 对象，如果没有匹配上，则返回 None。

Match对象常⽤的⽅法:

group(([group1, …])：⽤于获得⼀个或多个分组匹配的字符串，如果传⼊多个分组编号，则返回的结果为元组形式。当要获得整个匹配的⼦串时，可直接使⽤ group() 或 group(0)；

groups()：获得所有分组匹配到的字符串所构成的元组

start([group]) ⽅法⽤于获取分组匹配的⼦串在整个字符串中的起始位置(⼦串第⼀个字符的索引)，参数默认值为 0；

end([group]) ⽅法⽤于获取分组匹配的⼦串在整个字符串中的结束位置(⼦串最后⼀个字符的索引+1)，参数默认值为 0；

span([group]) ⽅法返回 (start(group), end(group))，获取分组匹配的⼦串在整个字符串中的起始和结束位置构成的元组。

通过⼀些例⼦来熟悉⼀下：

In [1]: import re

In [2]: pattern = repile(r"(w+) (d+)")

In [3]: m = pattern.match('hello 123')

In [4]: m.group(1)

Out[4]: 'hello'

In [5]: m.group(1,2)

Out[5]: ('hello', '123')

In [6]: m.group()

Out[6]: 'hello 123'

In [7]: m.groups()

Out[7]: ('hello', '123')

In [8]: m.start(1)

Out[8]: 0

In [9]: m.start(2)

Out[9]: 6

In [10]: m.end(1)

Out[10]: 5

In [11]: m.span(1)

Out[11]: (0, 5)

In [12]: m.span(2)

Out[12]: (6, 9)

search⽅法

search ⽅法⽤于查字符串的任何位置，它也是⼀次匹配，只要到了⼀个匹配的结果就返回，⽽不是查所有匹配的结果

它的⼀般使⽤形式如下：

search(string[, pos[, endpos]])

其中，string 是待匹配的字符串，pos 和 endpos 是可选参数，指定字符串的起始和终点位置，默认值分别是 0 和 len (字符串长度)。

看看例⼦

>>> import re

>>> pattern = repile('d+')

>>> m = pattern.search('one12twothree34four') # 这⾥如果使⽤ match ⽅法则不匹配

>>> m

>>> m.group()

'12'

>>> m = pattern.search('one12twothree34four', 10, 30) # 指定字符串区间

>>> m

>>> m.group()

'34'

>>> m.span()

(13, 15)

findall⽅法

上⾯的 match 和 search ⽅法都是⼀次匹配，只要到了⼀个匹配的结果就返回。然⽽，在⼤多数时候，我们需要搜索整个字符串，获得所有匹配的结果。

findall ⽅法的使⽤形式如下：

findall(string[, pos[, endpos]])

其中，string 是待匹配的字符串，pos 和 endpos 是可选参数，指定字符串的起始和终点位置，默认值分别是 0 和 len (字符串长度)。

findall 以列表形式返回全部能匹配的⼦串，如果没有匹配，则返回⼀个空列表。

看个例⼦：regex匹配

import re

#re模块提供⼀个⽅法叫compile模块，提供我们输⼊⼀个匹配的规则

#然后返回⼀个pattern实例，我们根据这个规则去匹配字符串

pattern = repile(r'd+.d*')

#通过partten.findall()⽅法就能够全部匹配到我们得到的字符串

result = pattern.findall("123.141593, 'bigcat', 232312, 3.15")

#findall 以列表形式返回全部能匹配的⼦串给result

for item in result:

print(item)

运⾏结果:

123.141593

3.15

finditer⽅法

finditer ⽅法的⾏为跟 findall 的⾏为类似，也是搜索整个字符串，获得所有匹配的结果。当它返回⼀个顺序访问每⼀个匹配结果(Match 对象)的迭代器。

举例：

In [1]: import re

In [2]: pattern = repile(r"d+")

In [3]: iter = pattern.finditer('hello123world456 haha789')

In [4]: iter

Out[4]:

In [5]: for m in iter:

...: up())

...:

123

456

789

split⽅法

split ⽅法按照能够匹配的⼦串将字符串分割后返回列表

它的使⽤形式如下:

split(string[, maxsplit])

其中，maxsplit ⽤于指定最⼤分割次数，不指定将全部分割。

举个例⼦:

In [1]: import re

In [2]: pattern = repile(r"[ds]")

In [3]: pattern.split('hello1word2aaa bbb')

Out[3]: ['hello', 'word', 'aaa', 'bbb']

In [4]: pattern.split('hello1word2aaa bbb',2)

Out[4]: ['hello', 'word', 'aaa bbb']

sub⽅法

sub ⽅法⽤于替换。

它的使⽤形式如下

sub(repl, string[, count])

其中，repl 可以是字符串也可以是⼀个函数：

如果 repl 是字符串，则会使⽤ repl 去替换字符串每⼀个匹配的⼦串，并返回替换后的字符串，另外，repl 还可以使⽤ id 的形式来引⽤分组，但不能使⽤编号 0；

如果 repl 是函数，这个⽅法应当只接受⼀个参数(Match 对象)，并返回⼀个字符串⽤于替换(返回的字符串中不能再引⽤分组)。

count ⽤于指定最多替换次数，不在本篇⽂章⾥⼩编给⼤家整理的是⼀篇关于python中re模块知识点总结内容，有兴趣的朋友们可以学习下。

688IT编程网

golangre正则排除特定字符串if什么开头_Python中re模块知识点总结_百 ...

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

golangre正则排除特定字符串if什么开头_Python中re模块知识点总结_百 ...

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式