正则表达式和re库(菜鸟教程)
匹配:
(pattern, string, flags=0)
re.match()只匹配字符串的开始
re.search():整个字符串
1. 检索和替换:re.sub()
(pattern, repl, string, count=0, flags=0)
2. 编译正则表达式:repile(pattern[, flags])
3. 返回列表::re.findall(string[, pos[, endpos]])
4. 迭代器返回::re.finditer(pattern, string, flags=0)
5. 分割后返回列表::re.split(pattern, string[, maxsplit=0, flags=0])
group([group1, …]) :获得⼀个或多个分组匹配的字符串
start([group]) :获取起始位置
end([group]): 获取结束位置(⼦串最后⼀个字符的索引+1)
span([group]) :⽅法返回 (start(group), end(group))。
flag
re.I忽略⼤⼩写
re.L做本地化识别匹配
re.M多⾏匹配
re.S使 . 匹配包括换⾏在内的所有字符
re.U根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。
re模块
^匹配字符串的开头
$匹配字符串的末尾。菜鸟教程python函数
.匹配任意字符,除了换⾏符,1 当re.DOTALL标记被指定时,则可以匹配包括换⾏符的任意字符。
[…]⽤来表⽰⼀组字符,单独列出:[amk] 匹配 ‘a’,‘m’或’k’
[^…]不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。
*0个或多个,前⼀个
+1个或多个,前⼀个
0个或1个由前⾯的正则表达式定义的⽚段,⾮贪婪⽅式
{ n}n个前⾯表达式。 例如,"o{2}“不能匹配"Bob"中的"o”,但是能匹配"food"中的两个o。
{ n,}精确匹配n个前1。 例如,"o{2,}“不能匹配"Bob"中的"o”,但能匹配"foooood"中的所有o。 "o{1,}“等价于"o+”。"o{0,}“则等价于"o*”。
{ n, m}匹配 n 到 m 次由前⾯的⽚段, {:3}三次
a| b匹配a或b
(…)匹配括号内的表达式,也表⽰⼀个组,只能使⽤|
(?imx)正则表达式包含三种可选标志:i, m, 或 x 。只影响括号中的区域。(?-imx)正则表达式关闭 i, m, 或 x 可选标志。只影响括号中的区域。(?: re)类似 (…), 但是不表⽰⼀个组
(?imx:
re)
在括号中使⽤i, m, 或 x 可选标志
(?-imx:
re)
在括号中不使⽤i, m, 或 x 可选标志
(?#…)注释.
(?= re)前向肯定界定符。如果所含正则表达式,以 … 表⽰,在当前位置成功匹配时成功,否则失败。但⼀旦所含表达式已经尝试,匹配引擎根本没有提
⾼;模式的剩余部分还要尝试界定符的右边。
(?! re)前向否定界定符。与肯定界定符相反;当所含表达式不能在字符串当前位置匹配时成功。
(?> re)匹配的独⽴模式,省去回溯。
\w数字字母下划线, [A-Za-z0-9]
\W⾮数字字母下划线
\s任意空⽩字符,等价于 [\t\n\r\f]。
\S任意⾮空字符
\d任意数字,等价于 [0-9]。
\D任意⾮数字
\A字符串开始
\Z字符串结束,如果是存在换⾏,只匹配到换⾏前的结束字符串。
\z字符串结束
\G最后匹配完成的位置。
\b匹配⼀个单词边界,也就是指单词和空格间的位置。例如, ‘er\b’ 可以匹配"never" 中的 ‘er’,但不能匹配 “verb” 中的 ‘er’。
\B匹配⾮单词边界。‘er\B’ 能匹配 “verb” 中的 ‘er’,但不能匹配 “never” 中的 ‘er’。
\n, \t,
等。
匹配⼀个换⾏符。匹配⼀个制表符, 等
\1…\9匹配第n个分组的内容。
\10匹配第n个分组的内容,如果它经匹配。否则指的是⼋进制字符码的表达式。
\cx
匹配由x指明的控制字符。例如, \cM 匹配⼀个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之⼀。否则,将 c 视为⼀个原义的 ‘c’ 字
符。
\f匹配⼀个换页符。等价于 \x0c 和 \cL。
\n匹配⼀个换⾏符。等价于 \x0a 和 \cJ。
\r匹配⼀个回车符。等价于 \x0d 和 \cM。
\t匹配⼀个制表符。等价于 \x09 和 \cI。
\v匹配⼀个垂直制表符。等价于 \x0b 和 \cK。
^匹配字符串的开头
正整数:^[0-9]*[1-9][0-9]*&
中⽂字符:[\u4e00-\u9fa5]
[0-9]匹配任何数字。类似于 [0123456789]
[^0-9]匹配除了数字外的字符
[a-z]匹配任何⼩写字母
[A-Z]匹配任何⼤写字母
[a-zA-Z0-9]匹配任何字母及数字
\d匹配⼀个数字字符。等价于 [0-9]。
\D匹配⼀个⾮数字字符。等价于 [^0-9]。
\s匹配任何空⽩字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
\S匹配任何⾮空⽩字符。等价于 [^ \f\n\r\t\v]。
\w匹配包括下划线的任何单词字符。等价于’[A-Za-z0-9_]’。
\W匹配任何⾮单词字符。等价于 ‘[^A-Za-z0-9_]’。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论