python从⽂件中提取特定⽂本_python利⽤正则表达式提取⽂
本中特定内容
正则表达式是⼀个特殊的字符序列,它能帮助你⽅便的检查⼀个字符串是否与某种模式匹配。
Python ⾃1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。
re 模块使 Python 语⾔拥有全部的正则表达式功能。
compile 函数根据⼀个模式字符串和可选的标志参数⽣成⼀个正则表达式对象。该对象拥有⼀系列⽅法⽤于正则表达式匹配和替换。
re 模块也提供了与这些⽅法功能完全⼀致的函数,这些函数使⽤⼀个模式字符串做为它们的第⼀个参数。
如何利⽤正则表达式提取⽂中特定内容呢?
函数介绍:
匹配什么内容,更多细节可以去参看菜鸟教程。
提取特定内容:
1.在⼀段⽂本或字符串中提取从某⼀位置XXX开始到某⼀位置X结束的特定内容:repile('XXX.+X'),⽰例:
import re
str='abcd1234efg'
pattern=repile('ab.+ef') #匹配从ab开始,到ef结束的内容
result=pattern.findall(str)
print(result)
运⾏结果如下
['abcd1234ef']
2.在⼀段⽂本或字符串中提取从某⼀位置XXX之后到某⼀位置X之前的特定内容:repile('XXX(.+)X')
菜鸟教程python网址import re
str='abcd1234efg'
pattern=repile('ab(.+)ef') #匹配ab与ef之间的内容
result=pattern.findall(str)
print(result)
运⾏结果如下
['cd1234']
所以从这两个匹配可以看出,两者的主要区别就在于有⽆(),很实⽤的⼀种⽅法~~
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论