python正则表达式统计字符串的个数
⽬的:通过python将pubmed下载的摘要txt⽂档,统计出其中的PMID数⽬,是否和⽂献总篇数⼀致,⼀致的话,就可以利⽤PMID的regex pattern进⾏分割字符串为单篇摘要⽂献。
import re字符串长度统计
fname = '2020-01-14_endometriosis_'
with open(fname, "r", encoding = 'utf-8') as f:
abstracts = f.read()
str = abstracts
iList= re.findall(r"PMID: \d+ ",str)
print(len(iList)) # output: 6049,符合⽂档中⽂献的总篇数
iList= re.findall(r"PMID: \d+",str) # regex pattern中少⼀个空格
print(len(iList)) # output: 6050,结果⽐⽂档中⽂献总篇数多了⼀篇
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论