Python_正则表达式匹配Word⽂档使⽤正则表达式匹配Word⽂档中的所有字符
1、原⽂内容如下:
writelines使用方法python2、期望得到的结果:
3、源码:
//
from docx import Document
import re
pattern = repile("\d{6}[\u4e00-\u9fff]+") # 正则表达式
# pattern = repile("\d{6}[^A-Za-z0-9\!\%\[\]\,\。]+")
doc =Document('./地区码.docx') # 原⽂件
fo =open('','a') # 保存的⽂件,
for i in doc.paragraphs:# 读取所有的段落
st = pattern.)# 按正则表达式匹配区号和地名
for t in st: # 遍历分离的区号和地名
# print(t)
txt = t[:6]+','+ t[6:]+'\n' # 在区号和地名间加上逗号和换⾏符。
fo.writelines(txt)# 写⼊⽂件
fo.close()
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论