python将中⽂数字转化成阿拉伯数字python将中⽂数字转化成阿拉伯数字
正则表达式提取⽂本中的数字
这⾥演⽰⼀下⽂本中提取中⽂年份
import re
m0 ="在⼀九四九年新中国成⽴⽐⼀九九零年低百分之五点⼆⼈⼀九九六年击败俄军,取得实质独⽴"
pattrern1 ='[零⼀⼆三四五六七⼋九]{4,}'
pattrern2 ='[〇⼀⼆三四五六七⼋九零壹贰叁肆伍陆柒捌玖貮两]{4,}'
time1 = re.findall(pattrern1,m0)#转化数字
提取年份如:‘1949’, ‘1990’, ‘1996’
这⾥给出许多正则表达式的样例:
中⽂转化成阿拉伯数字
创建⼀个字典然后讲数字进项匹配:
CN_NUM ={
'〇':0,'⼀':1,'⼆':2,'三':3,'四':4,'五':5,'六':6,'七':7,'⼋':8,'九':9,'零':0,
'壹':1,'贰':2,'叁':3,'肆':4,'伍':5,'陆':6,'柒':7,'捌':8,'玖':9,'貮':2,'两':2,}
for i in range(len(time1)):
new_str =''
for j in time1[i]:
new_str +=str(CN_NUM[j])
time1[i]= new_str
time1
这样结果就出来啦,成功将上⽂例⼦中⽂年份转化成阿拉伯数字:‘1949’, ‘1990’, ‘1996’完整代码
# 2、将句⼦中年份的⼤写数字改为阿拉伯数字
import re
m0 ="在⼀九四九年新中国成⽴⽐⼀九九零年低百分之五点⼆⼈⼀九九六年击败俄军,取得实质独⽴"
pattrern1 ='[零⼀⼆三四五六七⼋九]{4,}'
pattrern2 ='[〇⼀⼆三四五六七⼋九零壹贰叁肆伍陆柒捌玖貮两]{4,}'
time1 = re.findall(pattrern1,m0)#转化数字
CN_NUM ={
'〇':0,'⼀':1,'⼆':2,'三':3,'四':4,'五':5,'六':6,'七':7,'⼋':8,'九':9,'零':0,
正则表达式提取中文'壹':1,'贰':2,'叁':3,'肆':4,'伍':5,'陆':6,'柒':7,'捌':8,'玖':9,'貮':2,'两':2,}
for i in range(len(time1)):
new_str =''
for j in time1[i]:
new_str +=str(CN_NUM[j])
time1[i]= new_str
time1

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。