python正则表达式从字符串中提取数字的思路详解
python从字符串中提取数字
使⽤正则表达式,⽤法如下:
## 总结
## ^ 匹配字符串的开始。
## $ 匹配字符串的结尾。
## \b 匹配⼀个单词的边界。
## \d 匹配任意数字。
## \D 匹配任意⾮数字字符。
## x? 匹配⼀个可选的 x 字符 (换⾔之,它匹配 1 次或者 0 次 x 字符)。
## x* 匹配0次或者多次 x 字符。
## x+ 匹配1次或者多次 x 字符。
## x{n,m} 匹配 x 字符,⾄少 n 次,⾄多 m 次。
## (a|b|c) 要么匹配 a,要么匹配 b,要么匹配 c。
## (x) ⼀般情况下表⽰⼀个记忆组 (remembered group)。你可以利⽤ re.search 函数返回对象的 groups() 函数获取它的值。
## 正则表达式中的点号通常意味着 “匹配任意单字符”
解题思路:
既然是提取数字,那么数字的形式⼀般是:整数,⼩数,整数加⼩数;
所以⼀般是形如:----.-----;
根据上述正则表达式的含义,可写出如下的表达式:"\d+\.?\d*";
\d+匹配1次或者多次数字,注意这⾥不要写成*,因为即便是⼩数,⼩数点之前也得有⼀个数字;\.?这个是匹配⼩数点的,可能有,也可能没有;\d*这个是匹配⼩数点之后的数字的,所以是0个或者多个;
代码如下:
字符串截取数字部分import re
string="A1.45,b5,6.45,8.82"
print re.findall(r"\d+\.?\d*",string)
# ['1.45', '5', '6.45', '8.82']
匹配指定字符串开头的数字
例如下⾯的string:
tensorflow:Final best valid 0 loss=0.20478513836860657 norm_loss=0.767241849151384 roc=0.8262403011322021 pr=0.39401692152023315 calibration=0.9863265752792358 rate=0.0提取 calibration=0.9863265752792358 .
# 匹配“calibration=”后⾯的数字
pattern = repile(r'(?<=calibration=)\d+\.?\d*')
pattern.findall(string)
# ['0.9863265752792358']
匹配包含指定字符串开头的数字
pattern = repile(r'(?:loss=)\d+\.?\d*')
pattern.findall(string)
# ['loss=0.20478513836860657', 'loss=0.767241849151384']
匹配时间,17:35:24
string = "WARNING:tensorflow: 20181011 15:28:39 Initialize training"
pattern = repile(r'\d{2}:\d{2}:\d{2}')
pattern.findall(string)
# ['15:28:39']
匹配时间,20181011 15:28:39
string = "WARNING:tensorflow: 20181011 15:28:39 Initialize training"
pattern = repile(r'\d{4}\d{2}\d{2}\s\d{2}:\d{2}:\d{2}')
pattern.findall(string)
# ['20181011 15:28:39']
总结
以上所述是⼩编给⼤家介绍的python正则表达式从字符串中提取数字的思路详解 ,希望对⼤家有所帮助,如果⼤家有任何疑问请给我留⾔,⼩编会及时回复⼤家的。在此也⾮常感谢⼤家对⽹站的⽀持!
如果你觉得本⽂对你有帮助,欢迎转载,烦请注明出处,谢谢!
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论