python正则过滤字母、中⽂、数字及特殊字符⽅法详解去除数字,特殊字符,只保留汉字
import re
s = '1123*#$ 中abc国'
str = re.sub('[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~\s]+', "", s)
# 去除不可见字符
str = re.sub('[\001\002\003\004\005\006\007 08 09 0a 0b 0c 0d 0e 0f 10 11 12 13 14 15 16 17 18 19 1a]+', '', x)
print(str)
# 结果为:中国
去除特殊字符,只保留汉⼦,字母、数字
import re
string = "123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》"
print(string)
123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》
sub_str = re.sub(u"([^\u4e00-\u9fa5\u0030-\u0039\u0041-\u005a\u0061-\u007a])","",string)
正则化匹配26个字母pythonprint(sub_str)
123我123456abcdefgABCVDFF
正则表达式说明
函数说明
sub(pattern,repl,string)把字符串中的所有匹配表达式pattern中的地⽅替换成repl
[^**]表⽰不匹配此字符集中的任何⼀个字符
\u4e00-\u9fa5汉字的unicode范围
\u0030-\u0039数字的unicode范围
\u0041-\u005a⼤写字母unicode范围
\u0061-\u007a⼩写字母unicode范围
\uAC00-\uD7AF韩⽂的unicode范围
\u3040-\u31FF⽇⽂的unicode范围
更多关于python正则过滤字母、数字及特殊字符⽅法请查看下⾯相关链接

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。