python括号是中⽂还是英⽂_Python判断unicode是汉字,数
字,英⽂,或者其他。。。
功能:
判断unicode是否是汉字,数字,英⽂,或者是否是(汉字,数字和英⽂字符之外的)其他字符。
全⾓、半⾓符号相互转换。
全⾓、半⾓?
全⾓--指⼀个字符占⽤两个标准字符位置。
汉字字符和规定了全⾓的英⽂字符及国标GB2312-80中的图形符号和特殊字符都是全⾓字符。⼀般的系统命令是不⽤全⾓字符的,只是在作⽂字处理时才会使⽤全⾓字符。
半⾓--指⼀字符占⽤⼀个标准的字符位置。
通常的英⽂字母、数字键、符号键都是半⾓的,半⾓的显⽰内码都是⼀个字节。在系统内部,以上三种字符是作为基本代码处理的,所以⽤户输⼊命令和参数时⼀般都使⽤半⾓。
例如:⼀个英⽂字符“ABC”如果以全⾓输⼊,会被当成汉字处理,如果以半⾓输⼊,会被当成普通英⽂字母处理。
# -*- coding: UTF-8 -*-
"""判断⼀个unicode是否是汉字"""
def is_chinese(uchar):
if uchar >= u'\u4e00' and uchar <= u'\u9fa5':
return True
else:
return False
"""判断⼀个unicode是否是数字"""
def is_number(uchar):
if uchar >= u'\u0030' and uchar <= u'\u0039':
return True
else:
return False
"""判断⼀个unicode是否是英⽂字母"""
def is_alphabet(uchar):
if (uchar >= u'\u0041' and uchar <= u'\u005a') or (uchar >= u'\u0061' and uchar <= u'\u007a'):
return True
else:
return False
"""判断是否是(汉字,数字和英⽂字符之外的)其他字符"""
def is_other(uchar):
if not (is_chinese(uchar) or is_number(uchar) or is_alphabet(uchar)):
return True
else:
return False
"""半⾓转全⾓"""
def B2Q(uchar):
inside_code = ord(uchar)
if inside_code < 0x0020 or inside_code > 0x7e: # 不是半⾓字符就返回原来的字符
return uchar
if inside_code == 0x0020: # 除了空格其他的全⾓半⾓的公式为:半⾓=全⾓-0xfee0
inside_code = 0x3000
else:
inside_code += 0xfee0
return unichr(inside_code)
"""全⾓转半⾓"""
def Q2B(uchar):
inside_code = ord(uchar)
if inside_code == 0x3000:
unicode汉字inside_code = 0x0020
else:
inside_code -= 0xfee0
if inside_code < 0x0020 or inside_code > 0x7e: # 转完之后不是半⾓字符返回原来的字符return uchar
return unichr(inside_code)
"""把字符串全⾓转半⾓"""
def stringQ2B(ustring):
return "".join([Q2B(uchar) for uchar in ustring])
"""将UTF-8编码转换为Unicode编码"""
def convert_toUnicode(string):
ustring = string
if not isinstance(string, unicode):
ustring = string.decode('UTF-8')
return ustring
if __name__ == "__main__":
ustring1 = u'收割季节 麦浪和⽉光 洗着快镰⼑' string1 = 'Sky0天地Earth1*'
ustring1 = convert_toUnicode(ustring1) string1 = convert_toUnicode(string1)
for item in string1:
# print is_chinese(item)
# print is_number(item)
# print is_alphabet(item)
print is_other(item)

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。