python编码处理:unicode字节串转成中⽂各种字符串举例说明编码问题⼀直是很头痛的问题:
当字符串是:'\u4e2d\u56fd'
>>>s=['\u4e2d\u56fd','\u6e05\u534e\u5927\u5b66']
>>>str=s[0].decode('unicode_escape')  #.encode("EUC_KR")
>>>print str
中国
当字符串是:' 东亚学团一中'
>>>print unichr(19996)
中文字符unicode查询
ord()⽀持unicode,可以显⽰特定字符的unicode号码,如:
>>>print ord('A')
65
只要和Unicode连接,就会产⽣Unicode字串。如:
>>> 'help'
'help'
>>> 'help,' + u'python'
u'help,python'
对于ASCII(7位)兼容的字串,可和内置的str()函数把Unicode字串转换成ASCII字串。如:
>>> str(u'hello world')
'hello world'
对⼏个概念的理解:
ASCII码:    ⽤数据字对应相应的字符
⽽中⽂就是区位码对应汉字如:“好” 的ASCII码为: 22909
unicode 编码每个国家分⼀块。它有UTF-8、UTF-16、UTF-32等形式
中⽂范围 4E00-9FBF:这个范围内有 gbk,gb2312,
utf-8是基于unicode的国际化的场合适合使⽤
gb2312和gb2312都是国标码出现的较早主要⽤于编解码常⽤汉字

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。