Unicode汉字编码
1 unicode编码表 
  Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符,  比如汉字"的编码是0x7ECF,注意字符编码一般用十六进制来  表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制就是32463,UCS—2用两个字节来编码字符,两个字节就是16位二进制,  216次方等于65536,所以UCS-2最多能编码65536个字符。 
编码从0127的字符与ASCII编码的字符一样比如字母"a"Unicode  编码是0x0061,十进制是97,”a”ASCII编码是0x61,十进制也是97,  对于汉字的编码事实上Unicode对汉字支持不怎么好这也是没办法的简体和繁体总共有六七万个汉字UCS—2最多能表示65536才六万多个所以Unicode只能排除一些几乎不用的汉字好在常用的简体汉字也不过七千多个,为了能表示所有汉字,Unicode也有UCS—4规范,就是用4个字节来编码字符不过现在普遍采用的还是UCS—2,只用两个字节来编码,看一下Unicode对汉字的编码
—-------—----—--—---—--————----——————-—-—-—--——-————--—---—---——--——-—-
 
2 汉字编码表 
 U+  0  1  2  3  4  5  6  7  8  9  A  B  C  D  E  F 
—---—-—--—————--—-——-———————--------—---—————————---—
4e00
4e10
4e20
4e30 丿
4e40
4e50
4e60
4e70 乿
4e80
4e90
4ea0
4eb0 亿
4ec0
4ed0
4ee0
4ef0 仿
4f00
4f10
4f20
   
 
—-—-—-——---————-----—---—-—-—-————-——-——--------—-—-——
 
3 汉字编码
 U+  0  1  2  3  4  5  6  7  8  9  A  B  C  D  E  F 
----———-—-———-—--------——---—-—-—--—-———---———---—--- 
4f30 伿
4f40
4f50
4f60
4f70 使
4f80
4f90
4fa0
4fb0 便
4fc0
4fd0
4fe0
4ff0 俿
5000 倀
5010
5020
5030
5040
5050
5060
5070
   
 
-———-—---—--—-——--——————--—----———--——————--——-——------
 
4 汉字编码
 U+  0  1  2  3  4  5  6  7  8  9  A  B  C  D  E  F 
-—--—---—-—--—--—--——-—--——----————-———-—---——------— 
5080
5090
50a0
50b0
50c0
50d0
50e0
50f0 unicode汉字僲
5100
5110
5120
5130
5140
5150
5160
5170
5180
5190
51a0
51b0
51c0
   
 
-———---———--—--—-——-—--—-——————-——---—————---—---——-—--
5 汉字编码
 U+  0  1  2  3  4  5  6  7  8  9  A  B  C  D  E  F 
——-—----———--—------——-—--——-—-------------———--—-—-- 
51D0  
51E0  
51F0
5200
5210
5220
5230
5240
5250
5260
5270
5280  
5290
52A0  
52B0

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。