Unicode汉字和英文编码范围
2008年10月26日 星期日 20:38
中文的unicode码的范围4e00-9fa5 如果是英文asc,高自己是0x00 1)标准CJK文字 /Public/UNIDATA/Unihan.html Code point range Block name Release U+3400..U+4DB5 CJK Unified Ideographs Extension A 3.0 U+4E00..U+9FA5 CJK Unified Ideographs 1.1 U+9FA6..U+9FBB CJK Unified Ideographs 4.1 U+F900..U+FA2D CJK Compatibility Ideographs 1.1 U+FA30..U+FA6A CJK Compatibility Ideographs 3.2 U+FA70..U+FAD9 CJK Compatibility Ideographs 4.1 U+20000..U+2A6D6 CJK Unified Ideographs Extension B 3.1 U+2F800..U+2FA1D CJK Compatibility Supplement 3.1 2)全角ASCII、全角中英文标点、半宽片假名、半宽平假名、半宽韩文字母:FF00-FFEF /charts/PDF/UFF00.pdf 3)CJK部首补充:2E80-2EFF /charts/PDF/U2E80.pdf 4)CJK笔划:31C0-31EF /charts/PDF/U31C0.pdf 5)康熙部首:2F00-2FDF /charts/PDF/U2F00.pdf 6)汉字结构描述字符:2FF0-2FFF /charts/PDF/U2FF0.pdf 7)注音符号:3100-312F /charts/PDF/U3100.pdf 8)注音符号(闽南语、客家语扩展):31A0-31BF /charts/PDF/U31A0.pdf 9)日文平假名:3040-309F /charts/PDF/U3040.pdf 10)日文片假名:30A0-30FF /charts/PDF/U30A0.pdf 11)日文片假名拼音扩展:31F0-31FF /charts/PDF/U31F0.pdf 12)韩文拼音:AC00-D7AF /charts/PDF/UAC00.pdf 13)韩文字母:1100-11FF /charts/PDF/U1100.pdf 14)韩文兼容字母:3130-318F /charts/PDF/U3130.pdf 15)太玄经符号:1D300-1D35F /charts/PDF/U1D300.pdf 16)易经六十四卦象:4DC0-4DFF /charts/PDF/U4DC0.pdf 17)彝文音节:A000-A48F /charts/PDF/UA000.pdf 18)彝文部首:A490-A4CF /charts/PDF/UA490.pdf 19)盲文符号:2800-28FF /charts/PDF/U2800.pdf 20)CJK字母及月份:3200-32FF /charts/PDF/U3200.pdf 21)CJK特殊符号(日期合并):3300-33FF /charts/PDF/U3300.pdf 22)装饰符号(非CJK专用):2700-27BF /charts/PDF/U2700.pdf 23)杂项符号(非CJK专用):2600-26FF /charts/PDF/U2600.pdf |
Unicode字符编码分布表――语言文字类
欧洲字母 | 非洲文字 | 印度文字 | 东亚文字 | 中亚文字 |
(查阅组合·标记字符) | 埃塞俄比亚文字 | 孟加拉字符(U+0980 – U+09FF) | 汉字 | Kharoshihi(U+10A00 – U+10A5F) |
亚美尼亚文字 | 埃塞俄比亚字符(U+1200 – U+137F) | 梵文字符(U+0900 – U+097F) | 中日韩统一汉字(U+4E00 – U+9FBF,5MB) | 蒙古字符(U+1800 – U+18AF) |
亚美尼亚字符(U+0530 – U+058F) | 增补埃塞俄比亚字符(U+1380 – U+139F) | 古吉拉特字符(U+0A80 – U+0AFF) | 中日韩统一汉字扩展集A(U+3400 – U+4DBF,2MB) | 八思巴字符(U+A840 – U+A87F) |
亚美尼亚文字相关(字母表达形式字符:U+FB00 – U+FB4F) | 埃塞俄比亚字符扩展集(U+2D80 – U+2DDF) | 果鲁穆奇字符(U+0A00 – U+0A7F) | 中日韩统一汉字扩展集B(U+20000 – U+2A6DF,13MB) | 藏语字符(U+0F00 – U+0FFF) |
科普特文字 | 其他非洲文字 | 埃纳德字符(U+0C80 – U+0CFF) | 中日韩相容汉字(U+F900 – U+FAFF,0.5MB) | |
科普特字符(U+2C80 – U+2CFF) | N’Ko(U+07C0 – U+07FF) | 林布字符(U+1900 – U+194F) | 增补中日韩相容汉字(U+2F800 – U+2FA1F,0.5MB) | |
希腊文字中的科普特字符(U+0370 – U+03FF) | 提非纳字符(U+2D30 – U+2D7F) | 马拉亚拉姆字符(U+0D00 – U+0D7F) | 汉字注释标记(U+3190 – U+319F) | |
西里尔文字 | 中东文字 | 奥里亚字符(U+0B00 – U+0B7F) | (查阅中日韩统一汉字数据库) | 古文字 |
西里尔字符(U+0400 – U+04FF) | 阿拉伯文 | 僧伽罗字符(U+0D80 - U+0DFF) | 部首和笔画 | 古希腊 |
增补西里尔字符(U+0500 – U+052F) | 阿拉伯字符(U+0600 – U+06FF) | Syloti Nagri字符(U+A800 – U+A82F) | 增补中日韩汉字部首(U+2E80 – U+2EFF) | 古希腊数字(U+10140 – U+1018F) |
乔治亚风格文字 | 增补阿拉伯字符(U+0750 – U+077F) | 泰米尔字符(U+0B80 – U+0BFF) | 康熙部首(U+2F00 – U+2FDF) | 古希腊音乐符号(U+1D200 – U+1D24F) |
乔治亚风格字母(U+10A0 – U+10FF) | 阿拉伯表达形式字符集A(U+FB50 – U+FDFF) | 泰卢固字符(U+0C00 – U+0C7F) | 中日韩汉字笔画(U+31C0 – U+31EF) | 楔形文字 |
增补乔治亚风格字母(U+2D00 – U+2D2F) | 阿拉伯表达形式字符集B(U+FE70 – U+FEFF) | 表意文字描述符(U+2FF0 – U+2FFF) | 楔形文字(U+12000 – U+123FF) | |
希腊文字 | 希伯来文 | 菲律宾文字 | 中文专用符号 | 楔形文字数字和标点符号(U+12400 – U+1247F) |
希腊字符(U+037 – U+03FF) | 希伯来字符(U+0590 – U+059F) | Buhid字符(U+1740 – U+175F) | 汉语拼音字母(U+3100 – U+312F) | 古波斯字符(U+103A0 – U+103DF) |
希腊字符扩展集(U+1F00 – U+1FFF) | 希伯来字母表达形式字符(U+FB00 – U+FB4F) | 哈鲁喏字符(U+1720 – U+173F) | 汉语拼音字母扩展集(U+31A0 – U+31BF) | 乌加里特字符(U+10380 – U+1039F) |
unicode汉字 (查阅古希腊分区) | 叙利亚文 | 塔加路字符(U+1700 – U+171F) | 日文专用符号 | 线状B |
拉丁文 | 叙利亚字符(U+0700 – U+074F) | 泰格班瓦字符(U+1760 – U+177F) | 平假名(U+3040 – U+309F) | 线状B表音字符(U+10000 – U+1007F) |
基本拉丁字符(U+0000 – U+007F) | 塔纳文 | 片假名(U+30A0 – U+30FF) | 线状B表意字符(U+10080 – U+100FF) | |
增补拉丁字符集1(U+0080 – U+00FF) | 塔纳字符(U+0780 – U+07BF) | 东南亚文字 | 片假名音标扩展集(U+31F0 – U+31FF) | 其他古文字 |
拉丁字符扩展集A(U+0100 – U+017F) | 美洲文字 | 布吉字符(U+1A00 – U+1A1F) | 半角片假名(U+FF00 – U+FFEF) | 爱琴海数字(U+10100 – U+1013F) |
拉丁字符扩展集B(U+0180 – U+024F) | 加拿大语字符(U+1400 – U+167F) | 巴厘字符(U+1B00 – U+1B7F) | 朝鲜文字专用符号 | 筹算数字(U+1D360 – U+1D37F) |
拉丁字符扩展集C(U+2C60 – U+2C7F) | 切罗基字符(U+13A0 – U+13FF) | 高棉字符(U+1780 – U+17FF) | 谚文音节字符(U+AC00 – U+D7AF,4MB) | 塞浦路斯表音字符(U+10800 – U+1083F) |
拉丁字符扩展集D(U+A720 – U+A7FF) | 犹他字符(U+10400 – U+1044F) | 高棉符号(U+19E0 – U+19FF) | 谚文字母(U+1100 – U+11FF) | 哥特字符(U+10330 – U+1034F) |
附加拉丁字符扩展集(U+1E00 – U+1EFF) | 其他文字 | 老挝语字符(U+0E80 – U+0EFF) | 谚文相容字母(U+3130 – U+318F) | 古意大利语字符(U+10300 – U+1032F) |
拉丁文相关(字母表达形式字符:U+FB00 – U+FB4F) | 萧伯纳风格字符(U+10450 – U+1047F) | 缅甸语字符(U+1000 – U+109F) | 半角谚文字母(U+FF00 – U+FFEF) | 欧甘字符(U+1680 – U+169F) |
全角拉丁字母(U+FF00 – U+FFEF) | 奥斯曼字符(U+10480 – U+104AF) | 新Tai Lue字符(U+1980 – U+19DF) | Yi | Runic字符(U+16A0 – U+16FF) |
小形式(U+FE50 – U+FE6F) | 格拉哥里字符(U+2C00 – U+2C5F) | Tai Le字符(U+1950 – U+197F) | Yi音节符号(U+A000 – U+A48F,0.6MB) | 腓尼基字符(U+10900 – U+1091F) |
(参考音标符号) | 泰语字符(U+0E00 – U+0E7F) | Yi字元符号(U+A490 – U+A4CF) | ||
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论