汉字的国标码机内码区位码区别--688IT编程网

汉字的国标码机内码区位码区别

文字编码系列--汉字的国标码，机内码，区位码(gbcode查出的是区位码）

1.国标码：“国家标准信息交换用汉字编码”（GB2312-80标准），简称国标码。

国标码是二字节码, 用两个七位二进制数编码表示一个汉字。

2.区位码：为了使每一个汉字有一个全国统一的代码，区位码是国家规定的94*94的一个方阵，其中每行叫做一个区，每列叫做一个位，组合起来就组成了区位码，我们可以在相关网站查询某个汉字的区位码，例如汉字“我”的区位码是46 50 ，标识“我”在46区，50位。

ascii是几位二进制编码3.机内码：机内码是在计算机中存储的汉子编码。

三者之间的关系。

国标码=16进制的区位码+2020H

机内码=国标码+8080H

例如“我”的的区位码是46 50 这是10进制的转化为16进制：2E32H（46==2E,50==32）

所以“我”的国标码：2E32H+2020H=4E52H

所以“我”机内码：4E52H+8080H=CED2（其实就是把二进制国标码的最高位置1，注意看E和2都没有变化）

机内码转化为2进制就可以再计算机中存储，这里面转化为10进制可以输出。

CED2的10进制为：52946，这里我们打开记事本，按住alt建，输入52946即可以看见“我”，因为52946是“我”的机内码的10进制。

这里面有两个问题：

1.为什么不用区位码直接表示国标码，为要加上2020H？

2.机内码为什么要在国标码的基础上加上8080H，而不是直接只用国标码作为机内码？

这里我先解决第二个问题，

国标码就是由2个ASCII码组成，为什么呢（这里简单介绍一下，后面会详细说明）？因为在英文中只有26个字母，所以用一个字节就可以表示了，用一个字节的话可以表示2^8个符号，就是256个符号，绰绰有余啊，于是外国人制订了规范，规定0-127（00000000-01111111）个字符他们用了，用来表示英文字符和一些符号，就是ASCII码，但是汉字有很多，256个根本就不够，于是国家就用两个ASCII来表示一个汉字，就是2个字节标识一个汉字，例如“保”的区位码为：1703，所以国标码为：1703的10进制+2020H=3123H，

然而：31H 和23H在ASCII中式有值的，31H在ASCII中表示数字1，23H表示的是“#”（这个可以在网上查询），那么如果我以国标码作为机内码的话，如果内存中有两个字节为31H和23H，那么到底是表示汉字“保”呢？还是字符1#呢？这样就有了歧义，但是解决办法就有了，0-127不是被英文字符占了吗？那么我就用127之后的来表示不就可以了吗？于是我把汉字的两个字节每个字节机上128（16进制就是80H），于是问题解决了，汉字“保”的机内码变为：3123H+8080H=B2A3H(10进制就是45475)，打开记事本按住alt+45475看看是不是“保”，这样就不会和英文的ASCII冲突了。

688IT编程网

汉字的国标码机内码区位码区别

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

688IT编程网

汉字的国标码机内码区位码区别

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式 最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

nginx map用法正则

shell 正则表达式最后一行