c语言支持中文编码,C语言基础之中文编码格式GB2312(4)--688IT编程网

c语⾔⽀持中⽂编码,C语⾔基础之中⽂编码格式GB2312（4）GB2312历史回顾

GB2312编码范围：A1A1－FEFE，其中汉字编码范围：B0A1-F7FE。

GB2312编码是第⼀个汉字编码国家标准，由中国国家标准总局1980年发布，1981年5⽉1⽇开始使⽤。GB2312编码共收录汉字6763个，其中⼀级汉字3755个，⼆级汉字3008个。同时，GB2312编码收录了包括拉丁字母、希腊字母、⽇⽂平假名及⽚假名字母、俄语西⾥尔字母在内的682个全⾓字符。

分区表⽰

GB2312编码对所收录字符进⾏了“分区”处理，共94个区，每区含有94个位，共8836个码位。这种表⽰⽅式也称为区位码。

01-09区收录除汉字外的682个字符。

10-15区为空⽩区，没有使⽤。

16-55区收录3755个⼀级汉字，按拼⾳排序。

56-87区收录3008个⼆级汉字，按部⾸/笔画排序。

88-94区为空⽩区，没有使⽤。

举例来说，“啊”字是GB2312编码中的第⼀个汉字，它位于16区的01位，所以它的区位码就是1601。

双字节编码

GB2312规定对收录的每个字符采⽤两个字节表⽰，第⼀个字节为“⾼字节”，对应94个区；第⼆个字节为“低字节”，对应94个位。所以它的区位码范围是：0101－9494。区号和位号分别加上0xA0就是GB2312编码。例如最后⼀个码位是9494，区号和位号分别转换成⼗六进制是5E5E，0x5E+0xA0＝0xFE，所以该码位的GB2312编码是FEFE。

GB2312编码范围：A1A1－FEFE，其中汉字的编码范围为B0A1-F7FE，第⼀字节0xB0-0xF7(对应区号：16－87)，第⼆个字节

0xA1-0xFE(对应位号：01－94)。

若要查询具体字符的编码请前往：汉字字符集编码查询。

GB2312编码格式采⽤的是区位码格式：GB2312为双字节编码，其中第⼀个字节为⾼字节，对应1-94个区，第⼆个字节为低字节，对应1-94个位。我们知道⼀个字节对于8位，8位的数可以表⽰的范围0-2

56，但是这⾥采⽤的范围是1-94，1-94是⼀个规定或者说是规范。当区号和位号分别加上0xA0就是GB2312编码，这也是⼀个规定。c语言中文网汇编语言

我们再来捋⼀下区号和位号的组合体：其范围0101 - 9494。

接下来再加上⼀个0xA0⼗六进制数变成GB2312编码：⾼字节的最⼩数1转换成GB2312码：1(10) + 0xA0 = 0x01 + 0xA0 = 0xA1,⾼字节的最⼤数94转GB2312码：94(10) + 0xA0 = 0x5E + 0xA0 = 0xFE

得GB2312编码范围：A1A1 - FEFE

688IT编程网

c语言支持中文编码,C语言基础之中文编码格式GB2312(4)

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

c语言支持中文编码,C语言基础之中文编码格式GB2312(4)

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式