⾮数值数据的编码⽅式
⾮数值数据的编码⽅式
逻辑数据,字符数据,汉字数据,图像数据,声⾳数据,等等,不是表⽰数字的数据都是⾮数值数据。
编码的区别
ASCII编码:ASCII 码使⽤指定的7 位或8 位⼆进制数组合来表⽰128 或256 种可能的字符。标准ASCII 码也叫基础ASCII码,
使⽤7 位⼆进制数(剩下的1位⼆进制为0)来表⽰所有的⼤写和⼩写字母,数字0 到9、标点符号,以及在美式英语中使⽤的特殊控制字符。
GBK编码:由于ASCII编码不⽀持中⽂,因此,当中国⼈⽤到计算机时,就需要寻求⼀种编码⽅式来⽀持中⽂。
于是,国⼈就定义了⼀套编码规则:当字符⼩于127位时,与ASCII的字符相同,
但当两个⼤于127的字符连接在⼀起时,就代表⼀个汉字,第⼀个字节称为⾼字节(从0xA1-0xF7),第
⼆个字节为低字节(从0xA1-0xFE),这样⼤约可以组合7000多个简体汉字。这个规则叫做GB2312。Unicode编码:因为世界国家很多,每个国家都定义⼀套⾃⼰的编码标准,结果相互之间谁也不懂谁的编码,就⽆法进⾏很好的沟通交流,
所以及时的出现了⼀个组织ISO(国际标准化组织)决定定义⼀套编码⽅案来解决所有国家的编码问题,
这个新的编码⽅案就叫做Unicode。
注意Unicode不是⼀个新的编码规则,⼆是⼀套字符集(为每⼀个「字符」分配⼀个唯⼀的 ID(学名为码位 / 码点 / Code Point)),可以将Unicode理解为⼀本世界编码的字典。
ISO规定:每个字符必须使⽤俩个字节,即⽤16位⼆进制来表⽰所有的字符,对于ASCII编码表⾥的字符,保持其编码不变,只是将长度扩展到了16位,其他国家的字符全部统⼀重新编码。
由于传输ASCII表⾥的字符时,实际上可以只⽤⼀个字节就可以表⽰,所以,这种编码⽅案在传输数据⽐较浪费带宽,存储数据⽐较浪费硬盘。
UTF-8编码:由于Unicode⽐较浪费⽹络带宽和硬盘,因此为了解决这个问题,就在Unicode的基础上,定义了⼀套编码规则(将「码位」转换为字节序列的规则(编码/解码可以理解为加密/解密的过这
unicode码和ascii码区别个新的编码规则就是UTF-8,采⽤1-4个字符进⾏传输和存储数据。
校验码的⽅式
1.奇偶校验码
2.海明校验码
3.循环冗余校验码

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。