[emoji]emoji编码
⽬标:
1. 了解编码相关概念
2. 为什么emoji显⽰不正常
3. 怎么解析emoji
问题:
1. 什么是 ASCII?
2. 为什么⼀个字节是8位数?
3. 什么是unicode编码?
4. 什么是UTF8编码?
5. 为什么会产⽣乱码?
6. emoji 编码
7. 为什么emoji显⽰不正常?
unicode码和ascii码区别8. 计算emoji的码点
1. 什么是ASCII?
ASCII ((American Standard Code for Information Interchange): 美国信息交换标准代码)是基于拉丁字母的⼀套电脑编码系统,主要⽤于显⽰现代英语和其他西欧语⾔。它是最通⽤的信息交换标准,并等同于国际标准ISO/IEC 646。ASCII第⼀次以规范标准的类型发表是在1967年,最后⼀次更新则是在1986年,到⽬前为⽌共定义了128个字符。
2. 为什么⼀个字节是8位数?
60年代IBM的System/360⽤EBCDIC编码,ASCII编码标准也是在那个时候确⽴,两种标准虽然有差异,但都⽤8个bit来表⽰⼀个字符,
3. 什么是unicode编码?
ASCII 编码的局限, 导致各个国家只能开发⾃⼰的编码规范。
如果要表⽰中⽂,显然⼀个字节是不够的,⾄少需要两个字节,⽽且还不能和ASCII编码冲突,所以,中国制定了GB2312编码,⽤来把中⽂编进去。
为了统⼀所有⽂字的编码,Unicode应运⽽⽣。Unicode把所有语⾔都统⼀到⼀套编码⾥,这样就不会再有乱码问题了。
所有 Unicode  被称为 统⼀码、万国码、单⼀码
unicode 是⼀套编码⽅案。
4. 什么是UTF8编码?
UTF8 是unicode编码⽅案的具体实现
做的事情就是规定码点是怎么存储的。
同样的 还有 UTF16,UTF32
UTF-8是⼀种变长字节编码⽅式。对于某⼀个字符的UTF-8编码,如果只有⼀个字节则其最⾼⼆进制位为0;如果是多字节,其第⼀个字节从最⾼位开始,连续的⼆进制位值为1的个数决定了其编码的位数,其余各字节均以10开头。UTF-8最多可⽤到6个字节。
如表:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。