原来可以那么简单,字符编码的可逆问题
⽂章⽬录
乱码的情况
可逆的情况
1. 出现⽅框,某种字体没有这个字,就会出现⽅框,只需要到有这个字的字体就⾏。⽐如“乱”字,这种字体没有这个字:
只需要转换其它字体就⾏了
2. 解码的⽅式和编码的⽅式不⼀样,通常字符出现“�”字符。⽐如:utf-8编码⽅式的“乱”字,以UTF-8的解码⽅式能够正常显⽰
但在GBK情况下显⽰出现乱码,本⾝的字符⼆进制编码没有变,只是这个⼆进制编号,在GBK编码表⾥⾯代表其它字符的编号
a的ascii的编码是多少不可逆情况
这种问题通常发⽣在保存⽂件的时候,通常这种情况下的字符显⽰为“?”字符。⽐如:GBK编码⾥⾯没有“♠”这种字符,如果强制以这种编码⽅式保存会⾃动转换成“?”字符
强制保存后再打开,再GBK下出现⼀个问号,UTF-8情况下同样如此
此时原来的字符编码的⼆进制数值,早已经再保存时发⽣了改变,⽆论如何转换字符的编码,都不能到原来的“♠”字符
总结⼀下
字符的编码可逆不可逆主要看保存的时候,这个字符在这个编码类型下是否有相应的编号。我们都知
道ASCII编码,每⼀个英⽂字母都有相应的编号,⽐如“a”的编号在ASCII⾥⾯是97,所以保存“a”的时候可以以这个编码保存,保存时不会发⽣改变。⽽“♠”字符在GBK编码⾥⾯没有对应的编号,如果强制保存,系统会⾃动保存成“?”的字符编号,导致原有的编号发⽣改变,即使你使⽤其它编码⽅式打开,也没有办法还原成原有的编号,导致字符的丢失。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论