目前常见的编码方法有什么表达式文字编码法顺序编码法缩写编码法
无论在是在编辑文本文件的时候,还是在制作网页的时候,总会遇到文本编码方式的问题。如果处理不当,就会出现乱码的问题。因此,有必要对文本的编码方式做一个详尽的了解。
常见的一些字符编码方式无非有:Unicode、ASCII、GBK、GB2312、UTF-8。
ASCII:建立英文字符和二进制的关系时制定的编码规范。
它能表示128个字符:其中包括英文字符、阿拉伯数字、西文字符以及32个控制字符。它用一个字节来表示具体的字符,但它只用后7位来表示字符(2^7=128),最前面的一位统一规定为0。
注:python的默认编码格式是 ASCII 。
Unicode:包含世界上所有的字符,是一个字符集。其中有的字符一个字节ascii文字是啥来表示,有的字符两个字节来表示。Unicode的多种存储方式:UTF-8,UTF-16,UTF-32。
UTF-8是使用最广的一种Unicode的实现方式。变长的编码方式:它可以使用1~4个字节表示
一个符号,根据不同的符号而变化字节长度。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论