标准utf8长度
UTF-8是一种对Unicode字符进行编码的方法,它采用1到4个字节来表示一个Unicode字符。对于不同的字符,UTF-8编码的字节长度是不同的。以下是一些常见字符集在UTF-8编码下的字节长度。
1.ASCII码(0x00-0x7F):1个字节。
2.欧洲字符集(0x80-0xFF):2个字节。
3.中文字符集(0x4E00-0x9FA5):3个字节。
4.其他Unicode字符(0x10000-0x10FFFF):4个字节。
需要注意的是,这里所说的长度是指字节长度,而不是字符长度。对于英文字符,UTF-8编码下的字节长度都是1个字节;而对于中文字符,UTF-8编码下的字节长度是3个字节。unicode所有字符
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论