编码标准:ASCII、GBK、Unicode(UTF8、UTF16、UTF32)
英⽂编码(单字节字符集,码值范围0~127):字节最⾼位是0
ASCII编码,⽤于英⽂字符。
中⽂编码(双字节字符集):⾸字节(8位)的最⾼位是1。可依据⾸字节最⾼位来判断中英⽂。
GB2312,旧版,6763个汉字。
GBK,中⽂字符升级版,21000多个汉字。
国际编码:Unicode编码,各国语⾔字符a的ascii的编码是多少
不同编码⽅式,值不同,如“中”的GBK编码:0xD6D0,Unicode编码:0x4E2D
Unicode编码的3种实现⽅式:UTF8、UTF16、UTF32。
UTF8变长编码,智能分配1-4个字节。UTF16定长编码,2个字节。UTF32定长编码,4个字节。
UTF16编码,中英⽂字符都占2个字节。其定义的类型称为宽字符类型wchar_t,使⽤⽅式如下
wchar_t d[] = L"中国"; //宽字符类型
wcout.imbue(locale("chs"));//Windows系统,语⾔设置为简体中⽂。Unicode转GBK
wcout << d; //宽字符输出,中国
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论