基本数据类型所占字节数
Java基本数据类型
数据类型位数字节数
byte8位1字节
char16位2字节
short16位2字节
int32位4字节
unicode文件格式float32位4字节
double64位8字节
long64位8字节
MySQL中varchar的中⽂与英⽂的字节不同编码类型⽐较
⼀、UTF-8
UTF-8 Unicode Transformation Format-8bit。是⽤以解决国际上字符的⼀种多字节编码。
它对英⽂使⽤ 8 位(即⼀个字节) ,中⽂使⽤ 24 位(三个字节)来编码。
UTF-8包含全世界所有国家需要⽤到的字符,是国际编码,通⽤性强。
UTF-8编码的⽂字可以在各国⽀持 UTF8 字符集额的浏览器上显⽰。 如果是UTF8编码,则在外国⼈的英⽂ IE 也能显⽰中⽂,他们⽆需下载 IE 的中⽂语⾔⽀持包。
⼆、GBK
GBK 是国家标准 GB2312 基础上扩容后兼容 GB2312 的标准。
GBK的⽂字编码是⽤双字节来表⽰的,即不论中、英⽂字符均使⽤双字节来表⽰,为了区分中⽂,将其最⾼位都设定成 1。
GBK包含全部中⽂字符,是国家编码,通⽤性⽐ UTF8 差,不过 UTF8 占⽤的数据库⽐GBK⼤。
三、utf8mb4
从 MySQL 5.5 开始,可⽀持 4 个字节 UTF 编码 utf8mb4,⼀个字符最多能有 4 字节,所以能⽀持更多的字符集。
tf8mb4 兼容 utf8,且⽐ utf8 能表⽰更多的字符。
注:在做移动应⽤时,会遇到IOS⽤户在⽂本的区域输⼊emoji表情,如果不做⼀定处理,就会导致插⼊数据库异常。
引⽤⽂章

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。