html设置页⾯编码gbk,GBK及UTF-8⽹页编码定义与应⽤⽹页编码英⽂译为web page encoding,是在⽹页中指定其特定的字符编码格式的库。
GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的⽂字编码是⽤双字节来表⽰的,即不论中、英⽂字符均使⽤双字节来表⽰,为了区分中⽂,将其最⾼位都设定成1。GBK包含全部中⽂字符,是国家编码,通⽤性⽐UTF8差,不过UTF8占⽤的数据库⽐GBK ⼤。
UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM。是⽤以解决国际上字符的⼀种多字节编码,它对英⽂使⽤8位(即⼀个字节),中⽂使⽤24为(三个字节)来编码。UTF-8包含全世界所有国家需要⽤到的字符,是国际编码,通⽤性强。UTF-8编码的⽂字可以在各国⽀持UTF8字符集的浏览器上显⽰。如果是UTF8编码,则在外国⼈的英⽂IE上也能显⽰中⽂,他们⽆需下载IE的中⽂语⾔⽀持包。
UTF-8版本虽然具有良好的国际兼容性,但中⽂需要⽐GBK/BIG5版本多占⽤50%的数据库存储空间,因此并⾮推荐使⽤,仅供对国际兼容性有特殊要求的⽤户使⽤。简单地说:对于中⽂较多的⽹站,适宜⽤GBK编码节省数据库空间。对于英⽂较多的⽹站,适宜⽤UTF-8节省数据库空间。
GBK、GB2312等与UTF8如何转换?GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:GBK、GB2312——Unicode——UTF8;UTF8——Unicode——GBK、GB2312。使⽤Windows记
事本的“另存为”,可以在GBK、Unicode、Unicode big endian和UTF-8这⼏种编码⽅式间相互转换。
如何让浏览器正确识别⽹页编码?⼀般在⽹页中都要有如下⼀句:,指⽰此⽹页的字符集编码是GB2312。(或者UTF-8)
页⾯有时候指定了编码为什么有时会出现乱码?这可能是页⾯申明编码与⽂件本⾝编码不⼀致,更多时候是以错误编码打开页⾯然后保存导致的,或者是⽤某些FTP软件直接在线修改⽂件,⽐如CuteFTP,由于软件编码配置错误⽽导致转换错了编码。这时候使⽤window的记事本打开,⽤“另存为”保存为对应的编码即可解决问题。
html网页格式在windows操作系统上使⽤IE作为浏览器时,常常会发⽣这样的问题:在浏览使⽤UTF-8编码的⽹页时,浏览器⽆法⾃动识别该页⾯所⽤的编码,即使⽹页已经声明过编码格式:,由此造成某些含有中⽂UTF-8编码的页⾯产⽣空⽩输出。如果使⽤的是Firefox、Sarafi的浏览器这不会造成这个问题。这是由于IE解析⽹页编码时以HTML内的标签优先,⽽后才是HTTP header内的讯息,⽽mozilla系列的浏览器则刚刚相反。
由于UTF-8为3个字节表⽰⼀个汉⼦,⽽普通的GB2312或BIG5是两个。页⾯输出时,由于上述原因,使浏览器解析、输出
的内容时,如果在前有奇数个全⾓字符,IE把UTF-8当作两个字节解析时出现半个汉字的情况,这时该半个汉字会和的部分,使整个页⾯为空百输出,⽽这个时候如果察看源⽂件的话,会发现实际上整个页⾯全部已经输出了,但浏览器不显⽰内容。最简单的解决办法是把 放在之前。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。