html设置页面编码gbk,GBK及UTF-8网页编码定义与应用--688IT编程网

html设置页⾯编码gbk,GBK及UTF-8⽹页编码定义与应⽤⽹页编码英⽂译为web page encoding，是在⽹页中指定其特定的字符编码格式的库。

GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的⽂字编码是⽤双字节来表⽰的，即不论中、英⽂字符均使⽤双字节来表⽰，为了区分中⽂，将其最⾼位都设定成1。GBK包含全部中⽂字符，是国家编码，通⽤性⽐UTF8差，不过UTF8占⽤的数据库⽐GBK ⼤。

UTF-8：Unicode TransformationFormat-8bit，允许含BOM，但通常不含BOM。是⽤以解决国际上字符的⼀种多字节编码，它对英⽂使⽤8位(即⼀个字节)，中⽂使⽤24为(三个字节)来编码。UTF-8包含全世界所有国家需要⽤到的字符，是国际编码，通⽤性强。UTF-8编码的⽂字可以在各国⽀持UTF8字符集的浏览器上显⽰。如果是UTF8编码，则在外国⼈的英⽂IE上也能显⽰中⽂，他们⽆需下载IE的中⽂语⾔⽀持包。

UTF-8版本虽然具有良好的国际兼容性，但中⽂需要⽐GBK/BIG5版本多占⽤50%的数据库存储空间，因此并⾮推荐使⽤，仅供对国际兼容性有特殊要求的⽤户使⽤。简单地说：对于中⽂较多的⽹站，适宜⽤GBK编码节省数据库空间。对于英⽂较多的⽹站，适宜⽤UTF-8节省数据库空间。

GBK、GB2312等与UTF8如何转换？GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换：GBK、GB2312——Unicode——UTF8；UTF8——Unicode——GBK、GB2312。使⽤Windows记

事本的“另存为”，可以在GBK、Unicode、Unicode big endian和UTF-8这⼏种编码⽅式间相互转换。

如何让浏览器正确识别⽹页编码？⼀般在⽹页中都要有如下⼀句：，指⽰此⽹页的字符集编码是GB2312。(或者UTF-8)

页⾯有时候指定了编码为什么有时会出现乱码？这可能是页⾯申明编码与⽂件本⾝编码不⼀致，更多时候是以错误编码打开页⾯然后保存导致的，或者是⽤某些FTP软件直接在线修改⽂件，⽐如CuteFTP，由于软件编码配置错误⽽导致转换错了编码。这时候使⽤window的记事本打开，⽤“另存为”保存为对应的编码即可解决问题。

html网页格式在windows操作系统上使⽤IE作为浏览器时，常常会发⽣这样的问题：在浏览使⽤UTF-8编码的⽹页时，浏览器⽆法⾃动识别该页⾯所⽤的编码，即使⽹页已经声明过编码格式：，由此造成某些含有中⽂UTF-8编码的页⾯产⽣空⽩输出。如果使⽤的是Firefox、Sarafi的浏览器这不会造成这个问题。这是由于IE解析⽹页编码时以HTML内的标签优先，⽽后才是HTTP header内的讯息，⽽mozilla系列的浏览器则刚刚相反。

由于UTF-8为3个字节表⽰⼀个汉⼦，⽽普通的GB2312或BIG5是两个。页⾯输出时，由于上述原因，使浏览器解析、输出

的内容时，如果在前有奇数个全⾓字符，IE把UTF-8当作两个字节解析时出现半个汉字的情况，这时该半个汉字会和的部分，使整个页⾯为空百输出，⽽这个时候如果察看源⽂件的话，会发现实际上整个页⾯全部已经输出了，但浏览器不显⽰内容。最简单的解决办法是把放在之前。

688IT编程网

html设置页面编码gbk,GBK及UTF-8网页编码定义与应用

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

html设置页面编码gbk,GBK及UTF-8网页编码定义与应用

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式