JSP乱码解决大全
其中有字符编码转换的地方有:
  1jsp 编译。java 应用服务器将根据 JVM ding 值读取 JSP 源文件,并转换为内部字符编码进行 JSP 编译,生成 JAVA 源文件,根据 ding 值写回文件系统。如果当前系统语言支持 GBK,那么这时候不会出现 encoding 问题。如果是英文的系统,如 LANG en_US linux, AIX Solaris,则要将 JVM ding 值置成 GBK 。系统语言如果是 GB2312,则根据需要,确定要不要设置 ding,将 ding 设为 GBK 可以解决潜在的 GBK 字符乱码问题
  2Java 需要被编译为 .class 才能在 JVM 中执行,这个过程存在与a.同样的 ding
题。从这里开始 servlet jsp 的运行就类似了,只不过 Servlet 的编译不是自动进行的。
  3Servlet 需要将 HTML 页面内容转换为 browser 可接受的 encoding 内容发送出去。依赖于各 JAVA App Server 的实现方式,有的将查询 Browser accept-charset accept-langu
age 参数或以其它猜的方式确定 encoding 值,有的则不管。因此 constant-encoding 也许是最好的解决方法。对于中文网页,可在 JSP Servlet 中设置 contentType="text/html; charset=GB2312";如果页面中有GBK字符,则设置为contentType="text/html; charset=GBK",由于IE NetscapeGBK的支持程度不一样,作这种设置时需要测试一下。
  因为16 JAVA char在网络传送时高8位会被丢弃,也为了确保Servlet页面中的汉字(包括内嵌的和servlet运行过程中得到的)是期望的内码,可以用 PRintWriter Writer() 取代 ServletOutputStream OutputStream(), PrinterWriter 将根据contentType中指定的charset作转换(ContentType需在此之前指定!);也可以用OutputStreamWriter封装 ServletOutputStream 类并用write(String)输出汉字字符串。 对于 JSPJAVA application Server 应当能够确保在这个阶段将嵌入的汉字正确传送出去。
4、这是 URL 字符 encoding 问题。如果通过 get/post 方式从 browser 返回的值中包含汉字信息, servlet 将无法得到正确的值。SUN J2SDK 中,HttpUtils.parseName url编码处理在解析参数时根本没有考虑 browser 的语言设置,而是将得到的值按 byte 方式解析。这是网上讨
论得最多的 encoding 问题。因为这是设计缺陷,只能以 bin 方式重新解析得到的字符串;或者以 hack HttpUtils 类的方式解决。参考文章 23 均有介绍,不过最好将其中的中文 encoding GB2312 CP1381 都改为 GBK,否则遇到 GBK 汉字时,还是会有问题。
  Servlet API 2.3 提供一个新的函数 HttpServeletRequest.setCharacterEncoding 用于在调用 Parameter(param_name) 前指定应用程序希望的 encoding,这将有助于彻底解决这个问题。
关于jsp乱码问题的解决。
1、最基本的乱码问题。
这个乱码问题是最简单的乱码问题。一般新会出现。就是页面编码不一致导致的乱码。
<%@ page language="java" pageEncoding="UTF-8"%>
<%@ page contentType="text/html;charset=iso8859-1"%>
<html>
<head>
<title>中文问题</title>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
</head>
</head>
<body>
  我是个好人
</body>
三个地方的编码。
    第一个地方的编码格式为jsp文件的存储格式。Eclipse会根据这个编码格式保存文件。并编译jsp文件,包括里面的汉字。
    第二处编码为解码格式。因为存为UTF-8的文件被解码为iso8859-1,这样 如有中文肯定出乱码。也就是必须一致。而第二处所在的这一行,可以没有。缺省也是使用iso8859-1的编码格式。所以如果没有这一行的话,“我是个好人”也会出现乱码。必须一致才可以。
第三处编码为控制浏览器的解码方式。如果前面的解码都一致并且无误的话,这个编码格式没有关系。有的网页出现乱码,就是因为浏览器不能确定使用哪种编码格式。因为页面有时候会嵌入页面,导致浏览器混淆了编码格式。出现了乱码。
2 、表单使用Post方式提交后接收到的乱码问题
这个问题也是一个常见的问题。这个乱码也是tomcat的内部编码格式iso8859-1在捣乱,也就是说post提交时,如果没有设置提交的编码格式,则会以iso8859-1方式进行提交,接受的jsp却以utf-8的方式接受。导致乱码。既然这样的原因,下面有几种解决方式,并比较。
A 、接受参数时进行编码转换
String str=new Parameter("something").getBytes("ISO-8859-1"), 
"utf-8") 这样的话,每一个参数都必须这样进行转码。很麻烦。但确实可以拿到汉字。
B、在请求页面上开始处,执行请求的编码代码, request.setCharacterEncoding("UTF-8"),把提交内容的字符集设为UTF8。这样的话,接受此参数的页面就不必在转码了。直接使用String str = Parameter("something");即可得到汉字参数。但每页都需要执行这句话。
这个方法也就对post提交的有效果,对于get提交和上传文件时的enctype="multipart/form-data"是无效的。稍后下面单独对这个两个的乱码情况再进行说明。
C、为了避免每页都要写request.setCharacterEncoding("UTF-8"),建议使用过滤器对所有jsp进行编码处理。这个网上有很多例子。请大家自己查阅。
3 、表单get提交方式的乱码处理方式。
如果使用get方式提交中文,接受参数的页面也会出现乱码,这个乱码的原因也是tomcat的内部编码格式iso8859-1导致。Tomcat会以get的缺省编码方式iso8859-1对汉字进行编码,编码后追加到url,导致接受页面得到的参数为乱码/、。
解决办法:
A 使用上例中的第一种方式,对接受到的字符进行解码,再转码。
B Get走的是url提交,而在进入url之前已经进行了iso8859-1的编码处理。要想影响这个编码则需要在lConnector节点增加useBodyEncodingForURI="true"
属性配置,即可控制tomcatget方式的汉字编码方式,上面这个属性控制get提交也是用request.setCharacterEncoding("UTF-8")所设置的编码格式进行编码。所以自动编码为utf-8,接受页面正常接受就可以了。但我认为真正的编码过程是,tomcat又要根据

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。