Java web常见乱码
1.乱码显示的位置
代码编辑器(IDE),浏览器,数据库。
2.乱码表现形式
?,各种看不懂的字符。
3.乱码根本原因
字符格式不匹配。
当我们的系统按照一种编码方式去读取一个文件的时候,会自动的将里面的编码转换成相应的字符显示在屏幕上。参考
http://geeklu.com/2009/12/dive-into-the-charset-of-java/
4.分析方法
创建数据-----传送数据-----接收数据-----存储数据
分析出错的环节。
5.乱码可能出现的地方以及解决方法
1.UTF-8国际编码,GBK中文编码。GBK包含GB2312,即如果通过GB2312编码后可以通过GBK解码,反之可能不成立;
2.tomcat:默认是ISO8859-1,不支持中文的
3.java.nio.charset.Charset.defaultCharset() 获得平台默认字符编码;
4.getBytes() 是通过平台默认字符集进行编码;
5.浏览器和html之间采用的编码不一致
解决办法:修改浏览器的编码格式
修改html页面的编码格式:
<meta http-equiv="content-Type" content="text/html;charset=utf8">
jsp2.0中jsp页面编码使用<page-encoding>代替
6.jsp页面提交form表单时发生的乱码(forward跳转)
解决办法:
修改jsp页面的编码格式:
<%@ page contentType="text/html;charset=utf8" pageEncoding="UTF-8"%>
此处的charset优先级比pageEncoding低,如果都没有设置,则默认为ISO-8859-1的编码格式。
还不行就设置jsp页面的request:request.setCharacterEncoding("utf8");
此外还可以修改后台页面如servlet:request.setCharacterEncoding("utf8");
servlet向其他页面转发数据时发生的乱码
解决办法:
修改response:response.setCharacterEncoding("utf8");
7.向数据库传数据时的乱码
解决办法:
首先数据库编码要统一:1.建立数据库时加上CHARACTER SET 'utf8';2.建数据库表时后面加上:DEFAULT CHARSET=utf8;
其次要设置连接数据库时的编码: uri="jdbcMYSQL://localhost/xxx?user=root&password=123456&useUnicode=true&characterEncoding=utf-8";
最后如果还有乱码,则有可能是插入数据时的参数位置没有一一对应。
8.IDE的字体编码问题,修改ide编码。
9.servlet和jsp之间传数据时有post和get两种方法,当用post时没有问题,但是当用get时需要加一个字符编码转换:
10.字符编码过滤器。
11.js传参乱码
在js端使用encodeURI(encodeURI(url))进行编码工作;
在java端使用URLDecoder(url,"URF-8")进行解码工作。
12.java生成的url中参数乱码
首先对URL进行URLEncoder.encode("中文字符","UTF-8");
然后在获取的时候使用new String(request.getparameter("key").getBytes("ISO-8859-1"),"UTF-8")。
(为什么要对取出的字符集形式转换成UTF-8形式,是因为ISO-8859-1是Java中网络传输使用的标准字符集,request.getParameter("message");得到的还是ISO-8859-1字符集,所以要转换一下。——参考http://m.blog.csdn.net/blog/rugaxm_11109/7804425
13.tomcat配置对url的编码方式,也可以解决图片中文路径问题。
<Connector port="8080" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443" URIEncoding="UTF-8" />
14.properties文件乱码
问题描述:在使用一些类库或者框架时,为了实现页面内容国际化,需要编写对应的properties文件。而properties文件中的中文内容在显示的时候也会出现乱码。
解决方法:这个乱码问题可以通过jdk中的native2ascii工具解决。使用如下命令:
native2ascii -encoding utf-8 display.properties display_zh_CN.properties
出现乱码问题的原因是因为java编译器只能处理Latin-1或unicode编码的字符文件。
15.Servlet相关的几种乱码原理
参考http://blog.csdn.NET/haitianxiaowu1/article/details/52460105
1.浏览器调用jsp,html等页面中文显示乱码
此情况需满足两个要求:
文件本身是以utf-8编辑保存的(myEclipse中在properties中鼠标右键选择utf-8),浏览器用utf-8解析:
(手动)==>在浏览器中右键选择编码格式为utf-8
(智能)==>在文件中写入如: <meta name="content-type" content="text/html; charset=UTF-8"> 通过<meta>标签模拟response头,起到告诉浏览器用utf-8的编码解析
(智能)==> response.setContentType("text/html;charset=UTF-8");起到告诉浏览器用utf-8的编码解析
常用:
<meta name="content-type" content="text/html; charset=UTF-8">或<meta charset="utf-8">
<%@ pageEncoding="utf-8"%>
<?xml encoding="UTF-8"?>
2.通过浏览器调用servlet,页面显示乱码。
Servlet乱码分为request乱码和response乱码;
(1)response乱码问题
解决方法:
添加:response.setCharacterEncoding("UTF-8");
response.setContentType("text/html;charset=utf-8");或者 response.setHeader("content-type","text/html;charset=UTF-8");告诉浏览器用utf-8解析。(setHeader是HttpServletResponse的方法。如果想在拦截器Filter中设置字符编码,则无此方法,因为Filter的doFilter方法的参数类型是ServletResponse)
本质:
response.setContentType("text/html;charset=UTF-8"); 目的是为了控制浏览器的行为,即控制浏览器用UTF-8进行解码;
response.setCharacterEncoding("UTF-8");目的是用于response.getWriter()输出的字符流的乱码问题。如果是response.getOutputStream()是不需要此种解决方案的,因为这句话的意思是为了将response对象中的数据以UTF-8解码后的字节流发向浏览器;
(2)request乱码问题
request请求分为post和get,对于不同的请求方式有不同的解决乱码的方案;
GET请求(URI方式传递参数乱码):
出现情况:浏览器访问<a href=""><form method="get">
如:<a href="/webproject/display.jsp?username=张三&password=123">显示用户名和密码</a>
解决方法:问题本质是get方式传递的参数内容默认编码方式问ISO8859-1,而且使用request.setCharacterEncoding("utf-8")也无法解决问题。
法一:要解决这个问题,修改tomcat服务器的配置文件。修改tomcat目录下的conf/server.xml文件的第43行:
修改前内容:
<Connector port="8080" protocol="HTTP/1.1"
maxThreads="150" connectionTimeout="200000"
redirecPort="8443"/>
修改后内容:
<Connector port="8080" protocol="HTTP/1.1"
maxThreads="150" connectionTimeout="200000"
redirecPort="8443" URIEncoding="utf-8"/>
法二:String usernameString = new String(username.getBytes("ISO-8859-1"),"UTF-8");
法三:URL转换
有点乱,但是比较全面。