• Java JSP中文乱码问题解决心得(转)


    自从接触Java和JSP以来,就不断与Java的中文乱码问题打交道,现在终于得到了彻底的解决,现将我们的解决心得与大家共享。

      一、Java中文问题的由来

      Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦。原因主要有两方面,Java和JSP文件本身编译时产生的乱码问题和Java程序于其他媒介交互产生的乱码问题。

      首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字节流的,如果Java和JSP编译成class文件过程中,使用的编码方式与源文件的编码不一致,就会出现乱码。基于这种乱码,建议在Java文件中尽量不要写中文(注释部分不参与编译,写中文没关系),如果必须写的话,尽量手动带参数-ecoding GBK或-ecoding gb2312编译;对于JSP,在文件头加上或基本上就能解决这类乱码问题。

      本文要重点讨论的是第二类乱码,即Java程序与其他存储媒介交互时产生的乱码。很多存储媒介,如数据库,文件,流等的存储方式都是基于字节流的,Java程序与这些媒介交互时就会发生字符(char)与字节(byte)之间的转换,具体情况如下:

      从页面form提交数据到java程序 byte->char

      从java程序到页面显示 char?>byte

      从数据库到java程序 byte?>char

      从java程序到数据库 char?>byte

      从文件到java程序 byte->char

      从java程序到文件 char->byte

      从流到java程序 byte->char

      从java程序到流 char->byte

      如果在以上转换过程中使用的编码方式与字节原有的编码不一致,很可能就会出现乱码。

      二、解决方法

      前面已经提到了Java程序与其他媒介交互时字符和字节的转换过程,如果这些转换过程中容易产生乱码。解决这些乱码问题的关键在于确保转换时使用的编码方式与字节原有的编码方式保持一致,下面分别论述(Java或JSP自身产生的乱码请参看第一部分)。

      1、JSP与页面参数之间的乱码

      JSP获取页面参数时一般采用系统默认的编码方式,如果页面参数的编码类型和系统默认的编码类型不一致,很可能就会出现乱码。解决这类乱码问题的基本方法是在页面获取参数之前,强制指定request获取参数的编码方式:request.setCharacterEncoding("GBK")或request.setCharacterEncoding("gb2312")。

      如果在JSP将变量输出到页面时出现了乱码,可以通过设置response.setContentType("text/html;charset=GBK")或response.setContentType("text/html;charset=gb2312")解决。

      如果不想在每个文件里都写这样两句话,更简洁的办法是使用Servlet规范中的过虑器指定编码,过滤器的在web.xml中的典型配置和主要代码如下:

      web.xml:

      CharacterEncodingFilter

      net.vschool.web.CharacterEncodingFilter

      encodingGBK

      CharacterEncodingFilter

      /*

      CharacterEncodingFilter.java:

      public class CharacterEncodingFilter implements Filter

      {

      protected String encoding = null;

      public void init(FilterConfig filterConfig) throws ServletException

      {

      this.encoding = filterConfig.getInitParameter("encoding");

      }

      public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException

      {

      request.setCharacterEncoding(encoding);

      response.setContentType("text/html;charset="+encoding);

      chain.doFilter(request, response);

      }

      }

      2、Java与数据库之间的乱码

      大部分数据库都支持以unicode编码方式,所以解决Java与数据库之间的乱码问题比较明智的方式是直接使用unicode编码与数据库交互。很多数据库驱动自动支持unicode,如Microsoft的SQLServer驱动。其他大部分数据库驱动,可以在驱动的url参数中指定,如如mm的mysql驱动:jdbc:mysql://localhost/WEBCLDB?useUnicode=true&characterEncoding=GBK。

      3、Java与文件/流之间的乱码

      Java读写文件最常用的类是FileInputStream/FileOutputStream和FileReader/FileWriter。其中FileInputStream和FileOutputStream是基于字节流的,常用于读写二进制文件。读写字符文件建议使用基于字符的FileReader和FileWriter,省去了字节与字符之间的转换。但这两个类的构造函数默认使用系统的编码方式,如果文件内容与系统编码方式不一致,可能会出现乱码。在这种情况下,建议使用FileReader和FileWriter的父类:InputStreamReader/OutputStreamWriter,它们也是基于字符的,但在构造函数中可以指定编码类型:InputStreamReader(InputStream in, Charset cs) 和OutputStreamWriter(OutputStream out, Charset cs)。

      4、其他

      上面提到的方法应该能解决大部分乱码问题,如果在其他地方还出现乱码,可能需要手动修改代码。解决Java乱码问题的关键在于在字节与字符的转换过程中,你必须知道原来字节或转换后的字节的编码方式,转换时采用的编码必须与这个编码方式保持一致。我们以前使用Resin服务器,使用smartUpload组件上传文件,上传文件同时传递的中文参数获取没有乱码问题。当在Linux中把Resin设置成服务后,上传文件同时的中文参数获取出现了乱码。这个问题困扰了我们很久,后来我们分析smartUpload组件的源文件,因为文件上传采用的是字节流的方式,里面包含的参数名称和值也是字节流的方式传递的。smartUpload组件读取字节流后再将参数名称和值从字节流中解析出来,问题就出现在smartUpload将字节流转换成字符串时采用了系统默认的编码,而将Resin设置成服务后,系统默认的编码可能发生了改变,因此出现了乱码。后来,我们更改了smartUpload的源文件,增加了一个属性charset和setCharset(String)方法,将upload()方法中提取参数语句:

      String value = new String(m_binArray, m_startData, (m_endData - m_startData) + 1 );

      改成了

      String value = new String(m_binArray, m_startData, (m_endData - m_startData) + 1, charset );

      终于解决了这个乱码问题。

    转自:http://www.enet.com.cn/article/2008/0229/A20080229170410.shtml

    --------------add---------------

    转自:http://yongtree.spaces.live.com/blog/cns!9F387A11DF33043D!231.entry

    对于初学jsp web开发的人来说,中文乱码是一个比较头痛的问题。在学习和做项目的过程中,同样被这些问题困恼着,当问题出的多了,也有了一定的经验,现写下来与朋友们分享。
    1.JSP输出中文的乱码问题
    所谓在jsp输出中文,即直接在jsp中输出中文,或者给变量赋中文值再输出等,这种情况下的乱码问题往往是因为没有给jsp页面制定显示中文字符的编码方式,解决办法如下:
    1)在jsp页面头部加上语句<%@ page contentType="text/html;charset=utf-8"%>(在Servlet中使用httpServletResponse.setContentType("text/html;charset=utf-8"),最好同时在jsp页面的head部分加上<meta http-equiv="Content-Type" content="text/html;charset="utf-8">
    2)在每次要输出中文的地方主动转换编码方式,比如要在页面中输入“中文”二字,就可以用以下的方法:
    <% 
       String str="中文";
       byte[] tmpbyte=str.getBytes("ISO8859_1");
       str=new String(tmpbyte);
       out.println(str);
    %>
    对于以上这两种方法,显然第一种方法更通用一点,只需要在一个页面中添加一次代码即可;而对于第二种方法,在每个需要输出中文的地方都需要转码,如果这样的地方很多,这将是一个繁重的工作。
    2.获取表单提交的数据时的中文乱码问题
    在没有加任何其他处理之前,用request.getParameter("paramName")获取表单提交中的数据,且表单数据中含有中文时,返回的字符串会呈现乱码。出现这种问题的原因是Tomcat的j2ee实现对表单提交,即以POST方式提交的参数采用默认的ISO-8859-1来处理。
    解决此问题的办法有两个:
    1)不修改其他配置,只是在将表单中的中文数据区出来后再转换编码,方法如语句 String str=request.getParameter("chStr");String str = new String(str.getBytes("ISO-8859-1"),"UTF-8");但这种方法只是从一个局部来考虑问题,如果这样的情况很多,就要写很多次,势必加大工作量。
    2)让对所有页面的请求都通过一个Filter,将处理字符集设置为utf-8(根据自己需要也可以设置成其他的,如gb2312,gbk)。具体做法参考Tomcat的webapps/servlet-exemples目录有一个完整的例子,也可以参考其中web.xml和SetCharacterEncodingFilter的配置.
    3.URL中的中文问题
    对于直接通过在url中传递中文参数,如http://localhost:8080/a.jsp?str="中文"这样的get请求,在服务器端用request.getParameter("name")时返回的往往是乱码。按照以上的做法设置Filter没有用,用request.setCharacterEncoding("utf-8")的方式,仍然不管用。造成这种结果的原因是Tomcat中以get方式提交的请求对query-string处理时采用了和post方法不一样的处理方式。
    解决这个问题的方法是是打开Tomcat安装目录下的/conf/server.xml文件,找到Connector块,往其中添加URLEncoding="utf-8"/>
    4.数据库访问时的乱码问题
    数据库中所有表的编码方式和jsp中的使用的编码要保持一致,这样做的目的可以减少不必要的编码转换问题.另外,在使用jdbc连接MySQL数据库时,连接字符串写成如下形式可以避免一些中文问题:
    jdbc://mysql://hostname:port/DBname?user=username&password=pwd&useUnicode=true&character Encoding=utf-8
    如果是以数据源的方式连接数据库,配置文件中使用:
    <parameter>
       <name>url</name>
       <value>jdbc:mysql://hostname:port/DBname?&useUnicode=true&characterEncoding=utf-8
       </value>
    </parameter>
    但是如果使用一个已经存在的数据库,数据库的编码方式为ISO-8859-1,而Web应用中使用的utf-8,且数据库已经有很多重要的信息,因此不能通过更改数据库的编码方式来解决。这个时候,在往数据库中写数据时,一定要在jdbc连接字符串中加入“useUnicode=true&characterEncoding=ISO-8859-1”,这样可以顺利的王数据库写入正常的数据。但是,在将数据读出数据库时,乱码又会出现,这个时候就应该在数据取出时对其转码,可以将转码功能写为一个函数,具体实现如下:
    public String charConvert(String src){
     String result=null;
     if(src!=null){
      try{
       result=new String(src.getBytes("ISO-8859-1"),"UTF-8");
      }catch(Exception e){
       result=null;
      }
     }
     return result;
    }
    于是,在数据库读出数据过后调用charConvert(rs.getString("colName"));这样就可以正常的显示数据库中的中文数据了。

    --------------add---------------


    在页面传参数时若出现乱码,可尝试使用encodeURI方法封装url。如

    encodeURI("<%=request.getContextPath()%>/dyfk/ajax/list.jsp?id="+id+"&isgxpcs="+isgxpcs+"&deptName="+deptName)

  • 相关阅读:
    [BZOJ2729]排队
    [BZOJ2839]集合计数
    [BZOJ2111] Perm 排列计数
    Unet 项目部分代码学习
    数据增强代码
    论文阅读笔记五:U-Net: Convolutional Networks for Biomedical Image Segmentation(CVPR2015)
    CTPN项目部分代码学习
    论文阅读笔记四:CTPN: Detecting Text in Natural Image with Connectionist Text Proposal Network(ECCV2016)
    R2CNN项目部分代码学习
    VOC数据集生成代码使用说明
  • 原文地址:https://www.cnblogs.com/myparamita/p/1500405.html
Copyright © 2020-2023  润新知