js中对文字进行编码主要有三个函数:escape,encodeURI,encodeURIComponent;
对应解码为:unescape,decodeURI,decodeURIComponent
这里不在说基本概念(基本概念可以参考w3cohool,里面叙述的已经很详细了),而是侧重于使用和区别去说明:
一、js编码
1. escape():该种方式对于汉字的编码和上面两个方法的编码结果不一样;
注释:ECMAScript v3 反对使用该方法,应用使用 decodeURI() 和 decodeURIComponent() 替代它。
2. encodeURI() 函数:主要对整个url进行编码,和encodeURIComponent编码中文的返回结果是一样的。
3. encodeURICompent()函数:主要对参数值进行编码处理
总结:
通过对三个函数的分析,我们可以知道:escape()除了 ASCII 字母、数字和特定的符号外,对传进来的字符串全部进行转义编码,因此如果想对URL编码,最好不要使用此方法。而encodeURI() 用于编码整个URI,因为URI中的合法字符都不会被编码转换。encodeURIComponent方法在编码单个URIComponent(指请求参数)应当是最常用的,它可以将参数中的中文、特殊字符进行转义,而不会影响整个URL。(并且这三个编码方式,如encodeURI无关中文编码,只是按照一定规则去编码 ???)
5. 使用场景:
(1)传递参数时需要使用encodeURIComponent,这样组合的url才不会被#等特殊字符截断。
例如:<script language="javascript">document.write('<a href="http://passport.baidu.com/?logout&aid=7&u='+encodeURIComponent("http://cang.baidu.com/bruce42")+'">退出</a>');</script>
(2)进行url跳转时可以整体使用encodeURI
例如:Location.href=encodeURI("http://cang.baidu.com/do/s?word=百度&ct=21");
(3)js使用数据时可以使用escape
例如:搜藏中history纪录。
(4)escape对0-255以外的unicode值进行编码时输出%u****格式,其它情况下escape,encodeURI,encodeURIComponent编码结果相同。
最多使用的应为encodeURIComponent,它是将中文、韩文等特殊字符转换成utf-8格式的url编码,
所以如果给后台传递参数需要使用encodeURIComponent时需要后台解码对utf-8支持(form中的编码方式和当前页面编码方式相同)
escape不编码字符有69个:*,+,-,.,/,@,_,0-9,a-z,A-Z
encodeURI不编码字符有82个:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z
encodeURIComponent不编码字符有71个:!, ',(,),*,-,.,_,~,0-9,a-z,A-Z
二、java编码
1. java.net.URLDecoder.decode(request.getParameter("userName"),"utf-8");
2. java.net.URLEncoder.encode(request.getParameter("userName"),"utf-8");
三、总结