• Android 中的编码与解码


    前言:今天遇到一个问题,一个用户在登录的时候,出现登录失败。但是其他用户登录都是正常的,经过调试发现登录失败的用户的密码中有两个特殊字符: * 、#  。

            特殊符号在提交表单的时候,出现了编码不一样的问题。那么编码是什么鬼??

    1、什么是application/x-www-form-urlencoded字符串?

        它是一种编码类型。

        当URL地址里包含非西欧字符的字符串时,系统会将这些字符转换成application/x-www-form-urlencoded字符串。

        表单提交时也是如此,当包含非西欧字符的字符串时,系统也会将这些字符转换成application/x-www-form-urlencoded字符串。

       

    package com.app;
    import java.io.UnsupportedEncodingException;
    import java.net.URLDecoder;
    import java.net.URLEncoder;
    
    public class AA {
        public static void main(String[] args) {
            /**
             * 将application/x-www-form-urlencoded字符串 转换成普通字符串
             */
            String keyWord = "";
            try {
                keyWord = URLDecoder.decode("%E6%96%87%E6%A1%A3", "UTF-8");
            } catch (UnsupportedEncodingException e) {
                e.printStackTrace();
            }
    
            System.out.println(keyWord);
    
            /**
             * 将普通字符串转换成application/x-www-form-urlencoded字符串
             * 必须强调的是编码方式必须正确,如baidu的是gb2312,而google的是UTF-8
             */
            String urlStr = "" ;
            try {
                urlStr = URLEncoder.encode("文档", "Utf-8");
            } catch (UnsupportedEncodingException e) {
                e.printStackTrace();
            }
            System.out.println(urlStr);
    
        }
    }

    运行结果是:

      文档
     %E6%96%87%E6%A1%A3

    2、URLEncoder  和  URLDecoder

        在java1.3和早期版本中,返回一个新的被编码后的string,encode( ) 使用了平台的默认编码形式

       编码:   public static String encode(String s)

       解码:   public static String decode(String s)  

       在java1.4中及以后,要求用户自己指定编码形式,比如 "UTF-8" 、 "gb2312" 。

       编码: public static String encode(String s, String encoding) throws UnsupportedEncodingException

       解码: public static String decode(String s, String encoding) throws UnsupportedEncodingException

     

       注意:如果你拿不定主意用哪种编码方式,那就选择UTF-8吧。它比其他任何的编码形式更有可能得到正确的结果。

    3、为什么要编码?

        答案:处理不同操作系统间的差异性

      web设计者面临的众多难题之一便是怎样处理不同操作系统间的差异性。这些差异性能引起URL方面的问题:例如,一些操作系统允许文件名中含有空格符,有些又不允许。

      大多数操作系统不会认为文件名中含有符号“#”会有什么特殊含义;但是在一个URL中,符号“#”表示该文件名已经结束,后面会紧跟一个fragment(部分)标识符。其他的特殊字符,  非字母数字字符集,它们在URL或另一个操作系统上都有其特殊的含义,表述着相似的问题。为了解决这些问题

    我们在URL中使用的字符就必须是一个ASCII字符集的固定字集中的元素,具体如下:

       1.大写字母A-Z
       2.小写字母a-z
       3.数字 0-9
       4.标点符 - _ . ! ~ * ' (和 ,)

      如果向服务器提交数据中含有  / & ? @ # ; $ + = %,这些字符和所有其他字符就应该被编码。

      编码过程非常简单,任何字符只要不是ASCII码数字,字母,或者前面提到的标点符,它们都将被转换成字节形式,每个字节都写成这种形式:一个“%”后面跟着两位16进制的数值。

      空格是一个特殊情况,因为它们太平常了。它除了被编码成“%20”以外,还能编码为一个“+”。加号(+)本身被编码为%2B。

      当/ # = & 和?作为名字的一部分来使用时,而不是作为URL部分之间的分隔符来使用时,它们都应该被编码。

    4、如何编码?

       类URL并不自动执行编码或解码工作。幸运的是,java提供了一个类URLEncoder把string编码成这种形式。

       Java1.2增加了一个类URLDecoder它能以这种形式解码string。

    5、网页中的表单使用POST方法提交时,数据内容的类型是 application/x-www-form-urlencoded,这种类型会:

        1.字符"a"-"z","A"-"Z","0"-"9",".","-","*",和"_" 都不会被编码;
        2.将空格转换为加号 (+) ;
        3.将非文本内容转换成"%xy"的形式,xy是两位16进制的数值;
        4.在每个 name=value 对之间放置 & 符号

  • 相关阅读:
    Codeforces 1528E Mashtali and Hagh Trees
    Codeforces Round #709 (Div. 1, based on Technocup 2021 Final Round)
    Codeforces 1517G Starry Night Camping
    Codeforces 1508E Tree Calendar
    Codeforces 1508D Swap Pass
    Codeforces 1511G Chips on a Board
    Codeforces 1511F Chainword
    Codeforces 1516E Baby Ehab Plays with Permutations
    CF1539A Contest Start 题解
    关于 manacher
  • 原文地址:https://www.cnblogs.com/zhaoyanjun/p/4481628.html
Copyright © 2020-2023  润新知