Base64编码
1、三个重要概念
-
三个字节由四个字节表示的过程
-
Base64码表
-
补位
2、如何用三个字节表示四个字节
一个字节由8位二进制组成,三个字节总共24位,24÷ 4 = 6 , 所以转换后有效的二进制位数为6位。计算机以8位二机制为基础,所以剩下的两位在高位填充 0 。由此引申出两个重要的概念
-
为什么是64位
-
对照表
6位二进制, = 64 所以只能是64,当然如果愿意浪费空间也可以是 32 16 等等。对应的这些二进制怎么表示,所以定义了一个0-63的码表,分别有 A-Za-z0-9+/ 刚好64个字符
索引 | 字符 | 索引 | 字符 | 索引 | 字符 | 索引 | 字符 | 索引 | 字符 | 索引 | 字符 | |||||
0 | A | 1 | B | 2 | C | 3 | D | 4 | E | 5 | F | |||||
6 | G | 7 | H | 8 | I | 9 | J | 10 | K | 11 | L | |||||
12 | M | 13 | N | 14 | O | 15 | P | 16 | Q | 17 | R | |||||
18 | S | 19 | T | 20 | U | 21 | V | 22 | W | 23 | X | |||||
24 | Y | 25 | Z | 26 | a | 27 | b | 28 | c | 29 | d | |||||
30 | e | 31 | f | 32 | g | 33 | h | 34 | i | 35 | j | |||||
36 | k | 37 | l | 38 | m | 39 | n | 40 | o | 41 | p | |||||
42 | q | 43 | r | 44 | s | 45 | t | 46 | u | 47 | v | |||||
48 | w | 49 | x | 50 | y | 51 | z | 52 | 0 | 53 | 1 | |||||
54 | 2 | 55 | 3 | 56 | 4 | 57 | 5 | 58 | 6 | 59 | 7 | |||||
61 | 8 | 62 | 9 | 63 | + | 64 | / |
author herbert QQ: 464884492
3、手工编码
3.1 刚好转换成4个8位二进制
根据规则使用三个字节转四个字节表示,现在就拿123做实例说明,通过查询ASCII表得知123的二进制分别是 0x31(0011 0001)、0x32(0011 0010)、0x33(0011 0011),根据规则得到4个6位二进制分别是 (0011 00) (01 0011) (0010 00) (11 0011),然后依次在高位补0即,右移2为,得到4个8位二进制 (00 0011 00) (00 01 0011) (00 0010 00) (00 11 0011),通过进制转换得到4个十进制数字,分别是(12)(19)(8)(51)。通过查询上边码表中对应的索引的四个 字符分别是(M)(T)(I)(z),所以 123 对应的 base64编码为MTIz
3.2 转换后还剩下一个4位二进制
以12来说,字节长度为16,根据规则转换后会剩下 4 个二进制位(0011 00) (01 0011) (0010) ,分配好以后,分别在高位补两个0 (00 0011 00) (00 01 0011) (00 0010 ),但最后一个字节,位数不够8位,所以在最后一个字节的末尾补上2个 0 (00 0011 00) (00 01 0011) (00 0010 00),然后在分别转换成十进制数为(12)(19)(8)查询索引表得到字符MTI,目前字符长度不够4位,所以在最后补上1个=。由此12最终的base64编码为MTI=
3.3 转换后还剩下一个2位二进制
以1来说,字节长度为8 ,根据规则转换后会剩下 2 个二进制位 (0011 00) (01),分配好以后,分别在高位补两个0 (00 0011 00) (00 01 ),但最后一个字节位数不够8位,所以在最后一个字节的末尾补上 4 个0 (00 0011 00) (00 01 0000),然后转换成十进制数为(M)(Q),目前长度不够4位,所以在最后补上2个= 由此1最终的base64编码为MQ==