Base64编码原理分析
Base64编码
Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一。
Base64编码的作用
因为有些网络传送渠道并不支持所有的字节,例如传统的邮件只支持可见字符的传送,像ASCII码的控制字符就不能通过邮件传送。这样就受到了很大的限制,比如图片二进制流的每个字节不可能全部是可见字符,所以就传送不了。最好的方法就是在不改变传统协议的情况下,开辟一种新的方案来支持二进制文件的传送。把不可见字符用可见字符来表示。而Base64就是一种基于64个可见字符来表示二进制数据的表示方法。
Base64编码的原理
Base64可以将ASCII字符串或者是二进制编码成只包含A—Z,a—z,0—9,+,/ 这64个字符( 26个大写字母,26个小写字母,10个数字,1个+,一个 / 刚好64个字符)。这64个字符用6个bit位就可以全部表示出来,一个字节有8个bit 位,那么还剩下两个bit位,这两个bit位用0来补充。其实,一个Base64字符仍然是8个bit位,但是有效部分只有右边的6个 bit,左边两个永远是0。
Base64的编码规则是将3个8位字节(3×8=24位)编码成4个6位的字节(4×6=24位),之后在每个6位字节前面,补充两个0,形成4个8位字节的形式,那么取值范围就变成了0~63。又因为2的6次方等于64,所以每6个位组成一个单元。
下图是Base64编码对照表,数值代表字符的索引,这个是标准Base64协议规定的,不能更改。
现在如果编码我的名字(李高佳首字母)LGJ
对应ASCII码 76 71 74
转化为二进制 01001100 01000111 01001010
合并 010011000100011101001010
六位 010011 000100 011101 001010
补零 00010011 00000100 00011101 00001010
十进制 19 4 29 10
base对照 TEdK
根据云课堂上的翻译程序检验正确。
基于Python的转化