关于Base64编码的理解

之前在很多业务中都有见过或者用到过Base64编码，但一直一知半解，没有对它有一个深入的认识和理解。今天就来聊一聊Base64编码的问题。

首先要明确的是，Base64是一种可逆的编码方式，提到编码方式，我们首先想到的肯定是Ascii、GBK、Unicode这些常用的编码方法，那么Base64与这些编码方式有什么不同呢？

简单来将，Base64就是一种用64个Ascii字符来表示任意二进制数据的方法。主要用于将不可打印的字符转换成可打印字符，或者简单的说将二进制数据编码成Ascii字符。Base64是网络上最常用的传输8bit字节数据的编码方式之一。

Base64的原理其实很简单，首先，需要准备一个包含64个字符的表格（如下表），0～63分别对应了唯一一个字符，比如18对应的是S。

然后，对二进制数据进行处理，每3个字节一组，一共3x8=24bit，将这24bit划分为4组，每组正好6个bit，6bit的数据刚好可以表示0～63的范围，也就可以对应上表的64个字符。这样我们就得到了4个数字作为索引，然后查表获得相应的4个字符，就得到了编码后的字符串。下表将整个处理的过程描述的很清楚。

文本	M								a								n
ASCII编码	77								97								110
二进制位	0	1	0	0	1	1	0	1	0	1	1	0	0	0	0	1	0	1	1	0	1	1	1	0
索引	19						22						5						46
Base64编码	T						W						F						u

所以，Base64编码会把3字节的二进制数据编码为4字节的文本数据，长度增加为原来的4/3。如果要编码的二进制数据不是3的倍数，最后会剩下1个或2个字节怎么办？此时，需在原数据后面添加1个或2个零值字节，使其字节数是3的倍数。然后，在编码后的字符串后面添加1个或2个等号“=”，表示所添加的零值字节数。解码的时候，会自动去掉。

下面来看一下Base64编码的优缺点。

优点：可以将二进制数据转换成可打印字符，方便传输数据；对数据进行简单的加密，肉眼安全。

缺点：内容编码后的体积会变大，编码和解码需要额外的工作量。

它的使用场景有很多，比如将图片等资源文件以Base64编码形式直接放于代码中，使用的时候反Base64后转换成Image对象使用；有些文本协议不支持不可见字符的传递，只能转换成可见字符来传递信息。有时在一些特殊的场合，大多数消息是纯文本的，偶尔需要用这条纯文本通道传一张图片之类的情况发生的时候，就会用到Base64，比如多功能Internet 邮件扩充服务（MIME）就是用Base64对邮件的附件进行编码的。

相关阅读:
13年7月memory point
getDefinitionByName getDefinition 区别
cocos2d-html5版日历组件
一个js对象的代码结构
计算机操作系统复习
计算机组成原理复习
最新的hustoj搭建姿势
推荐算法学习笔记
BUPT 2012复试机考 4T
BUPT 2012复试机考 3T

原文地址：https://www.cnblogs.com/suizhikuo/p/9635049.html