Base 64 Encoding 编码(转载)
原创地址:http://www.cnblogs.com/jfzhu/archive/2012/12/10/2810664.html
Base 64 Encoding有什么用?举个简单的例子,你使用SMTP协议 (Simple Mail Transfer Protocol 简单邮件传输协议)来发送邮件。因为这个协议是基于文本的协议,所以如果邮件中包含一幅图片,我们知道图片的存储格式是二进制数据(binary data),而非文本格式,我们必须将二进制的数据编码成文本格式,这时候Base 64 Encoding就派上用场了。
(一)编码原理
Base 64 Encoding 的编码原理是将每三个字节(byte)转换为四个字符,每个字符占6 bit。
6 bit一共有64种组合方式,也就是说该编码共需要使用至少64种字符(后面我们还会介绍一个特殊字符 =)。Base 64 Encoding使用了从 A 到 Z、a 到 z、0 到 9、以及 + 和 / 这些字符(即[A-Za-z0-9+/])。
假设我们有三个字节的数据,byte[] {1, 2, 3},用二进制表示为:
00000001 | 00000010 | 00000011
依据上面的原理,使用Basee 64 Encoding编码后结果应该为:
000000 | 010000 | 001000 | 000011
转换为十进制为 0 | 16 | 8 | 3,对照上面的表,编码后的文本为 AQID
既然Base 64 Encoding将每三个字节转换为四个字符,那如果一幅图片的字节数不能被3整除该怎么办?
如果剩余一个字节,该字节同样被转换为四个字符。第一个6 bit 转换成一个字符,接下来2 bit 转换成一个字符(注意这里是向右添加0),最后添加两个=字符。
假设我们有四个字节的数据,byte[] {1, 2, 3, 4},用二进制表示为:
00000001 | 00000010 | 00000011 | 00000100
依据上面的原理,使用Basee 64 Encoding编码后结果应该为:
000000 | 010000 | 001000 | 000011 | 000001 | 000000
转换为十进制为 0 | 16 | 8 | 3 | 1 | 0,对照上面的表,编码后的文本为 AQIDBA==
如果不能被3整除,而余下两个字节,编码方式类似剩余一个字节,同样是转换成四个字符,最后一个字符用=。
假设我们有五个字节的数据,byte[] {1, 2, 3, 4, 5},用二进制表示为:
00000001 | 00000010 | 00000011 | 00000100 | 00000101
依据上面的原理,使用Basee 64 Encoding编码后结果应该为:
000000 | 010000 | 001000 | 000011 | 000001 | 000000 | 010100
转换为十进制为 0 | 16 | 8 | 3 | 1 | 0 | 20,对照上面的表,编码后的文本为 AQIDBAU=
(二)在.Net中的实现
在.Net中,将二进制数据编码为文本可以使用public static string ToBase64String(byte[] inArray)方法;从文本文件转换回二进制数据可以使用public static byte[] FromBase64String(string s)方法。
下面验证一下上面讲解的例子,分别将三组数据 byte[] {1, 2, 3},byte[] {1, 2, 3, 4},byte[] {1, 2, 3, 4, 5} 进行编码,并检验编码后的文本是否分别为AQID,AQIDBA==,AQIDBAU=。
byte[] binary1 = new byte[] { 1, 2, 3 }; string encoded1 = Convert.ToBase64String(binary1); byte[] decoded1 = Convert.FromBase64String(encoded1); Console.WriteLine("Encoded string: {0}, Decoded binary is equal to orignial binary? {1}" , encoded1, binary1.SequenceEqual(decoded1)); byte[] binary2 = new byte[] { 1, 2, 3, 4}; string encoded2 = Convert.ToBase64String(binary2); byte[] decoded2 = Convert.FromBase64String(encoded2); Console.WriteLine("Encoded string: {0}, Decoded binary is equal to orignial binary? {1}" , encoded2, binary2.SequenceEqual(decoded2)); byte[] binary3 = new byte[] { 1, 2, 3, 4, 5}; string encoded3 = Convert.ToBase64String(binary3); byte[] decoded3 = Convert.FromBase64String(encoded3); Console.WriteLine("Encoded string: {0}, Decoded binary is equal to orignial binary? {1}" , encoded3, binary3.SequenceEqual(decoded3));
输出结果为:
Encoded string: AQID, Decoded binary is equal to orignial binary? True
Encoded string: AQIDBA==, Decoded binary is equal to orignial binary? True
Encoded string: AQIDBAU=, Decoded binary is equal to orignial binary? True
总结:本文介绍了为何要使用编码,以及Base 64 Encoding编码的原理,最后还介绍了Base 64 Encoding在.Net中的实现。