base64学习笔记
定义
Base64是网络上最常见的用于传输8Bit字节码的编码方式之一,Base64就是一种基于64个可打印字符来表示二进制数据的方法。
作用
我们先来看一张ASCII码表:
由于有些系统只能使用ASCII字符,那么对于控制字符,或者exe,jpg,pdf这样的文件如果用记事本打开,会出现一堆乱码,因为二进制文件包含很多无法显示和打印的字符,所以,如果要让文本软件能处理二进制数据,就需要一个二进制到字符串的转换方法,这样就可以利用可以打印的字符表示不能打印的字符了,而base64 就是最常见的一个方法。
base64算法的实现过程
首先准备一个具有64个字符的索引表:
Base64的码表只有64个字符, 如果要表达64个字符的话,使用6个bit即可完全表示(2的6次方为64),因为Base64的编码只需6个bit即可表示,而正常的字符是使用8个bit表示, 8和6的最小公倍数是24,所以4个Base64字符可以表示3个标准的ASCII字符,如果是字符的话就先转化为ASCII码再表示。
那么对于二进制的处理,只需要每三个字节(24bit)一组即可转化为base64编码。
这样我们得到4个数字作为索引,然后查表,获得相应的4个字符,就是编码后的字符串。
例如字符串abc的转码:
字符串 a b c
ASCII 97 98 99
8bit 01100001 01100010 01100011
6bit 011000 010110 001001 100011
base64 00011000 00010110 00001001 00100011
十进制 24 22 9 35
对应编码 Y W J j
还有一个问题:如果字符串长度不是3怎么办?
我们考虑用两个base64表示一个字符或者用三个base64表示两个字符(在二进制后面补0凑够6的倍数即可),然后在后面添加=
号,例如字符A的表示:
字符串 A
ASCII 65
8bit 01000001(发现长度不是6的倍数,在后面补0变成010000010000)
6bit 010000 010000
base64 00010000 000100000
十进制 16 16
对应编码 Q Q = =
字符串 B C
ASCII 66 67
8bit 01000010 01000011 00(补两个0变成010000100100001100)
6bit 010000 100100 001100
base64 00010000 00100100 00001100
十进制 16 36 12
对应编码 Q k M =
代码实现:
Python内置的base64
可以直接进行base64的编解码:
import base64
base64.b64encode('binary\x00string')
# 'YmluYXJ5AHN0cmluZw=='
base64.b64decode('YmluYXJ5AHN0cmluZw==')
# 'binary\x00string'
由于标准的Base64编码后可能出现字符+
和/
,在URL中就不能直接作为参数,所以又有一种"url safe"的base64编码,其实就是把字符+
和/
分别变成-
和_
:
base64.b64encode('i\xb7\x1d\xfb\xef\xff')
# 'abcd++//'
base64.urlsafe_b64encode('i\xb7\x1d\xfb\xef\xff')
# 'abcd--__'
base64.urlsafe_b64decode('abcd--__')
# 'i\xb7\x1d\xfb\xef\xff'
喜闻乐见的CTFbase64换表处理方法
一般base64索引表是约定的,在线编码解码遵从的也都是该表,但是有的题会把索引表改了
-
自己写一个python脚本进行base64转码
# coding:utf-8
s = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
# 在这里修改base64索引表
def My_base64_encode(inputs):
# 将字符串转化为2进制
bin_str = []
for i in inputs:
x = str(bin(ord(i))).replace('0b', '')
bin_str.append('{:0>8}'.format(x))
#print(bin_str)
# 输出的字符串
outputs = ""
# 不够三倍数,需补齐的次数
nums = 0
while bin_str:
#每次取三个字符的二进制
temp_list = bin_str[:3]
if(len(temp_list) != 3):
nums = 3 - len(temp_list)
while len(temp_list) < 3:
temp_list += ['0' * 8]
temp_str = "".join(temp_list)
#print(temp_str)
# 将三个8字节的二进制转换为4个十进制
temp_str_list = []
for i in range(0,4):
temp_str_list.append(int(temp_str[i*6:(i+1)*6],2))
#print(temp_str_list)
if nums:
temp_str_list = temp_str_list[0:4 - nums]
for i in temp_str_list:
outputs += s[i]
bin_str = bin_str[3:]
outputs += nums * '='
print("Encrypted String:\n%s "%outputs)
def My_base64_decode(inputs):
# 将字符串转化为2进制
bin_str = []
for i in inputs:
if i != '=':
x = str(bin(s.index(i))).replace('0b', '')
bin_str.append('{:0>6}'.format(x))
#print(bin_str)
# 输出的字符串
outputs = ""
nums = inputs.count('=')
while bin_str:
temp_list = bin_str[:4]
temp_str = "".join(temp_list)
#print(temp_str)
# 补足8位字节
if(len(temp_str) % 8 != 0):
temp_str = temp_str[0:-1 * nums * 2]
# 将四个6字节的二进制转换为三个字符
for i in range(0,int(len(temp_str) / 8)):
outputs += chr(int(temp_str[i*8:(i+1)*8],2))
bin_str = bin_str[4:]
print("Decrypted String:\n%s "%outputs)
print()
print(" *************************************")
print(" * (1)encode (2)decode *")
print(" *************************************")
print()
num = input("Please select the operation you want to perform:\n")
if(num == "1"):
input_str = input("Please enter a string that needs to be encrypted: \n")
My_base64_encode(input_str)
else:
input_str = input("Please enter a string that needs to be decrypted: \n")
My_base64_decode(input_str)
-
给你base64,让你解码,那么直接照着加密表倒回去
利用python的maketrans和translate函数,建立一个改表到原表的映射,先转成原表的索引再decode即可
import base64
ens = 'Please enter a string that needs to be decrypted'
intab = 'Please enter the encoded_index' #换表
outtab = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/' #原表
transtab = str.maketrans(intab,outtab)
ens = ens.translate(transtab)
print(base64.b64decode(ens).decode())
buuctf [FlareOn3]Challenge1
接下来是一道base64换表裸题。
没壳直接扔进IDA反编译:
int __cdecl main(int argc, const char **argv, const char **envp)
{
char Buffer[128]; // [esp+0h] [ebp-94h] BYREF
char *Str1; // [esp+80h] [ebp-14h]
char *Str2; // [esp+84h] [ebp-10h]
HANDLE StdHandle; // [esp+88h] [ebp-Ch]
HANDLE hFile; // [esp+8Ch] [ebp-8h]
DWORD NumberOfBytesWritten; // [esp+90h] [ebp-4h] BYREF
hFile = GetStdHandle(0xFFFFFFF5);
StdHandle = GetStdHandle(0xFFFFFFF6);
Str2 = "x2dtJEOmyjacxDemx2eczT5cVS9fVUGvWTuZWjuexjRqy24rV29q";
WriteFile(hFile, "Enter password:\r\n", '\x12', &NumberOfBytesWritten, 0);
ReadFile(StdHandle, Buffer, 0x80u, &NumberOfBytesWritten, 0);
Str1 = (char *)sub_401260(Buffer, NumberOfBytesWritten - 2);
if ( !strcmp(Str1, Str2) )
WriteFile(hFile, "Correct!\r\n", 0xBu, &NumberOfBytesWritten, 0);
else
WriteFile(hFile, "Wrong password\r\n", 0x11u, &NumberOfBytesWritten, 0);
return 0;
}
flag放在buffer里,加密后得到str1,和
比较
看到
立马反应过来是base64换表,根据上面的知识,直接套exp
import base64
ens = 'x2dtJEOmyjacxDemx2eczT5cVS9fVUGvWTuZWjuexjRqy24rV29q'
intab = 'ZYXABCDEFGHIJKLMNOPQRSTUVWzyxabcdefghijklmnopqrstuvw0123456789+/'
outtab = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/'
transtab = str.maketrans(intab,outtab)
ens = ens.translate(transtab)
print(base64.b64decode(ens).decode())
得到flag{sh00ting_phish_in_a_barrel@flare-on.com}