本文的实验来源于《Computer Systems A Programmer's Perspective》(深入理解计算机系统》一书中第三章的一个实验。
作者给出了一个含有缓冲区溢出的程序bufbomb.c,你需要做的,就是注入给缓冲区些特殊的数据,到底利用缓冲区的目的。
1 //bufbomb.c 2 /* Bomb program that is solved using a buffer overflow attack */ 3 #include <stdio.h> 4 #include <stdlib.h> 5 #include <ctype.h> 6 /* Like gets, except that characters are typed as pairs of hex digits. 7 Nondigit characters are ignored. Stops when encounters newline */ 8 char *getxs(char *dest) 9 { 10 int c; 11 int even = 1; /* Have read even number of digits */ 12 int otherd = 0; /* Other hex digit of pair */ 13 char *sp = dest; 14 while ((c = getchar()) != EOF && c != '/n') { 15 if (isxdigit(c)) { 16 int val; 17 if ('0' <= c && c <= '9') 18 val = c - '0'; 19 else if ('A' <= c && c <= 'F') 20 val = c - 'A' + 10; 21 else 22 val = c - 'a' + 10; 23 if (even) { 24 otherd = val; 25 even = 0; 26 } else { 27 *sp++ = otherd * 16 + val; 28 even = 1; 29 } 30 } 31 } 32 *sp++ = '/0'; 33 return dest; 34 } 35 /* $begin getbuf-c */ 36 int getbuf() 37 { 38 char buf[12]; 39 getxs(buf); 40 return 1; 41 } 42 void test() 43 { 44 int val; 45 printf("Type Hex string:"); 46 val = getbuf(); 47 printf("getbuf returned 0x%x/n", val); 48 } 49 /* $end getbuf-c */ 50 int main() 51 { 52 int buf[16]; 53 /* This little hack is an attempt to get the stack to be in a 54 stable position 55 */ 56 test(); 57 return 0; 58 }
函数getxs的功能类似于库函数gets的功能,除了它是以十六进制数字对的编码方式读入的字符。例如,要读入字符串“0123”,你得给出输入字符串“30 31 32 33”,这个函数会忽略空格。
分析这个程序,可以得知,正常情况下,这个函数会在getbuf中,调入getxs函数读入数字对,然后不管任何情况下,都会对test函数返回0x1,然后由test中的printf函数打印处getbuf的返回值。
现在你的任务,就是,利用缓冲区溢出的漏洞,输入些特殊的数字,使得屏幕中打印的是0xdeadbeef。
我是在WindowsXP,visual c++6.0环境解决这个问题的。
在做这个题目之前,你当然要知道什么是帧栈结构(请参阅《深入理解计算机系统》第三章),了解%ebp和%esp的含义。
题目中已经说了,“分析这个程序,可以得知,正常情况下,这个函数会在getbuf中,调入getxs函数读入数字对,然后不管任何情况下,都会对 test函数返回0x1,”那我们该怎么办了?我们马上可以想到在getbuf这个函数里定义的char buf[12]上做手脚,可以看到在getxs函数里的while循环,结束条件只是以回车或者是eof结束符为判断标准,所以,根本没对char输入的数量做判断!这样的话,我们可以输入多于12个的数,从而缓冲区溢出!
在这里还是提一下帧栈结构,如下:
+-------------------------------+高地址
|函数参数 n 个 |
+-------------------------------+
|函数参数第 n-1 个 |
+-------------------------------+
| . . . |
| . . . |
| . . . |
+-------------------------------+
|函数参数第1个 |
+-------------------------------+
|return 返回地址 |
+-------------------------------+
|ebp指针入栈 |
+-------------------------------+
|local var(局部变量) |
+-------------------------------+
| others |
+-------------------------------+低地址
按照上面说的函数栈的存放情况,在getbuf这个函数里,函数参数没有,我们不管,然后就是return返回地址,然后就是ebp指针,然后就是char buf[12]。
+-------------------------------+低地址
|return 返回地址 |
+-------------------------------+
|ebp指针入栈 |
+-------------------------------+
| buf[11] |
+-------------------------------+
| buf[10] |
+-------------------------------+
:
:
:
+-------------------------------+
| buf[0] |
+-------------------------------+
| others |
+-------------------------------+高地址
如果我们对buf溢出,能改写ebp和return地址!下面看看,ebp是多少,return地址是多少。
要知道这里的%ebp存的是test函数的%ebp,因而我们在调试的时候就可以在test函数得到%ebp的值,它应该是我们写入的 buf[12]-buf[15]的值,而且它要保持原来的值,不然返回之后就乱套了,在我机器上是0x0012efa0。这个很容易,解决了第一步。
下面我们再来看返回地址,先看一段汇编码(不同的机器有所不同):
58: val = getbuf(); 004011C5 call @ILT+10(getbuf) (0040100f) 004011CA mov dword ptr [ebp-4],eax 59: printf("getbuf returned 0x%x/n", val); 004011CD mov eax,dword ptr [ebp-4] 004011D0 push eax 004011D1 push offset string "getbuf returned 0x%x/n" (0042001c) 004011D6 call _printf (00401510) 004011DB add esp,8
在getbuf()返回后,肯定会接着执行004011CA ,我们能让它从这执行吗?当然不行!不然就要push eax,那是我们不想看到的,因为eax的值就是1。因而我们会想到能不能跳过这?当然能,改返回地址啊!顺水推舟,我们通过buf数组来覆盖返回地址。 此时,我们想要它直接跳到004011D1处,因而可以通过设置buf[16]-buf[19]的值来覆盖返回地址。
到了考虑如何加进deadbeef了,在返回后,将直接执行push offset string "getbuf returned 0x%x/n" (0042001c),没eax怎么行了?不然printf函数就少了参数。再回到帧栈结构一下,printf在调用之前,要压入参数,先压入val,再 压入offset string "getbuf returned 0x%x/n",也就是说参数val(等同那个eax)在offset string "getbuf returned 0x%x/n“之上,而且紧挨着。此时我们可以想到,既然返回之后(返回地址及其以下的元素都已弹出,返回地址的上一个字节成了栈顶)就执行 push offset string "getbuf returned 0x%x/n" (0042001c)进行压栈,那此时栈顶一定是参数val,而它原来就在返回地址上面,因而我们可以通过设置buf[20]-buf[23]的值来覆盖 这个地方。
综上所述,%ebp的值为0x0012efa0,修改后的返回地址为0x004011D1,因而我们可以输入
00000000 00000000 00000000 a0ef1200 d1114000 efbeadde
这24个0可以输入别的,不影响,关键是后面24个数。