20145201李子璇《网络对抗》逆向及Bof基础实践
实践目标
-
本次实践的对象是一个名为pwn1的linux可执行文件。
-
该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串。
-
该程序同时包含另一个代码片段,getShell,会返回一个可用Shell。正常情况下这个代码是不会被运行的。我们实践的目标就是想办法运行这个代码片段。
-
本次试验将学习两种方法
①利用foo函数的Bof漏洞,构造一个攻击输入字符串,覆盖返回地址,触发getShell函数。
②手工修改可执行文件,改变程序执行流程,直接跳转到getShell函数。
这几种思路,基本代表现实情况中的攻击目标(1)运行原本不可访问的代码片段(2)强行修改程序执行流(3)以及注入运行任意代码。
基础知识
-
熟悉Linux基本操作,能看懂常用指令,如管道(|),输入、输出重定向(>)等。
-
理解Bof的原理。
-
能看得懂汇编、机器指令、EIP、指令地址。
-
会使用gdb,vi。
本次实践知识点总结
1.掌握NOP, JNE, JE, JMP, CMP汇编指令的机器码(1分)
①NOP:NOP指令即“空指令”。执行到NOP指令时,CPU什么也不做,仅仅当做一个指令执行过去并继续执行NOP后面的一条指令。
②JNE:条件转移指令,如果不相等则跳转。
③JE:条件转移指令,如果相等则跳转。
④JMP:无条件转移指令。
⑤CMP:比较指令,功能相当于减法指令,只是对操作数之间运算比较,不保存结果。cmp指令执行后,将对标志寄存器产生影响。其他相关指令通过识别这些被影响的标志寄存器位来得知比较结果。
2.掌握反汇编与十六进制编程器(1分)
反汇编指令:objdump -d xxx
将显示模式切换为16进制模式:%!xxd
转换16进制为原格式:%!xxd -r
3.掌握可执行文件的基本格式(2分)
4.掌握缓冲区溢出攻击的原理(1分)
通过往程序的缓冲区写超出其长度的内容,造成缓冲区的溢出,从而破坏程序的堆栈,使程序转而执行其它指令,以达到攻击的目的。造成缓冲区溢出的原因是程序中没有仔细检查用户输入的参数。
实践过程
方法一:直接修改程序机器指令,改变程序执行流程
将目标文件20145201pwn1,反汇编。
其中最核心的几行代码,如下:
0804847d <getShell>:
804847d: 55 push %ebp
...
08048491 <foo>:
8048491: 55 push %ebp
...
080484af <main>:
...
80484b5: e8 d7 ff ff ff call 8048491 <foo>
80484ba: b8 00 00 00 00 mov $0x0,%eax
...
-
"call 8048491 "是汇编指令,是说这条指令将调用位于地址8048491处的foo函数;其对应机器指令为“e8 d7ffffff”,e8即跳转之意。本来正常流程,此时此刻EIP的值应该是下条指令的地址,即80484ba,但一解释e8这条指令呢,CPU就会转而执行 “EIP + d7ffffff”这个位置的指令。“d7ffffff”是补码,表示-41,41=0x29,80484ba +d7ffffff= 80484ba-0x29正好是8048491这个值,main函数调用foo,对应机器指令为“ e8 d7ffffff”,那我们想让它调用getShell,只要修改“d7ffffff”为,"getShell-80484ba"对应的补码就行。用Windows计算器,直接 47d-4ba就能得到补码,是c3ffffff。
-
下面我们就修改可执行文件,将其中的call指令的目标地址由d7ffffff变为c3ffffff。
-
再反汇编看一下,call指令是否正确调用getShell
-
运行下改后的代码,会得到shell提示符#
方法二:通过构造输入参数,造成BOF攻击,改变程序执行流
-
反汇编,了解程序的基本功能
-
确认输入字符串哪几个字符会覆盖到返回地址
这里选择用1111111122222222333333334444444455555555来进行测试比较容易识别出来。
根据上图我们就可以知道,堆栈上的返回地址已经被5555覆盖。但之前我们输入了八个5,下面就要具体分辨出具体时间哪4个。
于是将“55555555”改为“12345678”进行具体分析:
如果输入字符串1111111122222222333333334444444412345678,那 1234 那四个数最终会覆盖到堆栈上的返回地址,进而CPU会尝试运行这个位置的代码。那只要把这四个字符替换为 getShell 的内存地址,输给pwn1,pwn1就会运行getShell。 -
确认用什么值来覆盖返回地址
getShell的内存地址,在未启用ALSR的主机上是固定不变的,通过反汇编时可以看到,即0804847d。
对比之前 eip 0x34333231 0x34333231 ,正确应用输入 "11111111222222223333333344444444x7dx84x04x08 " (小端) -
构造输入字符串
由于我们没法通过键盘输入x7dx84x04x08这样的16进制值,所以先生成包括这样字符串的一个文件。x0a表示回车,如果没有的话,在程序运行时就需要手工按一下回车键。
可以使用16进制查看指令xxd查看input文件的内容是否如预期。
然后将input的输入,通过管道符“|”,作为pwn1的输入。