• PE格式第六讲,导出表


                    PE格式第六讲,导出表

    请注意,下方字数比较多,其实结构挺简单,但是你如果把博客内容弄明白了,对你受益匪浅,千万不要看到字数多就懵了,其实字数多代表它重要.特别是第五步,

    各种表中之间的关系.

    作者:IBinary
    出处:http://www.cnblogs.com/iBinary/
    版权所有,欢迎保留原文链接进行转载:)

    一丶浅谈导入表

    首先,导出表我们已经学过了,作用就是在程序加载的时候,把自己要调用的API的地址,不断地填写到IAT表中

    不过我们要知道三个概念,

    1.程序运行的时候,导入表直接把调用的API地址填写到IAT表格中

    2.程序运行的时候,用到那个API,才会填写到IAT表中(延时加载技术,下面讲解)

    3.程序还没运行的时候,在PE中函数的地址就已经写死了.

    何为延时加载

    我们知道,如果你写的API有几万个,那么一开始就填写到IAT表格中,那么你的程序会很慢.

    那么就会使用延时加载表(也是数据目录中的)那么用到那个,才填写.

    可以查看结构体(数据目录的结构体)下面可以找到这个表格.这个就是延时加载表

    二丶何为导出表?

    导出表,作用就是我们写的DLL或者EXE导出的函数,那么会记载这些函数.作用就是这个

    那么是你自己设计导出表,你要怎么设计.

    按照我的思路:

    1.我会设计一个  入口地址表(RVA存贮,用来计算模块 + 入口地址的RVA等于函数地址)

    2.我还会设计一个 保存函数名字的表

    3.我还会设计一个,保存序号的表

    大体就怎么多.

    因为你想,我们如果要保存一个导出函数,并且还有调用它,是不是需要保存函数名字,但是因为导出的时候还要有序号导出,那么是不是要保存序号,不光保存序号,我们是不是还要通过一定手段让模块地址+偏移寻到函数位置.

    表格设计大体流程

    EntryPoint  里面保存RVA(入口地址表)

    order   序号表格保存序号的

    FunctionName  函数名称表

    当然,函数导出的时候可能还会有记录个数的

    那么看下具体的结构体是怎么样子的吧.

    不出意外就会和我们的表设计的差不多.

    typedef struct _IMAGE_EXPORT_DIRECTORY {
        DWORD   Characteristics;     //标志,未用
        DWORD   TimeDateStamp;      //时间
        WORD    MajorVersion;        //主版本
        WORD    MinorVersion;        //副版本
        DWORD   Name;             //指向导出表文件名的字符串
        DWORD   Base;            //导出函数的起始序号
        DWORD   NumberOfFunctions;    //所有导出函数的个数
        DWORD   NumberOfNames;      //以函数名导出的函数个数
        DWORD   AddressOfFunctions;     // 导出函数地址表RVA(入口地址)
        DWORD   AddressOfNames;         // 函数名称地址表RVA(名称表)
        DWORD   AddressOfNameOrdinals;  // 函数序号地址表(序号表)
    } IMAGE_EXPORT_DIRECTORY, *PIMAGE_EXPORT_DIRECTORY;

    可以看出,确实是差不多的.

    那么看下这里的重要成员

    1.执行导出表文件名的字符串

    2.base 导出函数的起始序号

    3.导出函数地址表RVA

    4.函数名称地址表RVA

    5.函数序号地址表

    这里我们随便找个DLL,使用010模版,看下结构到底怎么存储的(先要定位)

    三丶定位导出表

    1.找出导出表RVA偏移

    首先,我们要在数据目录里面查看DLL的第一项,也就是导出表的地址的RVA偏移是多少.

    可以看出,是4820的RVA偏移,大小是84个字节

    2.判断属于哪一个节

    既然知道是4820了,那么节中的虚拟地址肯定是40开头的.小于50的  因为4820 > 40开头, < 50开头

    首先第一个节.text

    4096代表了1000h,肯定不是,相差太远.

    第二个节.radata

    是40开头的,那么就是了

    3.算出FOA位置

    既然知道是.radata节中的,那么直接算出FOA(简称FA)的位置即可

    RVA = 4820

    FA = RVA - 节虚拟地址(上面找的4000h) + 上面找的节的文件偏移大小

    文件偏移截图:

    公式代入得到:

    FA = 4820 - 4000 + 4000

    FA = 4820

    通过计算,我们发现还是4820的位置,为什么这么巧?

    原因是虚拟地址和文件偏移位置存储都是一样的.所以记录的RVA则是在文件中的位置.

    4.通过FA找到导出表位置

    我们得到FA是4820,那么我们使用010 Editer中的ctrl + G的功能,快速定位位置.

    我们选中了84个字节,那么这84个字节则是导出表的大小了,在数据目录中有记录导出表的大小,所以直接定位即可.

    四丶导出表的存储方式

    1.第一部分讲解

     

    截图一下截取太多,不好讲解,这里截取一部分,下面接着截取4840下面的

    首先,黑色方块中的无用不重要,所以不讲解.

    红色方块第一个: 成员NAME  这个是一个RVA的偏移,指向了DLL的名称,可以的同学,可以看下4860(因为RVA是4860,但是虚拟地址和文件偏移是一样的,所以现在的情况是FA = RVA,不用转换了)的位置,是不是DLL的名称,以0结尾

    红色方块第二个,base成员,起始的导出序号,这个很重要,一会讲解

    红色方块第三个,这个我直接把两个4字节弄在一起来,要分开来看,  第一个四个字节,3,表示了所有导出函数是3个(函数名字,或者序号导出都计算)

    第二个四个字节: 显示2,表示了按照名字导出的函数有两个.

    红色方块第四个: 这个重要了.存放的是函数的地址表.

    如果会看FA位置的同学请看. 存放的00001000 第一个函数地址偏移 第二个函数地址偏移  00001020  第三个函数地址偏移00001040

    为什么存放的是函数地址偏移,因为这个是个DLL,加载到程序的时候,DLL模块不固定,所以比如存放偏移

    这样就可以通过  ImageBase + 偏移,定位导出函数的地址了.

    所以现在大家应该知道为什么GetprocAddress(模块,函数名)为什么要给模块了吗? 就是要通过模块+偏移的位置定位导出函数地址调用

    2.第二部分讲解

    首先,讲解第二部分之前,我们要把第一部分的存储信息截图下来,方便对照查看.

    第二部分截图:

    可以看出,我画了4个颜色的方框

    看法: 黄色对应着橘黄色

    深红色,对应着绿色

    首先黄色方块: 代表的函数名称的表,指向函数名称的字符串位置 RVA,通过转化(FA = RVA)得出4854的位置是指向字符串的位置.

    那么就会指导橘黄色的开头位置了,也就是4854的位置,但是注意一下,因为导出的函数,函数名字是不固定的,那么其实函数名称表执行的这个区域还是一个偏移.

    而这个偏移,才真正的指向了函数名称的字符串(注意,0结尾)可边长的.

    那么486A的位置就是 导出函数的名称了.  也就是fun1

    橘黄色有两个4字节,第一个RVA偏移,是指向了fun1的函数名字,那么第二个就是指向了fun2的名字,那么由此可以得出,按照名字导出,我们总共得到了两个字符串.(fun1,和fun2)

    深红色位置:

    深红色位置指向了一个偏移,这个偏移也就是绿色方框的开头,分为2个字节2个字节

    那么绿色是2个2个字节.

    这个深红色位置,就是序号表的RVA偏移,我们知道DLL导出可以是序号导出,那么这个地方就是存储的是序号.

    导出函数的时候,默认不写序号,则对应的是从0开始,0 1 2 3顺序排列,这里导出了2个函数,那么对应就有两个序号,分别是0和1

    通过上面讲解,基本了解了导出表的存储格式,但是下面的讲解,才会真正的重要.

    五丶BASE成员,导出序号,函数导出,以及函数地址表之间的关系

    1.函数名称,序号表,以及和函数地址表中的关系

    首先我们要知道,DLL的导出函数可以按照序号导出,也可以按照函数名字导出,但是怎么和函数地址表关联起来那?

    首先,我们先看不按照序号导出,按照函数名字来获取函数的地址(函数地址表中)

    上面我们分析过了

    我们会需要函数名字,入口地址,以及序号,而下面的结构体也正好应验了.

    那么重新写一下

    EntryPoint (可以理解为函数地址表,存放的是导出函数的地址)

    那么刚才我们看了,有三个

    00001000  fun1的偏移

    00001020  fun2的偏移

    00001040  fun3的偏移,只不过没有名字

    Order  序号表格

    0      fun1的默认序号

    1      fun2的默认序号

    FunctionName (函数名称表格)

    fun1

    fun2

    首先关系是这样的,我们通过fun1的字符串,去查找序号表,通过序号表则找到偏移了.

    比如我们要加载 fun1,那么fun1的序号表中默认是0位置,所以找到的序号0了,也就是第一项(注意,序号表可以理解为Switch(序号))然后0位置存放的就是函数地址表,也就是000010000

    那么就得出了fun1的RVA偏移了

    那么现在知道一个完整的GetprocAddress(模块,函数名)是怎么运行的了吧

    首先,模块肯定是要知道的,

    函数名字给了,那么去序号表中看是第几项,找到序号表中的对应第几项,那么就去函数地址表中寻得第几项,那么正好就得出偏移了

    那么现在模块 + 偏移,正好找出导出函数 fun1的地址了.

    2.Base,序号表之间的关系

    首先我们重新编译下DLL,这次是按照序号导出

    可以看出,我们默认指定的fun1的序号是1,fun2是2,fun3是3

    那么为什么序号表中是0 1 2 那?

    原因是这样的

    1.如果我们通过函数名字查找,比如找fun1,那么序号就是0,也就是第一项,那么通过0就可以找到fun1的偏移了

    2.如果我们通过序号查找,比如我们输入3,我们要调用fun3了,那么这个时候,序号表中根本就没有3,怎么办?

    此时Base成员的作用就来了,它默认是1,那么我们输入3序号的时候,会减去base的值,得出的下标,再去序号表中查找.

    那么3 - 1 = 2,2当做下标去序号表中查找,找到了第三项,也就是02了,通过02找fun3的偏移,也是对的.

    所以现在是由两种方式,

    第一种就是名字导入,fun1默认不加序号就是从0开始的,去序号表中查0就能找到偏移.

    第二种就是专门按照序号导入的,那么此时你输入的序号-base才真正的是函数的偏移了.

     作者:IBinary
    出处:http://www.cnblogs.com/iBinary/
    版权所有,欢迎保留原文链接进行转载:)

  • 相关阅读:
    sqli-labs学习(less-5-less-7)
    sqli-labs学习(less-1-less-4)
    Dotspatial 要素重叠部分去除
    Dotspatial 要素重叠分析
    Dotspatial 空间要素选择
    DotSpatial 创建面状要素——含空洞
    DotSpatial 删除图层要素
    Dotspatial 创建面状图层
    Windows提权工具 CVE-2019-1405 & CVE-2019-1322
    C#操作码: .NET版“ShellCode”编写
  • 原文地址:https://www.cnblogs.com/iBinary/p/7684858.html
Copyright © 2020-2023  润新知