汇编与高级语言（插图结合Delphi代码，来自linzhengqun）

汇编与高级语言

1. 汇编基础知识

1.1. 寄存器

寄存器	用途
EAX，EBX，EDX，ECX	通用寄存器，由程序员自己指定用途，也有一些不成文的用法： EAX：常用于运算。 EBX：常用于地址索引。 ECX：常用于计数。 EDX：常用于数据传递。
EIP	指令寄存器，指出当前指令所在的地址。
ESP	栈指针，指向当前线程的栈顶。
EBP	栈基址指针，对调试起着很重要的作用。
EDI，ESI	没有规定作什么用，一般用在源指针和目标指针的操作。
FR	标志寄存器，由多个标志位组成，存放运算结果的标志，比如借位，进位，是否为0等等。
FS	在Windows中，FS:[0]用来指向异常处理机制的链接头。

说明：

l ESP和EBP对高级语言的函数实现起着非常重要的作用。

l FS是SEH（Structured Exception Handling）中起重要作用的一个段寄存器，它的0偏移指向异常结构连表的表头，Windows在进行结构化异常处理时，就是从FS:[0]开始遍历异常结构并调用其中的异常处理函数的。

1.2. 堆栈

堆是一块内存区域，一般用于内存的动态分配和释放，比如用New方法分配一个指针，此时即在程序地址空间的堆中分配了一块内存。又比如Delphi的对象也是在堆中创建的。

栈是一种先进后出的列表数据结构，在高级语言的编程中使用广泛，在低级语言中更是不可或缺的基础概念。栈也是一个内存区域，不过它具有快速灵活的特点，CPU直接提供指令去访问栈。

从汇编的角度来看，栈具有如下的性质：

l 栈有两个基础动作，压栈(PUSH)和出栈(POP)。

l 栈是向下增长的，即每压一次栈，栈顶的地址就减少一次，也可以说ESP的值就减小一次。

l 栈是线程相关的，每一个线程都拥有一个栈。

l 程序利用ESP可以很灵活地访问栈，不一定要执行PUSH和POP栈顶才会改变，直接操作ESP也可以改变栈顶，也就是说ESP决定了栈顶的值。

l 栈是有最大值的，通过编程环境可以设置，超出最大值就会发生栈溢出。

看一个简单的例子，下面的指令是一条压栈指令，意思是将EAX的值压入栈中：

PUSH EAX

根据上面的性质，这条指令等价于下面的指令：

SUB ESP, 4
MOV ESP, EAX

用下面的图表示指令的操作过程：

2. 调用规则

2.1. 从汇编的角度看函数调用

汇编语言没有变量的概念，因此对函数的调用，第一个要解决的问题是参数要如何传递，有的将参数放在栈中，有的将参数放在寄存器中，对于参数压栈的还要确定是从最左边的参数开始压栈，还是从最右边开始，所有这些，就构成了调用规则的内容。

第二个问题是函数如何被调用，其实很简单，就是一个跳转指令JMP，跳到函数的首地址去，并从那里开始执行指令。

比如下面的代码：

C := Add(10, 20);

按照上面的讨论，汇编代码应该如下：

MOV     EAX, 10
       MOV     EDX, 20
       JMP     @Add

现在我们又遇到另一个问题：函数执行完后如何返回？在调用Add函数时，执行点跳到函数里面去，但当函数执行完之后，执行点必须返回到C:=Add(10, 20)下面的语句，可是此时已经没有办法得到那个指令地址。为了解决这个问题，必须把 C := Add(10, 20)之后的指令地址保存起来，一般压到栈中是比较好的做法，汇编代码成了下面的样子：

MOV     EAX, 10
       MOV     EDX, 20
       PUSH     [EIP + Len]
       JMP     @Add

［EIP +LEN］就是JMP @Add的下一条指令的地址，现在当Add函数执行完毕后，只要在栈中找到这个地址，执行点就可以回来了。大概有人觉得函数调用实在是很常用的事情，于是干脆把最后两条指令合成一条，变成了Call，所以最后的汇编代码如下：

MOV     EAX, 10
       MOV     EDX, 20
       CALL @Add

接下来看看Add函数，函数执行完后怎么在栈中找到返回地址？解决这个问题的关键点就是栈平衡，不管函数对栈如何操作，但一定要保证在函数退出时栈现场和刚进来时的一样，这里包括栈顶和栈的内容一样。只要做到这一点，就可以确定在函数将返回时的栈顶值就是正确的返回值，我们只需要从栈顶弹出这个值，再执行一个跳转就行了。

假设它的代码是这样：

Function Add(a, b: Integer): Integer;
       begin
       Result := a + b;
       end;

那么汇编代码就是这样：

ADD      EAX, EDX
       POP        EDX
       JMP        EDX

同样后两个指令太常用了，因此合成一条，成了Ret，最后的汇编代码是这样的：

ADD EAX, EDX
RET

从汇编角度函数调用大概就是如此。

2.2. 调用规则

调用规则讨论的是函数的参数怎么传递，函数结果又是怎么返回，另外栈平衡由谁负责（函数本身或调用者）。下面就介绍几个比较常用的调用规则：

Register

Delphi默认的调用规则，效率非常高，但规则很复杂，下面是它的简要规则：

1. 头三个不大于4个字节（DWORD）的参数从左到右的传入EAX,EDX,ECX寄存器；接下去的参数按从左到右压栈。

比如函数：function Add1(I1: Byte; I2: Int64; I3: Integer; I4: Integer; I5: Integer): Integer;

用汇编来调用就是这样的：

var

I: Integer;

begin

//I := Add1(10, 20, 30, 40, 50);

asm

mov al, 10

push 0

push 20

mov edx, 30

mov ecx, 40

push 50

call Add1

mov I, eax

end;

2. 浮点数总压栈，不管它所占的字节是多少。

3. 对象方法总是有一个Self隐含参数，这个参数在所有的参数前面，即总是传给EAX。

比如一个类中有一个方法：function Add2(a, b: Integer): Integer;

用汇编调用如下所示：

var

I: Integer;

begin

//I := Add2(10, 20);

asm

mov eax, Self

mov edx, 10

mov ecx, 20

call Add2

mov I, eax

end;

4. 栈现场必须由函数自己清理。

Stdcall

Windows API的标准调用规则，效率不高，但规则很简单：

1. 参数总是从右向左地压栈。

比如，对于函数：function Add3(a, b: Integer): Integer; stdcall;

下在是调用的代码：

var

I: Integer;

begin

//I := Add3(10, 20);

asm

push 20

push 10

call Add3

mov I, eax

end;

2. 栈现场必须由函数自己清理。

Cdecl

这是C语言的标准调用规则，在Delphi中很少需要用到这种规则，但Delphi仍然提供了支持。

1. 与stdcall类似，参数总是从右向左地压栈。

2. 栈现场必须由调用者清理。

这就为可变参数提供了可能，举一个例子，C语言里面有一个运行时函数叫Sprintf，类似于Delphi的Format，C的声明如下：

int sprintf( char *buffer, const char *format [, argument] ... );

用Delphi的声明则是这样的：

function sprintf(buffer: PChar; const format: PChar): Integer; cdecl; varargs; external 'msvcrt.dll' name 'sprintf';

用Delphi可以这样调用：

var

S: string;

begin

SetLength(S, 30);

sprintf(PChar(S), '%s and %s are good friends', 'tom', 'jacky');

ShowMessage(S);

end;

是不是很神奇，函数声明明明只有两个参数，但调用的时候却可以传入任意多的参数，对函数本身来说，它并不知道参数有多少，因此是无法清理栈现场的，只有调用者知道有多少个参数，所以栈现场由调用者清理，下面是调用这个函数的汇编代码：

//sprintf(PChar(S), '%s and %s are good friends', 'tom', 'jacky');

push $00453d00

push $00453d10

push $00453d14

mov eax,[ebp-$04]

call @LStrToPChar

push eax

call sprintf

add esp,$10

Safecall

Safecall常用于COM，Delphi作了很多处理，使得函数返回值小于0时，自动抛出异常。

1. 任何Safecall函数，都可以转换成等价的Stdcall函数。

例1：

procedure Proc(); safecall;

Function Proc(): HResult; stdcall;

例 2：

Function func(): Integer; safecall;

Function func(out Re: Integer): HResult; stdcall;

问题：假设有一个Safecall的函数：function Add4(a, b: Integer): Integer; safecall;如何用汇编代码调用之？

1) 首先是将其转换成StdCall的声明：

function Add4(a, b: Integer; out Re: Integer): HRESULT; stdcall;

2) 按照Stdcall的调用规则调用：

var

I: Integer;

begin

//I := Add4(10, 20);

asm

lea eax, I

push eax

push 20

push 10

call Add4

end;

2. 函数返回时，Delphi自动检查其返回值，如果小于0，就引发reSafeCallError异常。

比如I := Add4(10, 20)这一句，实际的汇编代码是这样的：

lea eax,[ebp-$04]

Push eax

push $14

push $0a

call Add4

call @CheckAutoResult

CheckAutoResult是System单元的一个RTL函数，负责检查函数的返回结果：

function _CheckAutoResult(ResultCode: HResult): HResult;

begin

if ResultCode < 0 then

begin

if Assigned(SafeCallErrorProc) then

SafeCallErrorProc(ResultCode, Pointer(-1)); // loses error address

Error(reSafeCallError);

end;

Result := ResultCode;

end;

3. 栈框架(Stack Frame)

Stack Frame是一项非常有用的技术，特别是对于高级语言，可以说，如果没有Stack Frame，就没有Call Stack。

函数一般都有如下的汇编代码框架

begin

push ebp

mov ebp,esp

... ...

mov esp,ebp

pop ebp

end;

在调用push ebp，mov ebp, esp之后，栈的现场是这样的：

由此可知，对于每一个函数，EBP总是指向函数进入时的栈顶，那么上图中的“EBP的前一个值”应该就是调用该函数的上一级函数进入时的栈顶了，依此类推，最终将形成下面的图示：

上图实际上就形成了一个链表的结构，用下面的记录来表示：

PStackFrame = ^TStackFrame
       TStackFrame = Record
       Prev: PStackFrame;
       CallerAddr: Pointer;
       end;

也就是说，函数调用的同时也在增加这个栈框架链表。举一个例子，假设有A,B,C三个函数，A调用B，B调用C，则最终的栈框架链表如下图所示：

利用栈框架就可以实现调试里面的Call Stack。原理很简单，只要遍历StackFrame链表，根据CallerAddr获得每一个函数名。

下面是第一个例子，遍历StackFrame链表，并取出每一个CallerAddr：

procedure OutputCallStack(CallStackProc: TCallStackProc1); overload;

var

StackFrame: PStackFrame;

i: Integer;

begin

asm

MOV StackFrame, EBP

end;

if Assigned(CallStackProc) then

begin

i := 0;

while i < 10 do

begin

Inc(i);

CallStackProc(StackFrame^.CallerAddr);

StackFrame := StackFrame^.Prev;

end;

如果想获得每一个调用函数的详细信息，需要调试符号的帮助，下面一个例子利用生成的Map文件，也可以获得一些函数信息(需要JCLDebug的支持)：

procedure OutputCallStack(CallStackProc: TCallStackProc2); overload;

var

StackFrame: PStackFrame;

ProcName, UnitName: string;

Line: Integer;

begin

asm

MOV StackFrame, EBP

end;

if Assigned(CallStackProc) then

while True do

begin

ProcName := ProcOfAddr(StackFrame^.CallerAddr);

UnitName := ModuleOfAddr(StackFrame^.CallerAddr);

Line := LineOfAddr(StackFrame^.CallerAddr);

if UnitName <> '' then

CallStackProc(StackFrame^.CallerAddr, UnitName, ProcName, Line)

else

Break;

StackFrame := PStackFrame(StackFrame^.Prev);

end;

4. Move函数比较

我例出了四个Move函数的运行比较，旨在说明即使是汇编也有很大的速度差异。

System.Move请到System单元下查看；FastCode.Move到http://fastcode.sourceforge.net/下载，下面是MyMove_Assembly和MyMove_pascal的实现代码：

procedure MyMove_Pascal(const Source; var Dest; Count: Integer);

var

S, D: PChar;

I: Integer;

begin

S := PChar(@Source);

D := PChar(@Dest);

if S = D then Exit;

if Cardinal(D) > Cardinal(S) then

for I := count-1 downto 0 do

D[I] := S[I]

else

for I := 0 to count-1 do

D[I] := S[I];

end;

procedure MyMove_Assembly(const Source; var Dest; Count: Integer);

asm

{ EAX Pointer to source }

{ EDX Pointer to destination }

{ ECX Count }

CMP EAX, EDX

JZ @endProc

PUSH EDI

PUSH ESI

PUSH ECX

CMP EAX, EDX

JL @DownLoop

@UpLoop:

MOV ESI, EAX

MOV EDI, EDX

REP MOVSB

JMP @exit

@DownLoop:

LEA ESI, [EAX + ECX - 1]

LEA EDI, [EDX + ECX - 1]

STD

REP MOVSB

CLD

@exit:

POP ECX

POP ESI

POP EDI

@endProc:

end;

下面是运行结果的比较：

i. 未钩选优化指令的情况：

ii. 钩选优化指令的情况：

根据上面的结果，我得出了下面的结论，并有下面的建议。

结论：

① 未优化的Pascal代码与优化的汇编代码效率相差为45倍。

② 优化的Pascal代码与优化的汇编代码效率相差为20倍。

③ 优化的Pascal代码与未优化的汇编代码效率相差为2.9位。

④ 未优化的汇编代码与优化的汇编效率相差为7倍。

建议：

① 对于应用程序员来说，除非遇到效率要求非常高的地方，否则尽量不要写汇编代码，因为经过优化的高级语言效率已经非常高。

② 理解汇编与高级语言的关系，能够通过查看汇编代码解决困难的问题。

http://blog.csdn.net/linzhengqun/article/details/1688690

相关阅读:
使用百度网盘配置私有Git服务
Linked dylibs built for GC-only but object files built for retain/release for architecture x86_64
我的博客搬家啦！！！
今日头条核心业务（高级）开发工程师，直接推给部门经理，HC很多，感兴趣的可以一起聊聊。
学习Python的三种境界
拿到阿里，网易游戏，腾讯，smartx的offer的过程
关于计算机网络一些问题的思考
网易游戏面试经验(三)
网易游戏面试经验(二)
网易游戏面试经验(一)

原文地址：https://www.cnblogs.com/findumars/p/5293995.html