• x86_64汇编基础


    1、AT&T格式汇编

    在 Unix 和 Linux 系统中,更多采用的还是 AT&T 格式,两者在语法格式上有着很大的不同:

    1. 在 AT&T 汇编格式中,寄存器名要加上 '%' 作为前缀;而在 Intel 汇编格式中,寄存器名不需要加前缀。例如:

      AT&T 格式Intel 格式
      pushl %eax push eax
    2. 在 AT&T 汇编格式中,用 '$' 前缀表示一个立即操作数;而在 Intel 汇编格式中,立即数的表示不用带任何前缀。例如:

      AT&T 格式Intel 格式
      pushl $1 push 1
    3. AT&T 和 Intel 格式中的源操作数和目标操作数的位置正好相反。在 Intel 汇编格式中,目标操作数在源操作数的左边;而在 AT&T 汇编格式中,目标操作数在源操作数的右边。例如:

      AT&T 格式Intel 格式
      addl $1, %eax add eax, 1
    4. 在 AT&T 汇编格式中,操作数的字长由操作符的最后一个字母决定,后缀'b'、'w'、'l'分别表示操作数为字节(byte,8 比特)、字(word,16 比特)和长字(long,32比特);而在 Intel 汇编格式中,操作数的字长是用 "byte ptr" 和 "word ptr" 等前缀来表示的。例如:

      AT&T 格式Intel 格式
      movb val, %al mov al, byte ptr val
    5. 在 AT&T 汇编格式中,绝对转移和调用指令(jump/call)的操作数前要加上'*'作为前缀,而在 Intel 格式中则不需要。
    6. 远程转移指令和远程子调用指令的操作码,在 AT&T 汇编格式中为 "ljump" 和 "lcall",而在 Intel 汇编格式中则为 "jmp far" 和 "call far",即:

      AT&T 格式Intel 格式
      ljump $section, $offset jmp far section:offset
      lcall $section, $offset call far section:offset

      与之相应的远程返回指令则为:

      AT&T 格式Intel 格式
      lret $stack_adjust ret far stack_adjust
    7. 在 AT&T 汇编格式中,内存操作数的寻址方式是

      section:disp(base, index, scale)

      而在 Intel 汇编格式中,内存操作数的寻址方式为:

      section:[base + index*scale + disp]

      由于 Linux 工作在保护模式下,用的是 32 位线性地址,所以在计算地址时不用考虑段基址和偏移量,而是采用如下的地址计算方法:

      disp + base + index * scale

      下面是一些内存操作数的例子:

      AT&T 格式Intel 格式
      movl -4(%ebp), %eax mov eax, [ebp - 4]
      movl array(, %eax, 4), %eax mov eax, [eax*4 + array]
      movw array(%ebx, %eax, 4), %cx mov cx, [ebx + 4*eax + array]
      movb $4, %fs:(%eax) mov fs:eax, 4
     

    2、寄存器

    X84中原有8个32位通用寄存器%eax,%ebx,%ecx,%edx,%esi,%edi,%ebp,%esp, 在X86_64中

    分别被扩展为64位,并且多了8个寄存器。因此X86_64的寄存器如下:

    • rax, eax, ax, ah, al;
    • rbx, ebx, bx, bh, bl;
    • rcx, ecx, cx, ch, cl;
    • rdx, edx, dx, dh, dl;
    • rsi, esi, si;
    • rdi, edi, di;
    • rbp, ebp;
    • rsp, esp;
    • r8-r15;

    GCC中对这些寄存器的调用规则如下:

    • %rax 作为函数返回值使用。
    • %rsp 栈指针寄存器,指向栈顶
    • %rdi,%rsi,%rdx,%rcx,%r8,%r9 用作函数参数,依次对应第1参数,第2参数。。。
    • %rbx,%rbp,%r12,%r13,%14,%15 用作数据存储,遵循被调用者使用规则,简单说就是随便用,调用子函数之前要备份它,以防他被修改
    • %r10,%r11 用作数据存储,遵循调用者使用规则,简单说就是使用之前要先保存原值

    3、栈帧

    以一个简单的add函数为例:

     1 #include <stdio.h>
     2 
     3 int add(int a, int b)
     4 {
     5     return a + b;
     6 }
     7 
     8 int main(void)
     9 {
    10     int c, a = 1, b = 2;
    11 
    12     c = add(a, b); 
    13 
    14     return c;
    15 }

    编译并反汇编,

    1 scripts$ gcc -g test.c -o test
    2 scripts$ objdump -S -d test > test.s
    3 scripts$ vim test.s
     1 0000000000400474 <add>:
     2 #include <stdio.h>
     3 
     4 int add(int a, int b)
     5 {
     6   400474:   55                      push   %rbp
     7   400475:   48 89 e5                mov    %rsp,%rbp
     8   400478:   89 7d fc                mov    %edi,-0x4(%rbp)
     9   40047b:   89 75 f8                mov    %esi,-0x8(%rbp)
    10     return a + b;
    11   40047e:   8b 45 f8                mov    -0x8(%rbp),%eax
    12   400481:   8b 55 fc                mov    -0x4(%rbp),%edx
    13   400484:   8d 04 02                lea    (%rdx,%rax,1),%eax
    14 }
    15   400487:   c9                      leaveq 
    16   400488:   c3                      retq   
    17 
    18 0000000000400489 <main>:
    19 
    20 int main(void)
    21 {
    22   400489:   55                      push   %rbp
    23   40048a:   48 89 e5                mov    %rsp,%rbp
    24   40048d:   48 83 ec 10             sub    $0x10,%rsp
    25     int c, a = 1, b = 2;
    26   400491:   c7 45 f8 01 00 00 00    movl   $0x1,-0x8(%rbp)
    27   400498:   c7 45 fc 02 00 00 00    movl   $0x2,-0x4(%rbp)
    28 
    29     c = add(a, b); 
    30   40049f:   8b 55 fc                mov    -0x4(%rbp),%edx
    31   4004a2:   8b 45 f8                mov    -0x8(%rbp),%eax
    32   4004a5:   89 d6                   mov    %edx,%esi
    33   4004a7:   89 c7                   mov    %eax,%edi
    34   4004a9:   e8 c6 ff ff ff          callq  400474 <add>
    35   4004ae:   89 45 f4                mov    %eax,-0xc(%rbp)
    36 
    37     return c;
    38   4004b1:   8b 45 f4                mov    -0xc(%rbp),%eax
    39 }

    从32、33行可知,edi<- a,  esi<- b, 然后 call add,此时main函数中的栈帧结构如下(某个寄存器为x,则xH表示高4位):

    然后跳入add中执行:

    从4-12行完毕,eax存储b, edx存储a, 此时整体的栈帧结构:

    之后是指令:

    lea    (%rdx,%rax,1),%eax

    lea是load effective address,加载有效地址,类似于C语言中的“&”取地址符的作用,本例中是将 rdx + rax * 1 ==> eax, 即 eax = a + b,

    然后rax自动作为返回值。

  • 相关阅读:
    PHP7 开启Zend Opcache
    swoole笔记之 主服务器swoole_websocket_server, 监听 tcp端口 ,任务投递, http请求
    Navicat 远程连接docker容器中的mysql 报错1251
    nginx配置后访问不了问题
    解决每次git pull需要输入用户名密码的问题
    论文阅记 EfficientDet: Scalable and Efficient Object Detection
    Tensorflow bug(一) ValueError The passed save_path is not a valid checkpoint
    论文阅记 MobileNetV3:Searching for MobileNetV3
    论文阅记 MnasNet: Platform-Aware Neural Architecture Search for Mobile
    论文阅记 MobileNetV2:Inverted Residuals and Linear Bottlenecks
  • 原文地址:https://www.cnblogs.com/ym65536/p/4542646.html
Copyright © 2020-2023  润新知