• 逆向知识第七讲,三目运算符在汇编中的表现形式,以及编译器优化方式


    ---恢复内容开始---

                      逆向知识第七讲,三目运算符在汇编中的表现形式

    一丶编译器优化方式

    首先说一下编译器优化方式.

    1.常量折叠

    2.常量传播

    3.复写传播

    4.公共表达式

    5.去掉不可达到分支

    6.顺序代替分支

    7.数学变化

    8.代码外提

    9.减少变量.

    10 强度削弱.

    优化方式解析

    1.常量折叠

      常量折叠已经讲过, 就是两个常量相加  8 + 8 ,那么在编译前期就能计算出来.

    2.常量传播

      当一个变量,没有对齐进行写入或者更改的时候,这个时候可以当做常量.(优化为常量)

    3.复写传播

      这个需要好好说说了,我们都知道,C语言中,C调用约定都需要平栈.比如你调用完毕一个printf,那么就需要平栈.

         而优化的时候,直接一起平栈了.

    就比如:

      int i = (a * a + b);

      int j = i * 5;

    那么此时可以变成  int j = (a * a + b) * 5 ;这样就会省掉一个变量(当然和去除变量不一样)

    call addr

    add esp,8

    call  addr

    add esp,8

    此时汇编代码可以变成

    call addr 

    call addr

    add esp,16   这样就省掉了一个add 指令了.

    4.公共表达式

    公共表达式和复写传播有点不一样.(看着是相反的.但是不能说是相反的.)

    比如 int i = (a *a * b) * 7;

      int j = (a * a * b) * 7 * 3

    优化之后变成.

    int j = i * 3;

    什么是公共表达式,就是说,表达式用的都是一样的.重复使用,这样的时候,可以使用变量来存着了.或者中专一个寄存器保存其结果.

    这样效率会很快,不用重新计算了.

    5.去掉不可达到分支

    这个应该很好理解.

    if(1)
    {
        ......
    }
    else
    {
        .....  
    }

    此时if语句会成立,而else永远不会成立,那么编译器优化的时候就可以去掉else语句了.

    6.顺序代替分支

    这个下方讲解三木运算符的时候可以明白.

    7.数学变化

    这也很好理解.

    3a + 5a

    那么此时可以变为一条表达式计算直接变成8a

    8.代码外提

    也很好理解.

    for (int i = 0; i < (argc / 3);i++)
    {
                
        ..............
        //中间没有使用argc变量  
    }

    中间没有使用argc变量.

    那么此时优化的时候,可能会用寄存器,也或者会用一个局部变量保存  (argc / 3)

    int j = (argc / 3);

    那么此时for循环的条件变成了  i < j即可.

    这样就不用每次循环一遍就计算一遍(argc / 3)了.

    9.减少变量.

    定义的变量没有使用,优化的时候自然就会消失了.(减少空间)

    10 强度削弱.

    很好理解.我们都知道除法的指令周期很长.所以前边讲解除法的时候各种套路,各种数学定理各种公式.

    目的是什么,目的就是为了让指令周期缩短一点.

    强度削弱指的就是,当时用高指令周期的指令的时候,可不可以使用低指令周期完成高指令周期做的事情.

    比如说:

      一个DIV指令是100指令周期(当然你可以想象成100秒)

    那么一个移位是10个指令周期

    此时我计算  一个公式  n  / 4;

    那么可以变成

    mov eax,[ebp - xxx]

    sar  eax,2

    也完成了DIV的作用.  如果看做是100秒时间,那么我们只用了10^n秒(n的取值看上面的指令,比如mov,占4个指令周期,举个例子,那么合起来才14个指令周期)

    二丶三木运算符在汇编中的表现形式

    高级代码:

    #include "stdafx.h"
    #include "MyClass.h"
    
    int main(int argc, char* argv[])
    {
        unsigned int nVar_4 = 5;
        scanf("%d", &nVar_4);
        printf("%d
    ", argc == 0 ? 0 : -1);              第一种表达方式,判读为零还是为1的情况
        
        printf("%d
    ", argc > 9 ? argc*nVar_4 : nVar_4/argc);   第二种表达方式,无法优化的表达方式.
        
        printf("%d
    ", argc == 9 ? 35 : 98);             第三种表达方式,利用0和-1来运算
        printf("%d
    ", argc >= 9 ? 35 : 98);             第四种表达方式,指令支持
    }

    1.三木运算符第一种表达形式.

    有用的汇编代码就4行.

    1.变量给寄存器保存.

    2.寄存器内容求补码

    3.带进位的减法.

    首先说下什么意思.

    这里是无分支三木运算

    neg的意思就是求补, 但是运算的时候是 ecx = 0 - ecx值.

    neg只有 0 - 0的时候才不会借位. 

    还原代码要从三方面考虑

    为零的情况下

    为零的时候,neg 一下,那么其结果还是 0,CF位没有借位.

    还原代码为:

    if(argc == 0)
    {
         ecx  = 0;  
    }

    为负数的时候:

    如果为负数的时候,那么

    neg一下,其结果是 0 - 负数 (CF借位,则置位1)

    sbb  负数- 负数 -  CF   结果是-1

    还原代码为:

      

    if(argc < 0)
    {
        ecx = -1;
      
    }

    为正数的情况下

    如果是正数

    neg一下  0 - 正数 = 负数, 那么CF借位了,其结果是1

    sbb一下.  负数- 负数 - CF   其结果是 -1  (负数- 负数= 0,0 - CF(1) = -1)

    还原代码:

      

    if(argc > 0)
    {
       ecx == -1;  
    }

    总结上面方面情况还原得出其还原代码为.

    if(argc < 0) ecx = -1;
    if(argc ==0) ecx = 0;
    if(argc > 0) ecx = -1;

    如果转化为三木运算符,这个就看自己爱怎么转化了

    比如:

      argc ==0 ? 0 : -1

    a ?  b :c 以后分为a b c讲解,a代表表达式和条件 ,b和C代表其结果.

    其中,这种优化方式,则是顺序优化.也就是上面没说的.结果之后有一方成立

    2.三木运算符的第二种表达方式

     高级代码:

     printf("%d
    ", argc > 9 ? argc*nVar_4 : nVar_4/argc);
    这个代码,无法优化,因为不知道变量是多少.
    看下汇编代码把.

    这个很简单了.

    1.局部变量给寄存器保存.

    2.和9比较

    3.小于怎么怎么做

    4.大于怎么怎么做.

    3.三木运算符的高级汇编表示,利用0和-1

    高级代码:

    printf("%d
    ", argc == 9 ? 35 : 98);
    对应汇编代码:

    这个汇编代码要分为两部分看,三部分代入.

    1.相等的情况下怎么走

    2.大于的时候怎么走

    3.小于的时候怎么走.

    1.相等的时候怎么走(属于代入)

    看第一部分代码:

    看上面汇编代码解析

    这里的esi是argc变量,因为上下文关系,所以变量的值已经在esi保存了。

    现在我们带入走汇编指令

    当esi == 9的时候

    第二句   sub edx,9  (结果为0)

    第三句   neg edx    (0 - 0 还是0)

    第四句   sbb edx,edx (0 - 0 - CF, 此时因为neg所以CF = 0 所以就是 0 - 0 - 0 还是0

    接着看下方第二部分代码

    为零的时候,edx 走到and之后,还是0

    然后接着add 那么其结果是23h

    由此还原汇编代码:

      

    if(argc == 9) edx = 23h

    2.大于的时候怎么走

     

    还是同上

    1.如果> 9,那么 sub后结果是正数

    2.neg之后. 0 - 正数= 负数  (0 - 正数的时候,借位了,所以CF位是1)

    3.sbb 之后 负数- 负数 = 0, 然后- CF位 = -1;

    4.如果是-1,那么and之后其结果是3FH

    5.接着add之后其结果是 (3fh + 23h)

    还原代码:

      

    if (argc > 9) edx = (3fh + 23h)

    3.小于的时候怎么走

    1.sub之后, 结果为负数

    2.neg之后( 0 - 负数 = 取负数的绝对值(负负得正),有借位,所以CF = 1)

    3.sbb 之后, 正数- 正数 - CF = 正数- 正数 - 1 = -1;

    4.结果为-1,那么and起作用

    5,执行add,加23h

    还原代码:

      

    if (argc < 9) edx = (0c1h + 23h)

    综上条件,换成三目运算其结果是:

      

    if(argc < 9) edx = 3fh + 23h
    if(argc ==9)edx = 23h
    if(argc > 9) edx = (3fh + 23h)

    那么可以还原成:

      argc == 9 ? 23h : 62h

    注意这里的3Fh,这里的3Fh,是 c - b (如果条件取反,那么则是b-c)的结果.

    四丶指令支持版本

    高级代码:

    printf("%d
    ", argc >= 9 ? 35 : 98);
    汇编代码:
      
    注意,esi还是 argc的值
    这里出现了新的指令 setl指令,这属于set系列
    和条件跳转指令一样
    比如 jns jle(小于等于) jge(大于等于) ....
    这里setl l代表小的意思也就是小于
    那么就很简单了.
    1.局部变量和9比较
    2.如果小于9,则al设置为1
    3.dec相减,结果为0
    4.根据0和非0的值去and,如果为零,则 and al 0c1h则没用
    5.最后add即可.
    也是三部分代入,这里和上面类似.我直接代入还原代码.
    但是需要注意,这里是如果小于则会设置al,那么就是小于的时候会走一个,而大于或者等于,其结果有不一样.

    小于的情况下:
      1.和9比较
      2.小于9,al设置为1
      3.dec eax, 1 - 1 = 0;结果为零.
      4.为零,那么and执行之后还是0
      5.执行add
    还原代码:
      根据上面得知,小于9 会执行 add
    if(argc < 9) reg32 = 62h

      大于或者等于的情况下.

    1.和9比较,大于9

    2.大于9,则al不设置,结果为0

    3.dec eax, 0 - 1 = -1,其结果变成-1,也就是FFFFFFFF

    4.结果为-1,则and成立,其结果变为0C1H

    5.add eax,62 紧接着加上其结果

    还原代码

      

    if(argc >=9) reg32 = (c1 + 62h)注意这里会进位的.

    综上所述,可以得出:

      

    if(argc < 9) reg32 = 62h
    if(argc >= 9)reg32 = (0c1h + 62h);

    (0c1h + 62)然后看结果,后八位(因为我们是32位系统)其结果是35

    还原三目运算符为:

      argc >= 9 ? 35:98

      

     
  • 相关阅读:
    IEnumerable<T>接口主要成员
    SQL LinqToSql Lambda QA
    css网页布局兼容性有哪些要点与诀窍
    【转】解决大量图片造成的页面延迟
    C# override,new 的区别+C# 接口的显示实现和隐示实现
    ap_invoice_distributions_all到xla_ae_lines
    Mysql从索引原理对SQL分析优化实战
    如何实现IM表情、图片、文件之间的通讯?
    五步教你如何使用k8s快速部署ES
    ClickHouse MergeTree引擎的简单介绍
  • 原文地址:https://www.cnblogs.com/iBinary/p/7824555.html
Copyright © 2020-2023  润新知