• 汇编学习笔记(8) -- 转移指令的原理


     
    可以修改IP,或同时修改CS和IP的指令统称为转移指令
    概括地讲,转移指令就是可以控制CPU执行内存中某处代码的指令
     
    8086CPU的转移行为有以下几类
     
    ●只修改 IP时,称为段内转移,比如: jmp ax。
    ●同时修改CS和IP时,称为段间转移,比如: jmp 1000:0
    由于转移指令对IP的修改范围不同,段内转移又分为:短转移和近转移
    短转移IP的修改范围为-128~127
    近转移IP的修改范围为-32768~32767
     
    8086CPU的转移指令分为以下几类
    ●无条件转移指令(如: jmp)
    ●条件转移指令
    ●循环指令(如: loop)
    ●过程
    ●中断
     
    这些转移指令转移的前提条件可能不同,但转移的基本原理是相同的
     
    操作符 offset
    操作符在汇编中是由编译器处理的符号
    功能是取得标号的偏移地址
    assume cs:codesg
    codesg segment
        start: mov ax,offset start      ;相当于mov ax,0
        
        s: mov ax,offset s          ;相当于mov ax,3
    codesg ends
    end start
     
    在上面的程序中,offset操作符取得了标号start和s的偏移地址0和3
    所以指令:
    mov ax,ffset start
    相当于指令mov ax,0
    因为start 是代码段中的标号,它所标记的指令是代码段中的第一条指令, 偏移地址为0;
     
    mov ax,ffset s
    相当于指令mov ax,3,因为s是代码段中的标号
    它所标记的指令是代码段中的第二条指令,第一条指令长度为3个字节,则s的偏移地址为3。
     
     
    问题
    有如下程序段,添写两条指令,使该程序在运行中将s处的一条指令复制到s0处
    assume cs:codesg
    codesg segment
        s:
            mov ax,bx            ;mov ax,bx的机器码占两个字节
            mov si,offset s
            mov di,offset s0
            ————————————————
            ————————————————   
        s0 :
            nop                 ;nop的机器码占一个字节
            nop
    codesg ends
    end s
    思考后看分析
     
     
    (1) s 和 s0 处的指令所在的内存单元的地址是多少? cs:offset s 和 cs:offset s0
    (2)将s处的指令复制到s0处,就是将cs:0ffset s 处的数据复制到 cs:offset s0 处
    (3)段地址已知在 cs 中,偏移地址 offset s 和 offset s0 已经送入 si 和 di 中
    (4)要复制的数据有多长? mov ax,bx 指令的长度为两个字节,即1个字
     
     
    assume cs:codesg
    codesg segment
        S:
            mov ax,bx            ;mov ax,bx的机器码占两个字节
            mov si,offset s
            mov di,offset s0
            mov ax,cs:[si]
            mov cs:[di],ax
        s0 :
            nop                 ;nop的机器码占一个字节
            nop
    codesg ends
    end s
     
      
    jmp命令
    jmp为无条件转移指令,可以只修改IP,也可以同时修改CS和IP
     
    jmp指令要给出两种信息:
    (1) 转移的目的地址
    (2)转移的距离(段间转移、段内短转移,段内近转移)
     
    不同的给出目的地址的方法 ,和不同的转移位置,对应有不同格式的jmp指令
     
     
     
     
    依据位移进行转移的jmp指令
     
    jmp short 标号(转到标号处执行指令)
     
    这种格式的jmp指令实现的是段内短转移
    它对IP的修改范围为-128~127
    也就是说,它向前转移时可以最多越过128个字节,向后转移可以最多越过127个字节
    jmp指令中的“short” 符号,说明指令进行的是短转移
    jmp 指令中的“ 标号”是代码段中的标号,指明了指令要转移的目的地
    转移指令结束后,CS:IP应该指向标号处的指令
     
     
    assume cs:codesg
    codesg segment
        start:
        mov ax,0
        jmp short s  转移到s处,让cs:ip指向s开头
        add ax,1
        
        s:
        inc ax
    codesg ends
    end start 
     
    执行后,ax中的值为1
    因为执行 jmp short s后,越过了add ax,1
    执行了s处的inc ax,ax只加了1次
     
     
    其余汇编指令 对应的机器指令
     
    其余机器码中的 idata(立即数),不论它是表示一个数据还是内存单元的偏移地址
    都会在对应的机器指令中出现
    因为CPU执行的是机器指令,它必须要处理这些数据或地址
     
     
    jmp 对应的机器码
    debug 将 jmp short s 中的 s 表示为 inc ax 指令的偏移地址为8
    并将 jmp short s 表示为 jmp 0008,表示转移到 cs:0008处
     
    但是jmp 0008 或者说是 jmp short s 所对应的机器码为 EB03
    这个机器码不包含转移的目的地址
    这意味着,CPU在执行EB 03时并不知道转移的目的地址
    那么CPU是根据什么进行转移呢? 它知道要转移到哪里吗
     
    而 jmp short s 中,明明是带有转移的目的的地址(有标号s表示)
    可翻译成机器指令后,怎么目的地址就没了呢?没有了目的地址,CPU如何知道转移到哪里呢?
     
    改写上面的程序:
    assume cs:codesg
    codesg segment
        start:
        mov ax,0
        mov bx,0
        jmp short s  转移到s处,让cs:ip指向s开头
        add ax,1
        
        s:
        inc ax
    codesg ends
    end start 
     
    翻译成机器码
     
    两张图中,程序1的incax指令的偏移地址为8
    而程序2的incax指令的偏移地址为000BH
     
    两个程序中的jmp指令所对应的机器码,都是EB03
     
    这说明 CPU在执行jmp指令的时候并不需要转移的目的地址
     
    两个程序中的jmp指令的转移目的地址并不一样,一个是cs:0008,另一个是cs:0O0B
     
    如果机器指令中包含了转移的目的地址的话,那么它们对应的机器码应该是不同的
    可是它们对应的机器码都是EB03,这说明在机器指令中并不包含转移的目的地址
     
    如果机器指令中不包含目的地址的话
    那么也就是说,CPU不需要这个目的地址就可以实现对IP的修改
     
    先简单回忆一下CPU执行指令的过程
    (1)从CS:IP指向内存单元读取指令,读取的指令进入指令缓冲器
    
    (2) (IP)=(IP)+所读取指令的长度, 从而指向下一条指令
    
    (3)执行指令。转到1, 重复这个过程
     
    按照这个步骤,看看上面程序中jmp short s指令的读取和执行过程
    (1) (CS)=0BBDH,(IP)=0006H, CS:IP 指向EB 03(jmp short s的机器码)
    (2)读取指令码EB 03 进入指令缓冲器
    (3) (IP) = (IP) + 所读取指令的长度 = (IP) + 2 = 0008H   CS:IP 指向add ax,1
    (4) CPU 执行指令缓冲器中的指令 EB 03
    (5)指令EB 03执行后  (IP) = 000BH CS:IP 指向 inc ax
     
     
    从上面的过程中我们看到,CPU将指令EB 03读入后,IP指向了下一条指令
    即CS:0008 处的 add ax,1 接着执行EB 03
     
    如果EB 03 没有对IP进行修改的话,那么,接下来CPU将执行add ax,1
    可是,CPU执行的EB 03却是一条修改IP的转移指令,执行后(IP)=000BH,CS:IP 指向inc ax
    CS:0008 处的 add ax,1没有被执行
     
    CPU在执行EB 03的时候是根据什么修改的IP,使其指向目标指令呢?
    就是根据指令码中的03
    注意,要转移的目的地址是 CS:000B, 而CPU执行EB 03时,当前的 (IP) = 0008H
    如果将当前的IP 值加3,使(IP)=000BH, CS:IP 就可指向目标指令
    在转移
    指令EB 03中并没有告诉CPU要转移的目的地址,却告诉了CPU要转移的位移
    即将当前的IP向后移动3个字节
    因为程序1、2中的jmp指令转移的位移相同,都是向后3个字节,所以它们的机器码都是EB 03
     
    在“ jmp short 标号 ”指令所对应的机器码中,并不包含转移的目的地址
    而是包含的是转移的位移
     
    这个位移,是编译器根据汇编指令中的“标号”计算出来的
     
     
    实际上,“jmp short标号”的功能为: (IP)=(IP)+8 位位移
     
    (1)8位位移 = 标号处的地址 -jmp指令后 的第一个字节的地址
    (2) short 指明此处的位移为8位位移
    (3)8位 位移的范围为-128~127,用补码表示
    (4) 8位 位移由 编译程序 在编译时算出
     
    还有一种和“jmp short标号”功能相近的指令格式
    jmp near ptr标号,它实现的是段内近转移
     
    “jmp near ptr标号”的功能为: (IP)=(IP)+16 位位移
     
    (1)16位 位移 = 标号处的地址 -jmp指令后的 第一个字节的地址
    (2) near ptr指明此处的位移为 16位位移,进行的是段内近转移
    (3)16 位 位移的范围为 -32768 ~ 32767,用补码表示
    (4)16位 位移由编译程序在编译时算出
     
     
     
    转移的目的地址在指令中的jmp指令
     
    前面讲的jmp指令,其对应的机器指令中并没有转移的目的地址
    而是相对于当前IP的转移位移
     
    jmp far ptr 标号 实现的是段间转移,又称为远转移
    功能如下:
    (CS)= 标号所在段的段地址
    (IP)= 标号在段中的偏移地址
     
    far ptr 指明了 指令用 标号的 段地址和偏移地址 修改CS和IP
    看下面的程序:
    assume cs:codesg
    codesg segment
        start:
        mov ax,0
        mov bx,0
        jmp far ptr s
        db 256 dup (0)
        
        s:
        add ax,1
        inc ax
    codesg ends
    end start 

     
    源程序中的db 256 dup (0), 被Debug解释为相应的若干条汇编指令
    这不是关键,关键是,我们要注意一下jmp far ptr s所对应的机器码:
    0B 01 BD0B,其中包含转移的目的地址
    “0B 01 BD 0B”是目的地址在指令中的存储顺序
    高地址的“BD 0B”是转移的段地址: 0BBDH, 低地址的“0B 01”是偏移地址: 010BH
     
     
    转移地址在寄存器中的jmp指令
    jmp 段地址:偏移地址
    功能: (IP) = (16 位寄存器)
     
    详见:
     
     
    转移地址在内存中的jmp指令
    转移地址在内存中的jmp指令有两种格式:
     
    (1) jmp word ptr 内存单元地址(段内转移)
    功能:从内存单元地址处开始存放着一个字,是转移的 目的 偏移地址
    内存单元地址可用寻址方式的任一格式给出
    比如,下面的指令:
    mov ax,0123H
    mov ds:[0],ax
    jmp word ptr ds:[0]
    执行后,(IP)=0123H
     
    又比如,下面的指令:
    mov ax,0123H
    mov [bx],ax
    jmp word ptr [bx] 
    执行后,(IP)=0123H
     
     
    (2) jmp dword ptr 内存单元地址(段间转移)
    功能:从内存单元地址处开始存放着两个字
    高地址处的字是转移的目的段地址,低地址处是转移的目的偏移地址
     
    (CS) = (内存单元地址 + 2)
    (IP) = (内存单元地址)
     
    内存单元地址可用寻址方式的任一格式给出
    比如,下面的指令:
    mov ax,0123H
    mov ds:[0],ax.
    mov word ptr ds:[2],0
    jmp dword ptr ds:[0]
    执行后,(CS)=0, (IP)=0123H, CS:IP 指向0000:0123
     
    或者这样
    mov ax,0123H
    mov [bx],ax
    mov word ptr [bx+2],0
    jmp dword ptr [bx]
     
    执行后,(CS)=0, (IP)=0123H, CS:IP 指向0000:0123
     
    问题1
    assume cs:codesg
    data segment
            ???
    data ends
    
    codesg segment
        start:
        mov ax,data
        mov ds,ax
        mov bx,0
        jmp word ptr [bx+1]
    codesg ends
    end start 
    若要使程序中的jmp指令执行后,CS:IP 指向程序的第一条指令
    在data段中应该定义哪些数据?
     
     
     
    assume cs:codesg
    data segment
            db 0,0
    data ends
    
    codesg segment
        start:
        mov ax,data
        mov ds,ax
        mov bx,0
        jmp word ptr [bx+1]
    codesg ends
    end start 
     
     
    问题2
    assume cs:codesg
    data segment
            dd 12345678h
    data ends
    
    codesg segment
        start:
            mov ax,data
        mov ds,ax
        mov bx,0
        mov [bx],___
        mov [bx+2],___
        jmp dword ptr ds:[0]
    codesg ends
    end start 
    补全程序,使jmp指令执行后,CS:IP 指向程序的第一条指令
     
     
     
     
    答案
    assume cs:codesg
    data segment
            dd 12345678h
    data ends
    
    codesg segment
        start:
            mov ax,data
        mov ds,ax
        mov bx,0
        mov [bx],bx     ;bx为0,就是让[bx]处0
        mov [bx+2],ax   ;随便传个值,因为上面一个指令就够用了
        jmp dword ptr ds:[0]   ;跳转的偏移地址来自ds:0,即[bx]=0处
    codesg ends
    end start 
     
     
    问题3
    用Debug查看内存,结果如下:
    2000:1000 BE 00 06 00 00 00 ......
     
    则此时,CPU执行指令:
    mov ax,2000h
    mov es,ax
    jmp dword ptr es:[1000h]
     
    后,(cs)=____,(ip)=____
     
    解析:
    jmp dword ptr 内存单元地址(段间转移)
    高地址处的字是转移的目的段地址,低地址处是转移的目的偏移地址
     
    答案
    (cs)= 0006H ,(ip)= 00BEH
     
     
    jcxz指令
    jcxz指令为有条件转移指令,所有的有条件转移指令都是短转移
    在对应的机器码中包含转移的位移,而不是目的地址
    对IP的修改范围都为: -128~127
     
    指令格式: jcxz标号 (如果(cx)=0,转移到标号处执行)
     
    操作:当(cx)=0 时,(IP)=(IP)+8 位位移
     
    8位位移=标号处的地址-jcxz指令后的第一个字节的地址
    8位位移的范围为-128~127,用补码表示
    8位位移由编译程序在编译时算出
     
    当(cx)≠0时,什么也不做(程序向下执行)
     
    我们从jcxz的功能中可以看出,“jcxz 标号” 的功能相当于:
    if ( (cx) ==0 ){
    jmp short 标号;
    }
     
    问题:
    补全编程,利用jcxz 指令,实现在内存2000H段中查找第一个值为0的字节
    找到后,将它的偏移地址存储在dx中
    assume cs:code
    code segment
        start:
        mov ax,2000H
        mov ds,ax
        mov bx,0
        s:
        __________
        __________
        __________
        __________
        jmp short s
        
        ok:
        mov dx,bx
        
        mov ax,4c00h
        int 21h
    codesg ends
    end start 
     
     
    答案
    assume cs:codesg
    codesg segment
        start:
            mov ax,2000h
            mov ds,ax
            mov bx,0
        
            s:
            mov ch,0   ;因为cx是16位寄存器
        mov cl,[bx]
        inc bx
        jcxz short ok
        jmp short s
        
        ok:
        mov dx,bx
        
        mov ax,4c00h
        int 21h
    codesg ends
    end start 
     
     
    loop指令
    loop指令为循环指令
    所有的循环指令都是短转移,在对应的机器码中包含转移的位移,而不是目的地址
    对IP的修改范围都为: -128~127
     
    指令格式: loop 标号 ( (cx) = (cx) - 1 如果(cx)≠0,转移到标号处执行。)
     
    操作:
    (1) (cx) = (cx)-1;
    (2)如果(cx) ≠ 0, (IP) = (IP) + 8 位 位移
     
    8位 位移 = 标号处的地址 -loop指令后的第一个字节的地址
    8位 位移 的范围为 -128~127,用补码表示
    8位 位移 由编译程序在编译时算出
     
    如果(cx) = 0,什么也不做(程序向下执行)
     
    我们从loop的功能中可以看出,“loop 标号”的功能相当于:
    (cx)--
    if( (cx) ≠ 0 ){
    jmp short 标号;
    }
     
     
    问题
    补全编程,利用loop 指令,实现在内存2000H 段中查找第一个值为0的字节,找到后,将它的偏移地址存储在dx中
    assume cs : code
    code segment
        start: 
        mov ax,2000H
        mov ds,ax
        mov bx,0
        
        s: 
        mov cl,[bx]
        mov ch,0
        ___________
        inc bx
        loop s
        
        ok:
        dec bx              ;dec指令的功能和inc相反,dec bx进行的操作为: (bx)=(bx)-1
        mov dx,bx
        
        mov ax,4c00h
        int 21h
    code ends
    end start
     
     
     
     
     
    答案
    assume cs : code
    code segment
        start: 
        mov ax,2000H
        mov ds,ax
        mov bx,0
        
        s: 
        mov cl,[bx]
        mov ch,0
        inc cx     ;执行loop s时,首先要将(cx)减1
        inc bx
        loop s
        
        ok:
        dec bx              ;dec指令的功能和inc相反,dec bx进行的操作为: (bx)=(bx)-1
        mov dx,bx
        
        mov ax,4c00h
        int 21h
    code ends
    end start
     
     
     
    根据位移进行转移的意义
    前面我们讲到:
    jmp short 标号
    jmp near ptr 标号
    jcxz 标号
    loop 标号
    等几种汇编指令
     
    它们对IP的修改是根据转移目的地址和转移起始地址之间的位移来进行的
    在它们对应的机器码中不包含转移的目的地址,而包含的是到目的地址的位移
     
    这种设计,方便了程序段在内存中的浮动装配
    例如:
     
    这段程序装在内存中的不同位置都可正确执行,因为loop s在执行时只涉及s的位移(-4,前移4个字节,补码表示为FCH),
    而不是s的地址
     
    如果loop s的机器码中包含的是s的地址,则就对程序段在内存中的偏移地址有了严格的限制
    因为机器码中包含的是s的地址,如果s处的指令不在目的地址处,程序的执行就会出错
    而loops的机器码中包含的是转移的位移,就不存在这个问题了
    因为,无论s处的指令的实际地址是多少,loop指令的转移位移是不变的。
     
     
     
    编译器对转移位移超界的检测
    注意,根据位移进行转移的指令,它们的转移范围受到转移位移的限制
    如果在源程序中出现了转移范围超界的问题,在编译的时候,编译器将报错
     
    比如,下面的程序将引起编译错误:
    assume cs:code
    code segment
        start: 
        jmp short s
        db 128 dup (0)  ;超出jmp转移范围
        
        s: 
        mov ax,0ffffh
    code ends
    end start
    jmp short s的转移范围是 -128~127,IP 最多向后移动127个字节
     
    注意,我们在
    中的形如“jmp 2000:0100” 的转移指令
    是在Debug中使用的汇编指令,汇编编译器并不认识
    如果在源程序中使用,编译时也会报错
     
     
     
     
    实验(重要!)
    编程:在屏幕中间分别显示 绿色、绿底红色、白底蓝色 的字符串 'welcome to masm!'
     
    材料:
    80x25彩色字符模式显示缓冲区(以下简称为显示缓冲区)的结构:
    内存地址空间中,B8000H~BFFFFH 共32KB的空间,为80X25彩色字符模式的显示缓冲区
    向这个地址空间写入数据,写入的内容将立即出现在显示器上
     
    在80x25彩色字符模式下,显示器可以显示25行,每行80个字符
    每个字符可以有256种属性(背景色、前景色、闪烁、高亮等组合信息)
     
    这样,一个字符在显示缓冲区中就要占两个字节,分别存放字符的ASCII码和属性
    80x25模式下,一屏的内容在显示缓冲区中共占4000个字节
     
    显示缓冲区分为8页,每页4KB(≈4000B),显示器可以显示任意一页的内容
    一般情况下,显示第0页的内容
    也就是说通常情况下,B8000H~B8F9FH 中的4000个字节的内容将出现在显示器上
     
    在一页显示缓冲区中:
    偏移 000~09F 对应显示器上的第1行(80个字符占160个字节);
    偏移 0A0~13F 对应显示器上的第2行;
    偏移 140~1DF 对应显示器上的第3行;
    依此类推,可知,偏移F00~F9F对应显示器上的第25行
     
    在一行中,一个字符占两个字节的存储空间(一个字)
    低位字节存储字符的ASCII码,高位字节存储字符的属性
    一行共有80个字符,占160个字节
     
    即在一行中:
    00~01单元对应显示器上的第1列;
    02~03单元对应显示器上的第2列;
    04~05单元对应显示器上的第3列;
    依此类推,可知,9E~9F单元对应显示器上的第80列
     
    例:在显示器的0行0列显示黑低绿色的字符串 'ABCDEF'
    ('A'的ASCII码值为41H, 02H表示黑底绿色)
     
    显示缓冲区里的内容为:
     
     
    可以看出,在显示缓冲区中,偶地址存放字符,奇地址存放字符的颜色属性
     
    一个在屏幕上显示的字符,具有前景(字符色)和背景(底色)两种颜色
    字符还可以以高亮度和闪烁的方式显示
    前景色、背景色、闪烁、高亮等信息被记录在属性字节中
     
     
    比如:
    红底绿字,属性字节为: 01000010B;
    红底闪烁绿字,属性字节为: 11000010B;
    红底高亮绿字,属性字节为: 01001010B;
    黑底白字,属性字节为: 00000111B;
     
    例:在显示器的0行0列显示红底高亮闪烁绿色的字符串'ABCDEF'
    (红底高亮闪烁绿色,属性字节为: 11001010B, CAH)
     
    显示缓冲区里的内容为:
     
     
     
     
     
     
     
     
    答案
     
    assume cs:code
    data segment
        db 'hello  word!    '
        db 9ah,0ach,71h
    data ends
    
    stack segment
        db 16 dup(0)
    stack ends
    
    code segment
            start:
            mov ax,stack
            mov ss,ax
            mov sp,0
            
            mov ax,data
            mov ds,ax
            
            mov cx,3
            mov ax,0B800H
            mov es,ax
            mov si,10h
            mov ax,0
            s:
            mov ah,ds:[si]
            push cx
            push si
            mov cx,16
            mov si,0
            add si,160*10+80
            mov bx,0
            mov di,1
            add di,160*10+80
            
            s1:
            mov al,[bx]
            mov es:[bx+si],al
            mov es:[bx+di],ah
            inc bx
            inc si
            inc di
            loop s1
            
            pop si
            inc si
            pop cx
            mov dx,es
            add dx,0ah
            mov es,dx
            
            loop s
            
            s2:
            jmp short s2
            
            mov ax,4c00h
            int 21h
    code ends
    end start
     
     
     
     
     
     参考: 王爽 - 汇编语言 和 小甲鱼零基础汇编
     
     
     

  • 相关阅读:
    总结-hexo部署
    core bluetooth详细介绍
    uitextFiled字数输入限制
    UIAlertAction 改变字体颜色
    iOS 10 获取相册相机权限
    选中某个单元格
    内购
    延迟执行
    GCD
    制作静态库
  • 原文地址:https://www.cnblogs.com/ZhouJiaHao/p/13746360.html
Copyright © 2020-2023  润新知