汇编学习笔记(8) -- 转移指令的原理

汇编学习笔记(8) -- 转移指令的原理
操作符 offset

jmp命令

　　依据位移进行转移的jmp指令

　　转移的目的地址在指令中的jmp指令

　　转移地址在寄存器中的jmp指令

　　转移地址在内存中的jmp指令

jcxz指令

loop指令

根据位移进行转移的意义

编译器对转移位移超界的检测

实验(重要！)

可以修改IP,或同时修改CS和IP的指令统称为转移指令

概括地讲，转移指令就是可以控制CPU执行内存中某处代码的指令

8086CPU的转移行为有以下几类

●只修改 IP时，称为段内转移，比如: jmp ax。

●同时修改CS和IP时，称为段间转移，比如: jmp 1000:0

由于转移指令对IP的修改范围不同，段内转移又分为:短转移和近转移

●

短转移IP的修改范围为-128~127

近转移IP的修改范围为-32768~32767

8086CPU的转移指令分为以下几类

●无条件转移指令(如: jmp)

●条件转移指令

●循环指令(如: loop)

●过程

●中断

这些转移指令转移的前提条件可能不同，但转移的基本原理是相同的

操作符 offset

操作符在汇编中是由编译器处理的符号

功能是取得标号的偏移地址
assume cs:codesg codesg segment start: mov ax,offset start ;相当于mov ax,0 s: mov ax,offset s ;相当于mov ax,3 codesg ends end start
在上面的程序中，offset操作符取得了标号start和s的偏移地址0和3

所以指令:

mov ax,ffset start

相当于指令mov ax,0

因为start 是代码段中的标号，它所标记的指令是代码段中的第一条指令，偏移地址为0;

mov ax,ffset s

相当于指令mov ax,3，因为s是代码段中的标号

它所标记的指令是代码段中的第二条指令，第一条指令长度为3个字节，则s的偏移地址为3。

问题

有如下程序段，添写两条指令，使该程序在运行中将s处的一条指令复制到s0处
assume cs:codesg codesg segment s: mov ax,bx ;mov ax,bx的机器码占两个字节 mov si,offset s mov di,offset s0 ———————————————— ———————————————— s0 : nop ；nop的机器码占一个字节 nop codesg ends end s
思考后看分析

(1) s 和 s0 处的指令所在的内存单元的地址是多少? cs:offset s 和 cs:offset s0

(2)将s处的指令复制到s0处，就是将cs:0ffset s 处的数据复制到 cs:offset s0 处

(3)段地址已知在 cs 中，偏移地址 offset s 和 offset s0 已经送入 si 和 di 中

(4)要复制的数据有多长? mov ax,bx 指令的长度为两个字节，即1个字
assume cs:codesg codesg segment S: mov ax,bx ;mov ax,bx的机器码占两个字节 mov si,offset s mov di,offset s0 mov ax,cs:[si] mov cs:[di],ax s0 : nop ；nop的机器码占一个字节 nop codesg ends end s
jmp命令

jmp为无条件转移指令，可以只修改IP，也可以同时修改CS和IP

jmp指令要给出两种信息:

(1) 转移的目的地址

(2)转移的距离(段间转移、段内短转移，段内近转移)

不同的给出目的地址的方法，和不同的转移位置，对应有不同格式的jmp指令

依据位移进行转移的jmp指令

jmp short 标号(转到标号处执行指令)

这种格式的jmp指令实现的是段内短转移

它对IP的修改范围为-128~127

也就是说，它向前转移时可以最多越过128个字节，向后转移可以最多越过127个字节

jmp指令中的“short” 符号，说明指令进行的是短转移

jmp 指令中的“ 标号”是代码段中的标号，指明了指令要转移的目的地

转移指令结束后，CS:IP应该指向标号处的指令
assume cs:codesg codesg segment start: mov ax,0 jmp short s 转移到s处，让cs:ip指向s开头 add ax,1 s: inc ax codesg ends end start
执行后，ax中的值为1

因为执行 jmp short s后，越过了add ax，1

执行了s处的inc ax，ax只加了1次

其余汇编指令对应的机器指令

其余机器码中的 idata(立即数)，不论它是表示一个数据还是内存单元的偏移地址

都会在对应的机器指令中出现

因为CPU执行的是机器指令，它必须要处理这些数据或地址

jmp 对应的机器码

debug 将 jmp short s 中的 s 表示为 inc ax 指令的偏移地址为8

并将 jmp short s 表示为 jmp 0008，表示转移到 cs:0008处

但是jmp 0008 或者说是 jmp short s 所对应的机器码为 EB03

这个机器码不包含转移的目的地址

这意味着，CPU在执行EB 03时并不知道转移的目的地址

那么CPU是根据什么进行转移呢？它知道要转移到哪里吗

而 jmp short s 中，明明是带有转移的目的的地址(有标号s表示)

可翻译成机器指令后，怎么目的地址就没了呢?没有了目的地址，CPU如何知道转移到哪里呢?

改写上面的程序：
assume cs:codesg codesg segment start: mov ax,0 mov bx,0 jmp short s 转移到s处，让cs:ip指向s开头 add ax,1 s: inc ax codesg ends end start
翻译成机器码

两张图中，程序1的incax指令的偏移地址为8

而程序2的incax指令的偏移地址为000BH

两个程序中的jmp指令所对应的机器码，都是EB03

这说明 CPU在执行jmp指令的时候并不需要转移的目的地址

两个程序中的jmp指令的转移目的地址并不一样，一个是cs:0008，另一个是cs:0O0B

如果机器指令中包含了转移的目的地址的话，那么它们对应的机器码应该是不同的

可是它们对应的机器码都是EB03，这说明在机器指令中并不包含转移的目的地址

如果机器指令中不包含目的地址的话

那么也就是说，CPU不需要这个目的地址就可以实现对IP的修改

先简单回忆一下CPU执行指令的过程
(1)从CS:IP指向内存单元读取指令，读取的指令进入指令缓冲器 (2) (IP)=(IP)+所读取指令的长度，从而指向下一条指令 (3)执行指令。转到1, 重复这个过程
按照这个步骤，看看上面程序中jmp short s指令的读取和执行过程
(1) (CS)=0BBDH，(IP)=0006H, CS:IP 指向EB 03(jmp short s的机器码) (2)读取指令码EB 03 进入指令缓冲器 (3) (IP) = (IP) + 所读取指令的长度 = (IP) + 2 = 0008H CS:IP 指向add ax,1 (4) CPU 执行指令缓冲器中的指令 EB 03 (5)指令EB 03执行后 (IP) = 000BH CS:IP 指向 inc ax
从上面的过程中我们看到，CPU将指令EB 03读入后，IP指向了下一条指令

即CS:0008 处的 add ax,1 接着执行EB 03

如果EB 03 没有对IP进行修改的话，那么，接下来CPU将执行add ax,1

可是，CPU执行的EB 03却是一条修改IP的转移指令，执行后(IP)=000BH，CS:IP 指向inc ax

CS:0008 处的 add ax,1没有被执行

CPU在执行EB 03的时候是根据什么修改的IP，使其指向目标指令呢?

就是根据指令码中的03

注意，要转移的目的地址是 CS:000B，而CPU执行EB 03时，当前的 (IP) = 0008H

如果将当前的IP 值加3，使(IP)=000BH， CS:IP 就可指向目标指令

在转移

指令EB 03中并没有告诉CPU要转移的目的地址，却告诉了CPU要转移的位移

即将当前的IP向后移动3个字节

因为程序1、2中的jmp指令转移的位移相同，都是向后3个字节，所以它们的机器码都是EB 03

在“ jmp short 标号 ”指令所对应的机器码中，并不包含转移的目的地址

而是包含的是转移的位移

这个位移，是编译器根据汇编指令中的“标号”计算出来的

实际上，“jmp short标号”的功能为: (IP)=(IP)+8 位位移

(1)8位位移 = 标号处的地址 -jmp指令后的第一个字节的地址

(2) short 指明此处的位移为8位位移

(3)8位位移的范围为-128~127，用补码表示

(4) 8位位移由编译程序在编译时算出

还有一种和“jmp short标号”功能相近的指令格式

jmp near ptr标号，它实现的是段内近转移

“jmp near ptr标号”的功能为: (IP)=(IP)+16 位位移

(1)16位位移 = 标号处的地址 -jmp指令后的第一个字节的地址

(2) near ptr指明此处的位移为 16位位移，进行的是段内近转移

(3)16 位位移的范围为 -32768 ~ 32767，用补码表示

(4)16位位移由编译程序在编译时算出

转移的目的地址在指令中的jmp指令

前面讲的jmp指令，其对应的机器指令中并没有转移的目的地址

而是相对于当前IP的转移位移

jmp far ptr 标号实现的是段间转移，又称为远转移

功能如下:

(CS)= 标号所在段的段地址

(IP)= 标号在段中的偏移地址

far ptr 指明了指令用标号的段地址和偏移地址修改CS和IP

看下面的程序:
assume cs:codesg codesg segment start: mov ax,0 mov bx,0 jmp far ptr s db 256 dup (0) s: add ax,1 inc ax codesg ends end start
源程序中的db 256 dup (0)，被Debug解释为相应的若干条汇编指令

这不是关键，关键是，我们要注意一下jmp far ptr s所对应的机器码:

0B 01 BD0B，其中包含转移的目的地址

“0B 01 BD 0B”是目的地址在指令中的存储顺序

高地址的“BD 0B”是转移的段地址: 0BBDH, 低地址的“0B 01”是偏移地址: 010BH

转移地址在寄存器中的jmp指令

jmp 段地址:偏移地址

功能: (IP) = (16 位寄存器)

详见：

https://www.cnblogs.com/ZhouJiaHao/p/13597065.html#4112-1588483073313

转移地址在内存中的jmp指令

转移地址在内存中的jmp指令有两种格式:

(1) jmp word ptr 内存单元地址(段内转移)

功能:从内存单元地址处开始存放着一个字，是转移的目的偏移地址

内存单元地址可用寻址方式的任一格式给出

比如，下面的指令:
mov ax,0123H mov ds:[0],ax jmp word ptr ds:[0]
执行后，(IP)=0123H

又比如，下面的指令:
mov ax,0123H mov [bx],ax jmp word ptr [bx]
执行后，(IP)=0123H

(2) jmp dword ptr 内存单元地址(段间转移)

功能:从内存单元地址处开始存放着两个字

高地址处的字是转移的目的段地址，低地址处是转移的目的偏移地址

(CS) = (内存单元地址 + 2)

(IP) = (内存单元地址)

内存单元地址可用寻址方式的任一格式给出

比如，下面的指令:
mov ax,0123H mov ds:[0],ax. mov word ptr ds:[2],0 jmp dword ptr ds:[0]
执行后，(CS)=0， (IP)=0123H， CS:IP 指向0000:0123

或者这样
mov ax,0123H mov [bx],ax mov word ptr [bx+2],0 jmp dword ptr [bx]
执行后，(CS)=0， (IP)=0123H, CS:IP 指向0000:0123

问题1
assume cs:codesg data segment ？？？ data ends codesg segment start: mov ax,data mov ds,ax mov bx,0 jmp word ptr [bx+1] codesg ends end start
若要使程序中的jmp指令执行后，CS:IP 指向程序的第一条指令

在data段中应该定义哪些数据?
assume cs:codesg data segment db 0,0 data ends codesg segment start: mov ax,data mov ds,ax mov bx,0 jmp word ptr [bx+1] codesg ends end start
问题2
assume cs:codesg data segment dd 12345678h data ends codesg segment start: mov ax,data mov ds,ax mov bx,0 mov [bx],___ mov [bx+2],___ jmp dword ptr ds:[0] codesg ends end start
补全程序，使jmp指令执行后，CS:IP 指向程序的第一条指令

答案
assume cs:codesg data segment dd 12345678h data ends codesg segment start: mov ax,data mov ds,ax mov bx,0 mov [bx],bx ;bx为0，就是让[bx]处0 mov [bx+2],ax ;随便传个值，因为上面一个指令就够用了 jmp dword ptr ds:[0] ;跳转的偏移地址来自ds:0，即[bx]=0处 codesg ends end start
问题3

用Debug查看内存，结果如下：

2000:1000 BE 00 06 00 00 00 ......

则此时，CPU执行指令：
mov ax,2000h mov es,ax jmp dword ptr es:[1000h]
后，(cs)=____，(ip)=____

解析：

jmp dword ptr 内存单元地址(段间转移)

高地址处的字是转移的目的段地址，低地址处是转移的目的偏移地址

答案

(cs)= 0006H ，(ip)= 00BEH

jcxz指令

jcxz指令为有条件转移指令，所有的有条件转移指令都是短转移

在对应的机器码中包含转移的位移，而不是目的地址

对IP的修改范围都为: -128~127

指令格式: jcxz标号 (如果(cx)=0,转移到标号处执行)

操作:当(cx)=0 时，(IP)=(IP)+8 位位移

8位位移=标号处的地址-jcxz指令后的第一个字节的地址

8位位移的范围为-128~127，用补码表示

8位位移由编译程序在编译时算出

当(cx)≠0时，什么也不做(程序向下执行)

我们从jcxz的功能中可以看出，“jcxz 标号” 的功能相当于:

if ( (cx) ==0 ){

jmp short 标号;

}

问题：

补全编程，利用jcxz 指令，实现在内存2000H段中查找第一个值为0的字节

找到后，将它的偏移地址存储在dx中
assume cs:code code segment start: mov ax,2000H mov ds,ax mov bx,0 s: __________ __________ __________ __________ jmp short s ok: mov dx,bx mov ax,4c00h int 21h codesg ends end start
答案
assume cs:codesg codesg segment start: mov ax,2000h mov ds,ax mov bx,0 s: mov ch,0 ;因为cx是16位寄存器 mov cl,[bx] inc bx jcxz short ok jmp short s ok: mov dx,bx mov ax,4c00h int 21h codesg ends end start
loop指令

loop指令为循环指令

所有的循环指令都是短转移，在对应的机器码中包含转移的位移，而不是目的地址

对IP的修改范围都为: -128~127

指令格式: loop 标号 ( (cx) = (cx) - 1 如果(cx)≠0,转移到标号处执行。)

操作:

(1) (cx) = (cx)-1;

(2)如果(cx) ≠ 0, (IP) = (IP) + 8 位位移

8位位移 = 标号处的地址 -loop指令后的第一个字节的地址

8位位移的范围为 -128~127，用补码表示

8位位移由编译程序在编译时算出

如果(cx) = 0，什么也不做(程序向下执行)

我们从loop的功能中可以看出，“loop 标号”的功能相当于:

(cx)--

if( (cx) ≠ 0 ){

jmp short 标号;

}

问题

补全编程，利用loop 指令，实现在内存2000H 段中查找第一个值为0的字节，找到后，将它的偏移地址存储在dx中
assume cs : code code segment start: mov ax,2000H mov ds,ax mov bx,0 s: mov cl,[bx] mov ch,0 ___________ inc bx loop s ok: dec bx ;dec指令的功能和inc相反，dec bx进行的操作为: (bx)=(bx)-1 mov dx,bx mov ax,4c00h int 21h code ends end start
答案
assume cs : code code segment start: mov ax,2000H mov ds,ax mov bx,0 s: mov cl,[bx] mov ch,0 inc cx ;执行loop s时，首先要将(cx)减1 inc bx loop s ok: dec bx ;dec指令的功能和inc相反，dec bx进行的操作为: (bx)=(bx)-1 mov dx,bx mov ax,4c00h int 21h code ends end start
根据位移进行转移的意义

前面我们讲到:
jmp short 标号 jmp near ptr 标号 jcxz 标号 loop 标号
等几种汇编指令

它们对IP的修改是根据转移目的地址和转移起始地址之间的位移来进行的

在它们对应的机器码中不包含转移的目的地址，而包含的是到目的地址的位移

这种设计，方便了程序段在内存中的浮动装配

例如:

这段程序装在内存中的不同位置都可正确执行，因为loop s在执行时只涉及s的位移(-4，前移4个字节，补码表示为FCH)，

而不是s的地址

如果loop s的机器码中包含的是s的地址，则就对程序段在内存中的偏移地址有了严格的限制

因为机器码中包含的是s的地址，如果s处的指令不在目的地址处，程序的执行就会出错

而loops的机器码中包含的是转移的位移，就不存在这个问题了

因为，无论s处的指令的实际地址是多少，loop指令的转移位移是不变的。

编译器对转移位移超界的检测

注意，根据位移进行转移的指令，它们的转移范围受到转移位移的限制

如果在源程序中出现了转移范围超界的问题，在编译的时候，编译器将报错

比如，下面的程序将引起编译错误:
assume cs:code code segment start: jmp short s db 128 dup (0) ;超出jmp转移范围 s: mov ax,0ffffh code ends end start
jmp short s的转移范围是 -128~127，IP 最多向后移动127个字节

注意，我们在

https://www.cnblogs.com/ZhouJiaHao/p/13597065.html#4112-1588483073313

中的形如“jmp 2000:0100” 的转移指令

是在Debug中使用的汇编指令，汇编编译器并不认识

如果在源程序中使用，编译时也会报错

实验(重要！)

编程:在屏幕中间分别显示绿色、绿底红色、白底蓝色的字符串 'welcome to masm!'

材料：

80x25彩色字符模式显示缓冲区(以下简称为显示缓冲区)的结构:

内存地址空间中，B8000H~BFFFFH 共32KB的空间，为80X25彩色字符模式的显示缓冲区

向这个地址空间写入数据，写入的内容将立即出现在显示器上

在80x25彩色字符模式下，显示器可以显示25行，每行80个字符

每个字符可以有256种属性(背景色、前景色、闪烁、高亮等组合信息)

这样，一个字符在显示缓冲区中就要占两个字节，分别存放字符的ASCII码和属性

80x25模式下，一屏的内容在显示缓冲区中共占4000个字节

显示缓冲区分为8页，每页4KB(≈4000B)，显示器可以显示任意一页的内容

一般情况下，显示第0页的内容

也就是说通常情况下，B8000H~B8F9FH 中的4000个字节的内容将出现在显示器上

在一页显示缓冲区中:
偏移 000~09F 对应显示器上的第1行(80个字符占160个字节); 偏移 0A0~13F 对应显示器上的第2行; 偏移 140~1DF 对应显示器上的第3行;
依此类推，可知，偏移F00~F9F对应显示器上的第25行

在一行中，一个字符占两个字节的存储空间(一个字)

低位字节存储字符的ASCII码，高位字节存储字符的属性

一行共有80个字符，占160个字节

即在一行中:
00~01单元对应显示器上的第1列; 02~03单元对应显示器上的第2列; 04~05单元对应显示器上的第3列;
依此类推，可知，9E~9F单元对应显示器上的第80列

例:在显示器的0行0列显示黑低绿色的字符串 'ABCDEF'

('A'的ASCII码值为41H, 02H表示黑底绿色)

显示缓冲区里的内容为:

可以看出，在显示缓冲区中，偶地址存放字符，奇地址存放字符的颜色属性

一个在屏幕上显示的字符，具有前景(字符色)和背景(底色)两种颜色

字符还可以以高亮度和闪烁的方式显示

前景色、背景色、闪烁、高亮等信息被记录在属性字节中

比如:
红底绿字，属性字节为: 01000010B; 红底闪烁绿字，属性字节为: 11000010B; 红底高亮绿字，属性字节为: 01001010B; 黑底白字，属性字节为: 00000111B;
例:在显示器的0行0列显示红底高亮闪烁绿色的字符串'ABCDEF'

(红底高亮闪烁绿色，属性字节为: 11001010B, CAH)

显示缓冲区里的内容为:

答案
assume cs:code data segment db 'hello word! ' db 9ah,0ach,71h data ends stack segment db 16 dup(0) stack ends code segment start: mov ax,stack mov ss,ax mov sp,0 mov ax,data mov ds,ax mov cx,3 mov ax,0B800H mov es,ax mov si,10h mov ax,0 s: mov ah,ds:[si] push cx push si mov cx,16 mov si,0 add si,160*10+80 mov bx,0 mov di,1 add di,160*10+80 s1: mov al,[bx] mov es:[bx+si],al mov es:[bx+di],ah inc bx inc si inc di loop s1 pop si inc si pop cx mov dx,es add dx,0ah mov es,dx loop s s2: jmp short s2 mov ax,4c00h int 21h code ends end start
参考：王爽 - 汇编语言和小甲鱼零基础汇编

操作符 offset

jmp命令

　　依据位移进行转移的jmp指令

　　转移的目的地址在指令中的jmp指令

　　转移地址在寄存器中的jmp指令

　　转移地址在内存中的jmp指令

jcxz指令

loop指令

根据位移进行转移的意义

编译器对转移位移超界的检测

实验(重要！)
相关阅读:
总结-hexo部署
 core bluetooth详细介绍
 uitextFiled字数输入限制
 UIAlertAction 改变字体颜色
 iOS 10 获取相册相机权限
 选中某个单元格
 内购
 延迟执行
 GCD
制作静态库
原文地址：https://www.cnblogs.com/ZhouJiaHao/p/13746360.html