实验5 编写、调试具体多个段的程序
一。将下面的程序编译连接,用Debug加载、跟踪,然后回答问题。
assume cs:code,ds:data,ss:stack
data segment
dw 0123h,0456h,0789h,0abch,0defh,0fedh,0cbah,0987h
data ends
stack segment
dw 0,0,0,0,0,0,0,0
stack ends
code segment
start: mov ax,stack
mov ss,ax
mov sp,16
mov ax,data
mov ds,ax
push ds:[0]
push ds:[2]
pop ds:[2]
pop ds:[0]
mov ax,4c00h
int 21h
code ends
end start
程序分析:由于是初次接触,我们逐步讲解,废话多点。
(1)此程序考察的是内存中数据段和栈段的定义。
程序共定义了1个数据段,data段,首先明确,在程序运行开始(标号start处),这个数据段就已经被定义好了,并且分配了内存空间,并赋值了。
一个栈段,stack。同理这个数据段在没有被人工定义为栈结构时,也被定义好了。并且分配了内存空间,并赋值了。
将此程序编译并连接后,使用debug调试,(这里需要注意,以下的段地址可能由于系统不同而有差异,主要是理解概念。)
E:assembly>debug eee.exe
-r
AX=0000 BX=0000 CX=0042 DX=0000 SP=0000 BP=0000 SI=0000 DI=0000
DS=0B55 ES=0B55 SS=0B65 CS=0B67 IP=0000 NV UP EI PL NZ NA PO NC
0B67:0000 B8660B MOV AX,0B66
程序分析:我们什么也没执行,此时我们在data段定义的数据在哪?在ds:0100H处(原来讲过,程序最开始时ds:00~ds:100H是留给程序与操作系统通讯使用的psp内存段,参见书中p92);也就是说我们在ds:100H、0B55:100H或0B65:00处可以看见这些定义的数据。见下图。
-d ds:100
0B55:0100 23 01 56 04 89 07 BC 0A-EF 0D ED 0F BA 0C 87 09 #.V.............
0B55:0110 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 ................
(2)mov ax,stack
mov ss,ax
mov sp,16
直到这3个指令执行完毕,此时stack数据段被人工指定为了栈结构,(ss)=offset stack,也就是说此时ss段寄存器变量才赋值为stack段的段地址。sp指针指向了栈顶。
我们在上图中,看到SS=0B65,执行完这3个指令后,我们发现SS=0B66了,我们使用d命令查询下:
-d ss:0
0B66:0000 00 00 00 00 00 00 65 0B-00 00 0B 00 67 0B 68 05 ......e.....g.h.
有二个事实:
0B66:0000==0B55:0110,我们定义的数据在内存中的位置在程序装载后,位置是固定的,也就是说数据段的物理地址一直是固定的,只不过我们表述这个数据段时,采用了不同的段地址和偏移地址。
0B66:0000 00 00 00 00 00 00 65 0B-00 00 0B 00 67 0B 68 05 ......e.....g.h.
完全等价于:
0B55:0110 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 ................
我们将ss指向了stack段内存,也就是说,stack这个内存段从现在开始被人工的当做了栈空间使用。在这16个字节空间里,原来都是00;为什么现在有其他数据了?这个我们先别管。它是一些其他的有用信息。
(3) mov ax,data
mov ds,ax
直到上面2个指令执行完毕,ds段寄存器的值才是offset data,也就是说此时ds指向了data段,ds:[0]和data:[0]是等价的。
此时的段地址存储在ds中;也是默认的段地址寄存器;内存单元表示直接使用[idata]寻址就行,也可以使用ds:[idata]。[0]代表第一个内存单元地址;[2]代表第三个内存单元地址。
同理:我们执行这二个指令后,将ds指向了data段。
(4) push ds:[0]
指令含义:将data段中从第一个内存单元地址开始,按照字单元(2个字节),压栈到ss栈(或stack栈中);通俗的讲,就是将23 01这二个字节按字为单元压栈。此时sp变量有变化,原来sp=0010H(16);压栈后(sp)=(sp)-2=16-2=000EH。也就是说栈顶改变了。(这个变化,你可以使用debug中的t命令一步一步的执行后查看)。此时我们查看下栈中有变化吗?
-d ss:0
0B66:0000 00 00 00 00 65 0B 00 00-11 00 67 0B 68 05 23 01 ....e.....g.h.#.
我们发现栈中确实存储了01 23这2个数据,而且明确了栈空间结构是从高地址向低地址发展的。至于栈中其他数据,我们不必理会。
push ds:[2]
指令含义:同理,将data段中从第三个内存单元地址开始,按照字单元(2个字节),压栈到ss栈(或stack栈中);通俗的讲,就是将56 04这二个字节按字为单元压栈。此时sp变量有变化,原来sp=000EH(14);压栈后(sp)=(sp)-2=14-2=000CH。也就是说栈顶改变了SP=000C。
-d ss:0
0B66:0000 00 00 65 0B 00 00 15 00-67 0B 68 05 56 04 23 01 ..e.....g.h.V.#.
(5)pop ds:[2]
指令含义:将栈中数据按字弹出,写入到段地址是ds(它的值是offset data或在我们的系统中是DS=0B65),偏移地址是[2]的内存单元中。如果默认段地址是ds,此指令直接可以写成:pop [2]
指令执行后:sp值有变化,因为是弹出一个字,故(sp)=(sp)+2 =000CH+2=000EH。也就是说栈顶指针sp指向有变化了。
这里注意栈空间中存储栈帧的顺序,也是在以后使用栈结构时候需要注意的原则:先进后出;后进先出。
我们查看下data段数据变化。
-d ds:0
0B65:0000 23 01 56 04 89 07 BC 0A-EF 0D ED 0F BA 0C 87 09 #.V.............
其实在内存第3、4字节中是pop弹栈回写的数据。实际是没有变化,但是经过了pop的回写的。
pop ds:[0]
指令含义:同理如上面,不多说了。
总结:观察栈的结构,注意执行push和pop指令的汇编层面含义和CPU执行的步骤。进一步理解内存的直接寻址方式。返回前,各寄存器状态如下:
AX=0B65 BX=0000 CX=0042 DX=0000 SP=0010 BP=0000 SI=0000 DI=0000
DS=0B65 ES=0B55 SS=0B66 CS=0B67 IP=001D NV UP EI PL NZ NA PO NC
0B67:001D B8004C MOV AX,4C00
答案:
①CPU执行程序,程序返回前,data段中的数据 不变 。
②CPU执行程序,程序返回前,CS=0B67,SS=0B66,DS=0B65 。(根据自己系统回答)
③设程序加载后,CODE段的段地址为X,则DATA段的段地址为 X-2 ,STACK段的段地址为 X-1 。
二。将下面的程序编译连接,用Debug加载、跟踪,然后回答问题。
assume cs:code,ds:data,ss:stack
data segment
dw 0123h,0456h
data ends
stack segment
dw 0,0
stack ends
code segment
start:
mov ax,stack
mov ss,ax
mov sp,16
mov ax,data
mov ds,ax
push ds:[0]
push ds:[2]
pop ds:[2]
pop ds:[0]
mov ax,4c00h
int 21h
code ends
end start
程序分析:(不再详细分析了)
首先明确:虽然我们在data段和stack段中只定义初始化了4个字节的内存,但在汇编中,直接给你分配了16个字节的空间,不足的按00补全。
结论:数据段和栈段在程序加载后实际占据的空间都是以16个字节为单位的。如果不足,以0补全填充。
在debug中查看:
-d ds:100
0B55:0100 23 01 56 04 00 00 00 00-00 00 00 00 00 00 00 00 #.V.............
0B55:0110 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 ................ 程序返回前
-t
AX=0B65 BX=0000 CX=0042 DX=0000 SP=0010 BP=0000 SI=0000 DI=0000
DS=0B65 ES=0B55 SS=0B66 CS=0B67 IP=001D NV UP EI PL NZ NA PO NC
0B67:001D B8004C MOV AX,4C00
答案:
(1)CPU执行程序,程序返回前,data段中的数据为多少?
执行程序后,data段有16个字节空间,前两个字数据不变,其余为00补全了。
(2)CPU执行程序,程序返回前,CS=0B67, SS=0B66, DS=0B65.
(3)程序加载后,code段地址设为X,则data段地址为(x-2),stack段的段地址为(X-1).
(4)对于如下定义的段:
name segment
......
name ends
如果段中数据位N个字节,程序加载后,该段实际占据空间为:(N/16的取整数+1)*16个字节
如果N小于16,那么实际占用16个字节(理解这个小问题);如果N大于16,那么实际占用(N/16的取整数+1)*16个字节。其实都是这个公式。
三。将下面的程序编译连接,用Debug加载、跟踪,然后回答问题。
assume cs:code,ds:data,ss:stack
code segment
start:
mov ax,stack
mov ss,ax
mov sp,16
mov ax,data
mov ds,ax
push ds:[0]
push ds:[2]
pop ds:[2]
pop ds:[0]
mov ax,4c00h
int 21h
code ends
data segment
dw 0123h,0456h
data ends
stack segment
dw 0,0
stack ends
end start
程序分析:
这次只不过是将data和stack段放到了code段后面了。那么就要注意它们段地址的变化了。
返回前,查看
-r
AX=0B68 BX=0000 CX=0044 DX=0000 SP=0010 BP=0000 SI=0000 DI=0000
DS=0B68 ES=0B55 SS=0B69 CS=0B65 IP=001D NV UP EI PL NZ NA PO NC
0B65:001D B8004C MOV AX,4C00
总结:在汇编源代码中,我们定义的code是程序执行的代码(它存储在一个我们人为规定的段code中,在程序装载时,分配空间,并将机器码写入到这段内存中);其他的数据段(无论是逻辑上的stack段,data段等)与代码段都相邻。只不过是装载、分配内存前后的问题。
答案:
(1)CPU执行程序,程序返回前,data段中的数据为多少?
执行程序后,data段有16个字节空间,前两个字数据不变,其余为00补全了。
(2)CPU执行程序,程序返回前,CS=0B65, SS=0B69, DS=0B68.
(3)程序加载后,code段地址设为X,则data段地址为(x+3),stack段的段地址为(X+4).
(为什么是这样?怎么计算的?看cx,程序加载时,我们发现cx=0044,含义:此程序所有机器码占用的空间是44H=68字节,data和stack由于定义的都是小于16个字节,一律按照16个字节分配空间,其余补00;剩余的36个字节就是code段真正的可执行的机器码。由于code段不足48个字节(3*16),故程序加载时也补0了)
我们可以使用debug看看:
-d cs:0
0B65:0000 B8 69 0B 8E D0 BC 10 00-B8 68 0B 8E D8 FF 36 00 .i.......h....6.
0B65:0010 00 FF 36 02 00 8F 06 02-00 8F 06 00 00 B8 00 4C ..6............L
0B65:0020 CD 21 00 00 00 00 00 00-00 00 00 00 00 00 00 00 .!..............
0B65:0030 23 01 56 04 00 00 00 00-00 00 00 00 00 00 00 00 #.V.............
0B65:0040 00 00 68 0B 68 0B 68 0B-00 00 1D 00 65 0B 68 05 ..h.h.h.....e.h.
红色的代表了代码段。紫色代表了data段。绿色是stack段
四。 如果将(1)、(2)、(3)题中的最后一条伪指令“end start”改为“end”(也就是说不指明程序的入口),则那个程序仍然可以正确执行?请说明原因。
答案:如果不指名程序的(code段的)入口,并且使用end替换end start,都能正常运行。但只有(3)题中程序可以正确的执行(因为只有它是在内存中可执行代码在最前面)。
讲解:因为如果不指名入口,程序会从加载进内存的第一个单元起开始执行,前二个题中,定义的是数据,但CPU还是将数据当做指令代码执行了。只不过程序执行时逻辑上是错误了。但真的能执行的。
如果指明了程序的入口,CPU会直接从入口处开始执行真正的机器码,直到遇到中断指令返回。此种方式能够确保程序逻辑上的正确。因此有必要为程序来指明入口。
网上许多答案都是不太明确!
五。编写code段中的代码,将a段和b段数据依次相加,结果存入c段
assume cs:code
a segment
db 1,2,3,4,5,6,7,8
a ends
b segment
db 1,2,3,4,5,6,7,8
b ends
c segment
db 0,0,0,0,0,0,0,0
c ends
code segment
start:
???????
mov ax,4c00h
int 21h
code ends
end start
程序分析:
(1)这个题目一下子搞出3个数据段了。呵呵,貌似我们段寄存器不够用了。cs(代码段),ss(栈段),这二个千万别碰!那只有ds和es了。思路:将a和b段我们用一个段地址表示,存储在ds中;c段我们存储在es中。?这种方式好吗?不太好。
(2)上面已经体会了,当一个数据段不足16个字节时,按16个字节分配内存空间,其余的补0。我们发现a、b段都是定义了8个字节的数值。并且是相邻的(肯定是的),那么a段的地址我们使用[bx+idata]表示,b段我们也使用[bx+idata]表示。这种方式没有把a段和b段分开。
(3)最终决定:将es指向c段,ds分开分别的指向a段和b段,这样我们在一个循环内完成所有的工作了;程序中使用了栈保存了ds的值;
最终代码如下:
assume cs:code
a segment
db 1,2,3,4,5,6,7,8
a ends
b segment
db 1,2,3,4,5,6,7,8
b ends
cz segment
db 0,0,0,0,0,0,0,0
cz ends
code segment
start:
mov ax,a
mov ds,ax ;ds指向a段
mov ax,b
mov es,ax ;es指向b段
mov bx,0
mov cx,8 ;计算8次,故计数器为8
s:
mov dl, [bx] ;将ds:[bx]内存单元按字节送入dl,此循环用到ax
add dl, es:[bx] ;将ds:[bx]与es:[bx]内存单元值相加
push ds ;保护ds值,因为下面用到ds了
mov ax, cz ;我的编译器不认C这个段的标号,故改成了CZ
mov ds, ax ;将ds指向cz段
mov [bx], dl ;将dl(a和b相对应内存单元内容之和)写入cz中
pop ds ;将ds恢复
inc bx ;bx递增
loop s
mov ax,4c00h
int 21h
code ends
end start
结果分析:
(1)ds段寄存器在程序中可以存储不同的内存段的段地址,并不是唯一存储一个段地址,es也是如此。
(2)合理利用系统自动创建的栈空间,利用栈空间来保存暂存的数据。注意压栈和弹栈的顺序,确保操作的是一个数据对象。
(3)在遇到多个数据段的情况下,这种方式可以利用一个段寄存器来对多个内存段寻址。
(4)在实际工程中,在程序中保存的数据,都是程序的一些必须的初始化的数据,其他的数据都应保存在磁盘文件中,需要时才读入内存中。此例中的a、b、cz段都是其他的数据,在这里就是演示。
六。编写code段中代码,用push指令将a段中前8个字型数据逆序存储到b段中。
assume cs:code
a segment
dw 1,2,3,4,5,6,7,8,9,0ah,0bh,0ch,0dh,0eh,0fh,0ffh
a ends
b segment
dw 0,0,0,0,0,0,0,0
b ends
程序分析:
(1)理解掌握栈的原理,先进后出,从高地址向低地址发展。也就是说先压栈的数据,在栈底,最后被pop出。
(2)对于数据段,我们定义2个,ds指向a段,ss指向b。ss指向了b段,也就意味着b段是人工创建的一个栈结构了。
(3)对于push和pop指令:操作的是一个栈帧或栈单元,它的操作数是一个字,在8086CPU中是一个字,2个字节,这个在a、b段定义时我们应该发现,它们都是定义的字。如果定义的是db字节呢?呵呵。一样的。
最终代码如下:
assume cs:code
a segment
dw 1,2,3,4,5,6,7,8,9,0ah,0bh,0ch,0dh,0eh,0fh,0ffh
a ends
b segment
dw 0,0,0,0,0,0,0,0
b ends
code segment
start:
mov ax,a
mov ds,ax ;ds指向a段
mov ax,b
mov ss,ax ;ss指向了b段
mov sp,16 ;初始化栈顶,ss:sp指向了栈顶,意味着b段是个栈结构了。
mov bx,0
mov cx,8 ;循环读取a段8次,因为是前8个字
s:
push ds:[bx] ;直接将a段中的字单元内存压栈即可。这样在栈中的存储结构就是逆序的
add bx,2
loop s
mov ax,4c00h
int 21h
code ends
end start
运行结果debug:
-d ds:0
0B65:0000 01 00 02 00 03 00 04 00-05 00 06 00 07 00 08 00 ................
0B65:0010 09 00 0A 00 0B 00 0C 00-0D 00 0E 00 0F 00 FF 00 ................
0B65:0020 08 00 07 00 06 00 05 00-04 00 03 00 02 00 01 00 ................