寄存器
①寄存器位于CPU内部,数量很少,仅十四个;
②寄存器所能存储的数据不一定是8bit,有一些寄存器可以存储16bit数据,对于386/486处理器中的一些寄存器则能存储32bit数据;
③每个内部寄存器都有一个名字,而没有类似存储器的地址编号。
寄存器的功能十分重要,CPU对存储器中的数据进行处理时,往往先把数据取到内部寄存器中,而后再作处理。外部寄存器是计算机中其它一些部件上用于暂存数据的寄存器,它与CPU之间通过“端口”交换数据,外部寄存器具有寄存器和内存储器双重特点。有些时候我们常把外部寄存器就称为“端口”,这种说法不太严格,但经常这样说。
外部寄存器虽然也用于存放数据,但是它保存的数据具有特殊的用途。某些寄存器中各个位的0、1状态反映了外部设备的工作状态或方式;还有一些寄存器中的各个位可对外部设备进行控制;也有一些端口作为CPU同外部设备交换数据的通路。所以说,端口是CPU和外设间的联系桥梁。CPU对端口的访问也是依据端口的“编号”(地址),这一点又和访问存储器一样。不过考虑到机器所联接的外设数量并不多,所以在设计机器的时候仅安排了1024个端口地址,端口地址范围为0--3FFH。
1.重命名技术寄存器重命名,是CPU在解码过程中对寄存器进行重命名,解码器把“其它”的寄存器名字变为“通用”的寄存器名字,本质上是通过一个表格把x86寄存器重新映射到其它寄存器,这样可以让实际使用到的寄存器远大于8个。这样做的好处除了便于前面指令发生意外或分支预测出错时取消外,还避免了由于两条指令写同一个寄存器时的等待。
2.乱序执行技术
采用乱序执行技术使CPU内部电路满负荷运转并相应提高了CPU运行程序的速度。这好比请A、B、C三个名人为春节联欢晚会题写横幅“春节联欢晚会”六个大字,每人各写两个字,如果这时在一张大纸上按顺序由A写好“春节”后再交给B写“联欢”,然后再由C写“晚会”,那么这样在A写的时候,B和C必须等待,而在B写的时候C仍然要等待而A已经没事了。但如果采用三个人分别用三张纸同时写的做法,那么B和C都不必等待就可以同时各写各的了,甚至C和B还可以比A先写好也没关系(就像乱序执行),但当他们都写完后就必须重新在横幅上按“春节联欢晚会”的顺序排好(自然可以由别人做,就象CPU中乱序执行后的重新排列单元)才能挂出去。
寄存器通常都用来意指由一个指令之输出或输入可以直接索引到的寄存器群组。更适当的是称为“架构寄存器”。x86指令及定义八个32位元寄存器的集合,但一个实作x86指令集的CPU可以包含比八个更多的寄存器。共有以下几类的寄存器:(1)资料寄存器:用来储存整数数字(参考以下的浮点寄存器)。在某些简单/旧的CPU,特别的资料寄存器是累加器,作为数学计算之用。
(2)位址寄存器-持有内存位址,以及用来存取内存。在某些简单/旧的CPU里,特别的位址寄存器是索引寄存器(可能出现一个或多个)。
(3)通用目的寄存器(GPRs)-可以保存资料或位址两者,也就是说他们是结合资料/位址寄存器的功用。
(4)浮点寄存器(FPRs)-用来储存浮点数字。
(5)常数寄存器-用来持有只读的数值(例如0、1、圆周率等等)。
(6)向量寄存器-用来储存由向量处理器执行SIMD(SingleInstruction,MultipleData)指令所得到的资料。
(7)特殊目的寄存器-储存CPU内部的资料,像是程式计数器(或称为指令指标),堆栈寄存器,以及状态寄存器(或称微处理器状态字组)。
(8)指令寄存器(instructionregister)-储存现在正在被执行的指令
(9)索引寄存器(indexregister)-是在程式执行实用来更改算子位址之用。在某些架构下,模式指示寄存器(也称为“机器指示寄存器”)储存和设定跟处理器自己有关的资料。由于他们的意图目的是附加到特定处理器的设计,因此他们并不被预期会成微处理器世代之间保留的标准。
(1)内存缓冲寄存器(Memorybufferregister)
(2)内存资料寄存器(Memorydataregister)
(3)内存位址寄存器(Memoryaddressregister)
(4)内存型态范围寄存器(MemoryTypeRangeRegisters) 1、数据寄存器
数据寄存器主要用来保存操作数和运算结果等信息,从而节省读取操作数所需占用总线和访问存储器的时间。32位CPU有4个32位的通用寄存器EAX、EBX、ECX和EDX。对低16位数据的存取,不会影响高16位的数据。这些低16位寄存器分别命名为:AX、BX、CX和DX,它和先前的CPU中的寄存器相一致。
4个16位寄存器又可分割成8个独立的8位寄存器(AX:AH-AL、BX:BH-BL、CX:CH-CL、DX:DH-DL),每个寄存器都有自己的名称,可独立存取。程序员可利用数据寄存器的这种“可分可合”的特性,灵活地处理字/字节的信息。寄存器AX和AL通常称为累加器(Accumulator),用累加器进行的操作可能需要更少时间。累加器可用于乘、除、输入/输出等操作,它们的使用频率很高;寄存器BX称为基地址寄存器(BaseRegister)。它可作为存储器指针来使用;寄存器CX称为计数寄存器(CountRegister)。在循环和字符串操作时,要用它来控制循环次数;在位操作中,当移多位时,要用CL来指明移位的位数;
寄存器DX称为数据寄存器(DataRegister)。在进行乘、除运算时,它可作为默认的操作数参与运算,也可用于存放I/O的端口地址。在16位CPU中,AX、BX、CX和DX不能作为基址和变址寄存器来存放存储单元的地址,但在32位CPU中,其32位寄存器EAX、EBX、ECX和EDX不仅可传送数据、暂存数据保存算术逻辑运算结果,而且也可作为指针寄存器,所以,这些32位寄存器更具有通用性。
2、变址寄存器
32位CPU有2个32位通用寄存器ESI和EDI。其低16位对应先前CPU中的SI和DI,对低16位数据的存取,不影响高16位的数据。寄存器ESI、EDI、SI和DI称为变址寄存器(IndexRegister),它们主要用于存放存储单元在段内的偏移量,用它们可实现多种存储器操作数的寻址方式,为以不同的地址形式访问存储单元提供方便。变址寄存器不可分割成8位寄存器。作为通用寄存器,也可存储算术逻辑运算的操作数和运算结果。它们可作一般的存储器指针使用。在字符串操作指令的执行过程中,对它们有特定的要求,而且还具有特殊的功能。
32位CPU有2个32位通用寄存器EBP和ESP。其低16位对应先前CPU中的SBP和SP,对低16位数据的存取,不影响高16位的数据。寄存器EBP、ESP、BP和SP称为指针寄存器(PointerRegister),主要用于存放堆栈内存储单元的偏移量,用它们可实现多种存储器操作数的寻址方式,为以不同的地址形式访问存储单元提供方便。指针寄存器不可分割成8位寄存器。作为通用寄存器,也可存储算术逻辑运算的操作数和运算结果。
它们主要用于访问堆栈内的存储单元,并且规定:
(1)BP为基指针(BasePointer)寄存器,用它可直接存取堆栈中的数据;
(2)SP为堆栈指针(StackPointer)寄存器,用它只可访问栈顶。
4、段寄存器
段寄存器是根据内存分段的管理模式而设置的。内存单元的物理地址由段寄存器的值和一个偏移量组合而成
的,这样可用两个较少位数的值组合成一个可访问较大物理空间的内存地址。
CPU内部的段寄存器:
CS——代码段寄存器(CodeSegmentRegister),其值为代码段的段值;
DS——数据段寄存器(DataSegmentRegister),其值为数据段的段值;
ES——附加段寄存器(ExtraSegmentRegister),其值为附加数据段的段值;
SS——堆栈段寄存器(StackSegmentRegister),其值为堆栈段的段值;
FS——附加段寄存器(ExtraSegmentRegister),其值为附加数据段的段值;
GS——附加段寄存器(ExtraSegmentRegister),其值为附加数据段的段值。
在16位CPU系统中,它只有4个段寄存器,所以,程序在任何时刻至多有4个正在使用的段可直接访问;在32位微机系统中,它有6个段寄存器,所以,在此环境下开发的程序最多可同时访问6个段。32位CPU有两个不同的工作方式:实方式和保护方式。在每种方式下,段寄存器的作用是不同的。有关规定简单描述如下:
实方式:前4个段寄存器CS、DS、ES和SS与先前CPU中的所对应的段寄存器的含义完全一致,内存单元的逻辑地址仍为段值:“偏移量”的形式。为访问某内存段内的数据,必须使用该段寄存器和存储单元的偏移量。保护方式:在此方式下,情况要复杂得多,装入段寄存器的不再是段值,而是称为”选择子”(Selector)的某个值。
32位CPU把指令指针扩展到32位,并记作EIP,EIP的低16位与先前CPU中的IP作用相同。指令指针EIP、IP(InstructionPointer)是存放下次将要执行的指令在代码段的偏移量。在具有预取指令功能的系统中,下次要执行的指令通常已被预取到指令队列中,除非发生转移情况。所以,在理解它们的功能时,不考虑存在指令队列的情况。在实方式下,由于每个段的最大范围为64K,所以,EIP中的高16位肯定都为0,此时,相当于只用其低16位的IP来反映程序中指令的执行次序。
以Intel 80x86 CPU为例,80x86 CPU的寄存器组包括若干个8位、16位和32位寄存器,其中,32位寄存器是从80386 CPU开始才引入的。这些寄存器可以被分为4类,它们是通用寄存器、段寄存器、专用寄存器及其他寄存器。通常,应用程序主要使用前3类寄存器。
1. 通用寄存器
80x86 CPU的通用寄存器包括8个8位通用寄存器,它们是AL、AH、BL、BH、CL、CH、DL、DH;8个16位通用寄存器,它们是AX、BX、CX、 DX、SI、DI、BP、SP;8个32位通用寄存器,它们是EAX、EBX、ECX、EDX、ESI、EDI、EBP、ESP。80x86 CPU的通用寄存器构成如图5-11所示。其中,AL与AH、BL与BH、CL与CH、DL与DH分别对应于AX、BX、CX和DX的低8位与高8位,L 即Low(低)之意,H即High(高)之意。AX、BX、CX、DX、SI、DI、BP和SP分别对应于EAX、EBX、ECX、EDX、ESI、 EDI、EBP和ESP的低16位,EAX、EBX、ECX、EDX、ESI、EDI、EBP和ESP都是32位的。EAX(含AX、AH和AL)、 EBX(含BX、BH和BL)、ECX(含CX、CH和CL)和EDX(含DX、DH和DL)统称为数据寄存器;ESI(含SI)和EDI(含DI)统称为变址寄存器; EBP(含BP)和ESP(含SP)统称为指针寄存器。在对8/16位寄存器进行操作时,相应的16/32位寄存器的其他位不会受到影响。例如,EAX是一个32位通用寄存器,如果我们对AX进行了访问(即访问了EAX的低16位),那么EAX的高16位并不会改变。同理,我们可以使用AL来对AX的低8位进行访问,使用AH对AX的高8位进行访问,AL被修改时会影响AX,但不会影响AH,反之亦然。
通用寄存器可以作为指令的操作数,用于存储那些需要被经常访问的数据。下面对这些寄存器进行简要的说明。
EAX(累加器)
EAX 中的A即Accumulator(累加、累积之意)。EAX、AX、AL分别被称为32位、16位和8位累加器,它们是使用频率最高的通用寄存器。如图5-6所示的汇编代码中就出现了EAX寄存器。一般来说,使用累加器使指令的机器代码更短,执行速度更快。
EBX(基址寄存器)
EBX中的B即Base(基址之意)。EBX与BX常用来表示内存地址,现在所使用的PC中地址都是较大的整数,一般不会是8位,所以BL就不常使用了。
ECX(计数寄存器)
ECX中的C即Count(计数之意)。在许多指令中,ECX、CX、CL被用作计数器。例如,循环指令以ECX或CX作为隐含的循环次数,移位指令用CL作为移位次数等。
EDX(数据寄存器)
EDX中的D即Data(数据之意)。在进行乘法等运算时,常用EDX与EAX或DX与AX的组合来存放一个4字数或双字数。此外,DX也用来存放I/O端口地址。
注意:以上作用的说明仅仅表示这些寄存器的一般用法,作为通用寄存器,它们也可以被用来存储那些并非符合设计初衷的数据。例如,我们可以使用ECX存储一个普通的用来参与加法或乘法运算的数据。
ESI(源变址寄存器,Source Index)
ESI或SI在串指令中表示源数据串的地址。
EDI(目的变址寄存器,Destination Index)
EDI或DI在串指令中表示目的数据串的地址。
EBP(基址指针,Base Pointer)
EBP和BP常用来存放内存地址,它们在默认情况下指向堆栈段中的存储单元。
ESP(堆栈指针,Stack Pointer)
ESP或SP用来指示堆栈段中的栈顶地址。一般情况下不使用ESP或SP做算术运算。
2. 专用寄存器
Intel 80x86 CPU有两个32位的专用寄存器,它们分别是指令指针EIP(Instruction Pointer)和标志寄存器EFLAGS(Flags Register)。标志寄存器也称为程序状态寄存器或状态寄存器。指令指针和标志寄存器不能用作指令的操作数,它们是由CPU直接操纵的。特别地,EIP和EFLAGS的低16位分别由IP和FLAGS标识。在标志寄存器EFLAGS(或FLAGS)中有若干标志位,这些标志位用来表示CPU当前的操作方式和状态信息,用来反映指令执行结果并控制指令的执行方式。与普通的应用程序有关的主要是FLAGS中的9个标志位(或称条件码标志),包括6个状态寄存器和3个控制标志,每个标志各占一位。
状态寄存器(有时也称为条件码寄存器,简称为CCR)中存储的是状态标志,它们通常是由CPU根据指令执行结果自动设置的,用来反映指令执行结果的特征。 Intel 80x86 CPU将状态标志作为条件判断的依据,以控制程序的执行流程。在本章后面,读者会看到在汇编语言中条件跳转语句就是利用这些状态标志来进行跳转的,这也反映了机器底层的一种深刻的工作机制,现在请读者稍留一点印象,后面我们还会对此做更加深入的介绍。此外,这些标志也可以由指令来设置。其中,最常用的4个状态标志是CF、OF、SF和ZF。
现在对上述状态标志进行简要的介绍。
OF(溢出标志,Overflow Flag)
溢出标志的基本规则是溢出时置1,否则置0。即如果带符号数的运算结果超出了补码表示的范围,则OF=1,否则OF=0。
SF(符号标志,Sign Flag)
符号标志的基本规则是若运算结果为负数,则SF=1,否则SF=0。即SF取结果的最高位。
ZF(零标志,Zero Flag)
零标志的基本规则是若运算结果为0,则ZF=1,否则ZF=0。
CF(进位标志,Carry Flag)
进位标志的基本规则是若加法时结果最高位向前有进位或减法时最高位向前有借位,则CF=1,否则CF=0。
AF(辅助进位标志,Auxiliary carry Flag)
辅助进位标志也称为半进位标志,它的基本规则是若加法时结果低4位(半个字节)向前有进位或减法时结果低4位向前有借位,则AF=1,否则AF=0。该标志主要由CPU内部使用,用于BCD码调整指令。
PF(奇偶标志,Parity Flag)
奇偶标志的基本规则是若结果最低字节中1的个数为偶数,则PF=1,否则PF=0。
标志寄存器中除了有状态标志以外,还有3个控制标志,控制标志是由程序根据需要用指令来设置的,以控制某些指令的执行方式。
DF(方向标志,Direction Flag)
方向标志在串处理指令中控制信息的方向,若DF=0,则每次串操作后内存地址自动递增,否则自动递减。
IF(中断标志,Interrupt Flag)
中断标志用于控制CPU是否响应外部可屏蔽中断请求,若IF=1,则允许中断,否则禁止中断。
TF(跟踪标志,Track Flag)
跟踪标志用于控制CPU是否进入单步调试方式,当TF=1时,CPU以单步方式执行指令,即在每条指令执行结束后,产生中断1,以便对程序进行检查。特别需要说明的是,Intel 80x86 CPU没有提供直接修改该标志的指令。
专用寄存器中的指令指针EIP(或IP)与代码段寄存器CS共同作用来指示将要执行的下一条指令的内存地址。关于CPU如何确定接下来需要执行哪条指令这个话题,将在本章稍后的内容中做进一步讲述。
3. 段寄存器
Intel 80x86 CPU采用分段内存管理机制,该机制允许程序员将程序划分为相对独立的多个地址空间,每个地址空间被称作一个段(Segment),一个程序可以拥有多个代码段、多个数据段,甚至多个堆栈段。Intel 80x86 CPU中主要包括以下几种类型的段。代码段(Code Segment):用来存放程序的指令序列。
数据段(Data Segment):用来存放程序的数据。
堆栈段(Stack Segment):作为堆栈使用的内存区域。堆栈用于存储过程返回地址、过程参数和局部变量等(这个话题在第6章的函数调用中还将继续深入研究)。
Intel 80x86 CPU提供了6个16位的段寄存器,它们是CS、DS、ES、SS、FS和GS。其中FS和GS是从Intel 80386 CPU才开始引入的。
一般来说,CS、DS和SS分别用来确定当前代码段、数据段和堆栈段的段地址。ES(Extra Segment)、FS和GS常被称为附加段寄存器,它们也用来存放数据段的段地址。此外,在串操作指令中,ES用来表示目的串所在数据段的段地址。
需要说明的是,尽管可以使用段寄存器来存放普通数据,但其主要用途是指向内存段。因此为了避免不必要的麻烦,我们建议尽量不要将段寄存器用作其他目的。