一个完整的指令集结构包括
Instuction Fetch |
Instuction Decode |
Operand Fetch |
Excute |
Result Store |
Next Instruction |
我们必须解决的问题包括:
- 指令的编码方式(即如何编码)
- 操作数和操作结构的存放位置
- 存放位置
- 多少个现实操作数
- 存储器操作数如何定位
- 那些操作数可以或不可以放到存储器中
- 数据的类型和大小
- 支持哪些操作
- 下一条指令的地址
- jumps,conditions,branches
- fetch-decode-execute is implicit
- 有关ISA的若干问题
- 分类
-
stack 0 address ADD tos<---tos+next Accumulator 1 address ADD A acc<---acc+mem[A] 1+x address ADDX A acc<---acc+mem[A+x] Register-memory 2 address ADD A B EA[A]<---EA[A] 3 address add A B C EA[A]<---EA[B]+EA[C] Load-Store 3 address add A B C A<---B+C load A B A<---mem[B] - 通用寄存器型(R-M R-R)占主导地位
- 寄存器比存储器更快
- 对便一起来说寄存器更容易使用
- 尾端问题
-
- little endian,big endian,在一个字内部的字节顺序问题,例如在地址xxx00指定了一个字(int),存储器中从xxx00连续存放ffff0000,有两种表示方式:
- 小端方式:xxx00位置是字的最低字节,数值为0000ffff。x86,dec vax,windows NT
- 大端方式:xxx00位置是字的最高字节,数值为ffff0000。IBM 360/370,Motorola,MIPS
- little endian,big endian,在一个字内部的字节顺序问题,例如在地址xxx00指定了一个字(int),存储器中从xxx00连续存放ffff0000,有两种表示方式:
-
- 对齐问题
- 对一个s字节的对象访问,地址为A,如果A mod s ==0,则是边界对齐
- 这是由于存储器本身的读写要求的。没有对其的对象可能会导致存储器两次读写。
- 基准测试结果:
- 偏移寻址、立即数寻址、寄存器寻址方式,其使用频度为75%~99%
- 偏移字段大小为12~16bits,可满足75%~99%的需求
- 立即数字段大小为8~16bits,可满足50%~80%的需求
-
- 分类
操作数类型和操作数表示
类型:是面向应用、面向软件系统处理的各种操作数据类型。整型、浮点型、字符、字符串、向量类型;类型由操作码确定。
表示:操作数在机器中的表示,硬件结构能够识别,指令系统可以直接使用的表示格式。整型(原码、补码、反码),浮点(IEE 754标准),十进制(BCD码,二进制十进制表示)
- ISA研究的问题
- ISA的分类
- 操作数部分
- 理解存储器地址(尾端+对齐问题)
- 寻址方式
- 操作数的类型、表示和大小问题
- 操作码部分
- 支持哪些类型的操作
- 指令格式
- 研究的方法:基于统计的方法
- 结论:
- 常用的寻址方式:立即数、偏移寻址、寄存器寻址
- 偏移字段的大小:12~16bits
- 立即数字段的大小8~16bits
- 操作数大小:单字、双字的数据访问频率高;64字长更具一般性
- ISA的功能设计
- 任务:确定硬件支持哪些操作
- 方法:统计
- 类型:CICS和RISC
- 控制类指令
- 条件分支最常见
- 寻址方式:pc-relative和偏移地址至少8位;即动态的转移地址方式
- CISC
- 强化指令功能,减少程序中指令条数
RISC计算机指令集结构的功能设计
- 特点:
- 大多数指令在单周期内完成
- 采用load、store结构
- 硬布线控制逻辑
- 减少指令和寻址方式种类
- 固定的指令格式
- 注重代码的优化
- 面向寄存器结构
- 重视流水线的执行效率--》尽量减少断流
- 重视优化编译技术
- RISC为了使流水线高效执行
- 简单而统一的指令译码
- 大部分指令可以单周期完成
- 只有load/store指令访存
- 简单寻址技术
- 采用load延迟技术
- 为了便于优化编译产生优化代码
- 三地址指令格式
- 较多适量的寄存器
- 对称的指令格式
- RISC的关键技术
- 延迟转移技术
- 指令取消技术
- 重叠寄存器窗口技术
- 处理器中设置多个寄存器堆,并划分多个窗口
- 每个过程使用其中相邻的三个窗口和一个公共的窗口
- 一个与前一个过程公用;一个与下一个过程公用;一个作为局部寄存器
- 指令调整技术
- 硬件为主,固件为辅
- 频率较高的指令:load,store,add,subtract,move register-register,and,shift,compare equal,compare not equal,branch,jump,call,return
- 控制类指令:conditional branch,jump,procedure calls,procedure returns
- 控制类指令的寻址方式:pc-relative
- 编译时不知道转移地址,程序执行时动态确定
- 转移地址放到某一寄存器中
- 指令编码方式
- 长度可变
- 长度固定
- 混合
MIPS寻址方式/指令格式(所有指令都是32bit)
- 寄存器直接寻址
- 立即数寻址
- 基址寻址
- pc相对寻址
- 寄存器间接寻址
现代编译技术与计算机体系结构设计
- ISA设计需要了解的有挂compiler的问题
- 如何分配变量
- 高级语言分配数据的区域
- stack
- 用来分配局部变量;用来存储活动记录(call和return),工作堆栈指针访问其中的内容
- global data area
- 用来分配被静态说明的对象,如常亮和全局变量、其中数组和其他聚集类型的数据结构比例大。
- heap
- 分配动态对象,用指针访问,通常不是标量。全局变量和堆变量因为存在别名问题而无法分配寄存器
- stack
- 高级语言分配数据的区域
- 如何寻址变量
- 需要多少寄存器
- 优化技术对指令使用频率的影响
- 使用哪些控制结构
- 如何分配变量
- MIPS指令集结构
- MIPS的寄存器
- 32个64bit通用寄存器(GPRS)
- r0,r1,...,r31
- 整数寄存器
- r0 = 0
- 32个64bit浮点寄存器(FPRS)
- f0,f1,...,f31
- 用来存放32个单精度浮点数(32bit),也可以用来存放32个双精度浮点数(64bit)
- 存放单精度数时,只用了FPR的一半;
- 一些特殊寄存器
- 可以与通用寄存器交换数据
- 浮点状态寄存器保存浮点操作的结果
- 32个64bit通用寄存器(GPRS)
- MIPS的数据表示
- 整数
- 字节8bit ;半字16bit;字32bit;双字64bit
- 浮点数 单精度(32bit),双精度(64bit)
- 字节、半字、字被装入64位寄存器时,零扩展或符号扩展。
- 整数
- 寻址方式
- 立即数寻址和偏移量寻址,其立即数、偏移量字段都是16bit
- 寄存器间接寻址是通过把0作为偏移量来实现的
- 16bit绝对寻址是通过把R0作为基址寄存器来实现
- mips的存储器按字节寻址,地址为64bit
- 所有的存储器访问都是边界对齐
- 指令格式
- 寻址方式编码到操作码中
- 所有指令都是32bit
- 操作码占6bit
- 3中指令格式
- I类指令
- ,立即数字段为16bit,用于提供立即数和偏移量
-
load指令 访存有效地址:Regs[rs]+immediate
从存储器取来的数据放入寄存器rt中 store指令 访存有效地址:Regs[rs]+immediate 从存储器取来的数据放入寄存器rt中 立即数指令 Regs[rt]<---Regs[rs] op immediate 分支指令 目标转移地址:Regs[rs]+immediate rt无用 寄存器跳转、寄存器跳转并连接 转移目标地址为Regs[rs]
- R类指令
- 包括ALU指令,专用寄存器读/写指令,move指令
- ALU指令 Regs[rd]<---Regs[rs] func Regs[rt],func为具体的运算操作编码
- J类指令
- 包括跳转指令、跳转并连接指令、自陷指令、异常返回指令;
- 指令字的低26位是偏移量,左移两位,与pc值相加,形成跳转的地址。
- I类指令
- 指令的分类(load/store,ALU操作,分支与跳转,浮点操作)
- 符号的意义
- x<---ny:从y传送n位到x
- x,y<---z:把z传送到x和y
- 下标:表示字段中具体的位;对于指令和数字,按从最高位到最低位(左--》右)顺序依次编号,最高位为第0位,次高位为第1位。
- 下表可以是数字或者一个范围;Regs[R4]0,即R4的符号位;Regs[R4]56...63的最低位
- Mem:表示主存,按字节寻址
- 上标:用于表示对字段进行复制的次数;032一个32位全0的字段
- 符号##,用于连个字段的拼接,并且可以出现在数据传送的任何一边。eg,R8、R10为64位的寄存器,则Regs[R8]32..63<---32(Mem[Regs[R6]]0)24##Mem[Regs[R6]];表示的是,以R6的内容作为地址访问内存,得到的字节按符号位扩展的32位后存入R8的低32位,R8的高32位(即Regs[R8]0..31)不变。
- x<---ny:从y传送n位到x
-
LD R2,20(R3) 装入双字 Regs[R2]<---64(Mem[20+Regs[R3]]) LW R2,40(R3) 装入字 Regs[R2]<---64(Mem[40+Regs[R3]]0)32 ## Mem[40+Regs[R3]] LB R2,30(R3) 装入字节 Regs[R2]<---64(Mem[30+Regs[R3]]0)56 ## Mem[40+Regs[R3]] LBU R2,40(R3) 装入无符号字节 Regs[R2]<---64056 ## Mem[40+Regs[R3]] LH R2,30(R3) 装入半字 Regs[R2]<---64(Mem[30+Regs[R3]]0)48 ## Mem[30+Regs[R3]]##Mem[31+Regs[R3]] L.S F2,60(R4) 装入半字 Regs[F2]<---64Mem[60+Regs[R4]] ## 032 L.D F2,40(R3) 装入双精度浮点数 Regs[F2]<---64Mem[40+Regs[R3]] SD R4,300(R5) 保存双字 Mem[300+Regs[R5]]<---64Regs[R4] SW R4,300(R5) 保存字 Mem[300+Regs[R5]]<---32Regs[R4] S.S F2,40(R2) 保存单精度浮点数 Mem[40+Regs[R2]]<---32Regs[F2]0..31 SH R5,502(R4) 保存半字 Mem[502+Regs[R4]]<---16Regs[R5]48..63 -
- ALU指令
-
DADDU R1,R2,R3 无符号加 DADDIU R4,R5,R6 加无符号立即数 LUI R1,#4 把一个立即数装入到一个字的高16位 Regs[R1]<---032 ## 4 ## 016 DSLL R1,R2,#5 逻辑左移 Regs[R1]<---Regs[R2]<<5 DSLT R1,R2,R3 置小于 if(Regs[R2]<Regs[R3]) then Regs[R1]<---1 else Regs[R1]<---0
- 控制类指令
-
J name 跳转 PC36..63<--- name<<2 JAL name 跳转并连接 Regs[R31]<-- PC+4;PC36..63<---name<<2;((PC+4)-227)<=neme<((PC+4)+227) JALR R3 寄存器跳转并连接 Regs[R31]<--- PC+4;PC<--Regs[R3] JR R5 寄存器跳转 PC<-- Regs[R5] BEQZ R4,name 等于零时分支 if(Regs[R4]==0) then PC<-- name;((PC+4)-217)<=name<((PC+4)+217) BNE R3,R4,name 不相等时分支 ((PC+4)-217)<= name < ((PC+4)+217) MOVZ R1,R2,R3 等于零时移动 if(Regs[R3]==0) then Regs[R1]<--Regs[R2] - 跳转指令(根据目标指令确定目标指令的方式不同以及是否跳转时连接,可以将跳转指令分为4类)
- 目标地址的确定方式:把指令中的26位偏移量左移2位后,替换pc中的低28位;由指令中指定的一个寄存器来给出目标转移地址
- 跳转的两种类型:简单跳转(把目标地址送入程序计数器);跳转并连接,将目标指令送入程序计数器,把返回地址(下一条)放入寄存器R31
- 分支指令(跳转转移)
- 分支指令指令的目标地址,由16位带符号偏移量左移两位后和pc相加决定。
- 浮点条件分支指令:通过测试浮点状态寄存器来决定是否进行分支。
- MIPS的寄存器