• Rocket core ALU


    https://mp.weixin.qq.com/s/C6Twva47PDyUev-BLhKLug

     

    简单介绍ALU的实现。

     

     

    1. object ALU

     

    ALU对象中定义了ALU要使用的一些常量和辅助方法。

     

    1) 常量

     

    a. SIZE_ALU_FN: 表示ALU操作类型的占用的宽度为4位;

     

    需要注意的是,这个位数只是用来表示操作类型,而不是指令中的宽度。

    比如ADDI指令中的func3域只占用3位,并且与SLTI/SLTU的值相同:

    而FN_ADD/FN_SLT/FN_SLTI占用4位,并且有不同的值:

     

    b. FN_ADD: 相加;

    c. FN_SL: 左移;

    d. FN_SR: 右移;

    e. FN_SEQ: 相等时置位;

    f. FN_SNE: 不相等时置位;

    g. FN_SLT: 小于时置位;

    h. FN_SGE: 大于等于时置位;

    i. FN_SLTU: 小于(作为无符号数进行比较)时置位;

    j. FN_SGEU: 大于等于(作为无符号数进行比较)时置位;

    k. FN_XOR: 异或;

    l. FN_OR: 按位或;

    m. FN_AND: 按位与;

    n. FN_SUB: 相减;

    o. FN_SRA: arithmetic right shift,带符号右移;

    p. 乘除法相关的类型:

    在规范中描述如下:

     

    2) 辅助方法

     

    定义对操作类型进行判断的辅助方法:

    其中:

    a. isMulFN:判断是否乘法操作;

    b. isSub:判断是否减法;

    c. isCmp:判断是否比较操作;

    d. cmpUnsigned:判断是否无符号数相比较;

    e. cmpInverted:判断是否基本判断的相反判断,比如相等是基本判断,不等是相反判断:

    f. cmpEq:是否相等判断;

     

    2. class ALU

     

    用于实现ALU的逻辑:

     

    1) io

     

    定义ALU模块的IO接口:

    其中:

    a. dw:数据宽度;

    b. fn:功能类型;

    c. in2:第二个操作数;

    d. in1:第一个操作数;

    e. out:输出结果;

    f. adder_out:加法器输出;

    g. cmp_out:比较结果输出;

     

    2) ADD/SUB

     

    实现ADD/SUB指令:

    其中:

    a. 根据操作类型是否是减法,确定io.in2是否需要取反;

    b. 如果不是减法,则in2_inv等于io.in2,而io.adder_out是相加的结果;

    c. 如果是减法,则使用取反加一的方法进行计算;

     

    3) SLT/SLTU

     

    实现SLT/SLTU操作的逻辑:

    A. 首先,判断符号位是否相同,如果相同,则取决于io.adder_out的符号位。

    此时io.adder_out中是什么呢?

    从SLT/SLTU的定义可以看出:

    其第3位都是1,也就是isSub为真:

    所以,io.adder_out中的值为io.in1-in.in2的差值;

    进而:

    a. 如果差值为负数,其符号位为1,表明io.in1 < io.in2;

    b. 如果差值非负数,其符号位为0,表明io.in1 >= io.in2;

     

    B. 其次,如果io.in1和io.in2的符号位不同,则需要区分是否要把二者看做无符号数进行比较。

    a. 如果按照无符号数进行比较,在二者符号不同的前提下,如果io.in2的符号位为1,则io.in2较大,less than为真;

    b. 如果按照有符号数进行比较,在二者符号不同的前提下,如果io.in1的符号位为1,则io.in2较大,less than为真;

     

    C. 先不考虑cmpEq,io.cmp_out := cmpInverted ^ slt,表示是否要把比较结果取反。

    如果cmpInverted为1,则取反;为0,则不取反。

     

    D. cmpEq的定义为:

    表示cmd小于8,即:

    可以看到slt/sltu都是大于8,所以cmpEq对slt指令的比较结果不影响。

     

    小于8的操作类型里面,意义为比较的操作类型为:SEQ/SNE。其实现为:

    a. 当io.fn为SEQ/SNE时,in1_xor_in2 = in1 ^ in2;

    b. in1_xor_in2为0,表示in1和in2中的各个比特都相同,也就是二者相等;

    c. 根据cmpInverted的值,决定判断结果是否需要取反;

     

    E. 这里把cmpEq和slt混合在一起的原因,是为了复用cmpInverted的判断逻辑。

     

    4) SLL/SRL/SRA

     

    实现SLL/SRL/SRA操作:

    A. shamt是shift amount的缩写,意指移位的数量;

    B. 当xLen == 32时,移动的位数shamt最多为32位,所以取io.in2的低5位;被移位的数据为io.in1;

    C. 当xLen != 32时,要求xLen必须是64,否则不支持。然后对io.in1进行补位处理:

    a. SLL/SRL/SRA中只有SRA的值大于8,其对应的isSub为真:

    如果是SL/SR,则可能用于补位的数据为32个0;

    如果是SRA,则可能用于补位的数据取决于io.in1的符号位,如果其符号位是1,则补位32个1,如果其符号位为0,则补位32个0:

    b. 如果io.dw为64位,则说明io.in1是64位的,不需要补位;如果不是,则需要使用shin_hi_32补位:

    c. 如果操作的数据宽度为32位,则移位的最大位数为32位,忽略io.in2的第5位;如果操作的数据宽度为64位,则需要使用io.in2的第5位来确定移位的位数:

    d. 返回移位数量和补位后的待移位数:

     

    D. 使用Reverse把左移操作转变为右移操作:

    a. 如果是右移操作,则不需要改变shin_r;

    b. 如果不是右移操作,即是SLL操作,把shin_r逆序;

     

    E. 把shin作为有符号数,向右移位,而后取移位结果的低xLen位:

    其中:

    a. asSInt把待移位数转变为SInt类型,调用其右移方法;有符号数的右移会补符号位;

    b. Cat(isSub(io.fn) & shin(xLen-1), shin)用于为shin添加一个正确的符号位:

    a) 如果不是SRA,则isSub为0,添加符号位0,对应逻辑移位应该以0补位;

    b) 如果是SRA,则取决于shin的符号位,再补一个符号位不改变其值;

    可以看到引入这段逻辑,不是为了b),而是为了a)。

     

    在a)中,isSub(io.fn) & shin(xLen-1)的结果是0,如果shin的符号位是0,则补位没有意义。可见这里补0是为了修正shin的符号位为1的情况。

    在操作类型(io.fn)为SLL/SRL的情况下,这里有如下可能:

    a.a. xLen == 32,io.fn == SRL,io.in1为负数;

    a.b. xLen == 32,io.fn == SLL,io.in1最低位为1;

    a.c. xLen == 64,io.dw == 64,io.fn == SRL,io.in1为负数;

    a.d. xLen == 64,io.dw == 64,io.fn == SRL,io.in1最低位为1;

     

    F. shout_r逆序之后为左移的结果:

     

    G. 根据操作类型计算移位结果:

    其中:

    a. 如果操作类型为SR/SRA,则使用shout_r;

    b. 如果操作类型为SL,则使用shout_l;

     

    5) AND/OR/XOR

     

    实现AND/OR/XOR操作:

    其中:

    a. 如果操作为XOR,则使用in1_xor_in2 = in1 ^ in2;

    b. 如果操作为AND,则使用in1 & in2;

    c. 如果操作为OR,则结果位(in1 ^ in2) | (in1 & in2);(只有一个1的位,加上有两个1的位);

     

    6) 根据操作类型,决定shift_logic的取值:

    因为操作类型同时只能去一个值,所以shift_logic的值,是从slt/logic/shout中选择一个。

     

    7) 根据是否加减法操作,决定输出adder_out还是shift_logic:

     

    8) 结果从io.out输出:

     

    9) 根据xLen及操作的数据宽度,决定是否需要对结果进行补位:

     

  • 相关阅读:
    ACwing 199 约数之和
    Acwing 222 青蛙的约会
    Acwing 220 最大公约数
    Acwing 200 Hankson的趣味题
    牛客 同余方程
    Acwing 198 反素数
    2020牛客多校 第六场B
    牛客 计数器
    Java基础-快捷键以及DOS命令
    A1111 Online Map (30分)(最短路径、Dijkstra+DFS)
  • 原文地址:https://www.cnblogs.com/wjcdx/p/16041079.html
Copyright © 2020-2023  润新知