• 浮点数的定点化


    一、概念

    1、浮点数:小数点位置是漂浮不定的。

      例如:浮点数运算 1.1 * 1.1 = 1.21,小数点位置发生了变化。

      IEEE 754 规定,浮点数的表示方法为:

      最高的 1 位是符号位 s,接着的 8 位是指数E,剩下的 23 位为有效数字 M。

    2、定点数:小数点的位置是确定的。

      例如:定点数运算 1.1 * 1.1 = 1.2,小数点的位置没有变化。

     

       定点的意思是,小数点固定在 32 位中的某个位置,前面的是整数,后面的是小数。

      小数点具体固定在哪里,可以自己在程序中指定。

    二、Verilog表示定点数

      FPGA 的寄存器只可以表示正整数,通过约定【最高位为符号位】则可以表达负整数了。同理,带小数点的定点数也是可以通过一些约定来表示。

      约定方法:确定小数点的位置。如下图所示,Qn表示小数点的位置,n为多少表示有多少位小数,看看同样的二进制数字“10101”会变成什么。

    二进制数    小数点位置    对应定点数
     10101        Q0        10101
     10101        Q1        1010.1
     10101        Q2        101.01
     10101        Q3        10.101
     10101        Q4        1.0101
     10101        Q5        0.10101

      因此我们只要定位了小数点位置后,就可以在FPGA中表达带小数的定点数。

    三、浮点数的定点化

      两个 16 位的浮点数运算,最高位是符号位: 2.918 * 3.1415926 = 9.1671672068,尝试将浮点数进行定点化。

    1、定点转换(Qn=12)

      符号1位,整数取3位(实际2位就够),小数12位,可以看成把 1 分成了 212份,因此:

    • 2.918  * 212        = 11952.168         = 11952;
    • 3.1415926 * 212 = 12867.8632896 = 12868;

    2、定点数相乘

      11952 * 12868 = 153798336。

    3、结果还原

      相乘后,整数部分为 6 位,小数部分为 24 位。因此结果 = 153798336 / 224 = 9.167095184326171875,和原计算值差距非常小。

    4、量化误差和量化精度

      小数点的位置不同带来的量化误差不同,例如上面定点转换的过程中出现的小数点进行了四舍五入,这是因为 2.918 无法完全用 1/212来表示。小数位数越多,表示的量化精度越高,小数位为 Qn,最大量化精度为 1/2n

    5、无损定点化

      所谓【无损定点化】只是数学概念,只要量化误差小于精度的一半,就认为是“无损”的。按照这个标准,那对小数点采取四舍五入的结果必然是无损的。但是校招时很多题采取的是“量化后直接去除小数”,那么小数大于 0.5 则不是无损的了。

    四、例题

    1、【大疆】对 12.918 做无损定点化,需要的最小位宽是多少位?位宽选择 11 位时的量化误差是多少?

    A   13位,0.0118
    B   12位,0.0118
    C   13位,0.0039
    D   12位,0.0039

      分析:(1)整数 12 需要 4bit。假设位宽选择12位,即小数需要 8bit,12.918 * 28 = 3307.008,定点化后的小数小于0.5,可以看成是【无损定点化】,固答案为 12 位;(2)位宽选择11位,即小数需要 7bit,12.918 * 27 = 1653.504,量化误差为 0.504/27 = 0.0039375,固答案为0.0039。

      答案:结合分析,得出答案为D。

    2、【大疆】对12.758做无损定点化,需要的最小位宽是多少位?位宽选择为8位时的量化误差是多少?

    A   11位,0.008
    B   11位,0.08
    C   12位,0.008
    D   12位,0.08

      分析:(1)整数 12 需要 4bit。假设位宽选择11位,即小数需要 7bit,12.758 * 27 = 1633.024,定点化后的小数小于0.5,可以看成是【无损定点化】,固答案为 11 位;(2)位宽选择 8 位,即小数需要 4bit,12.758 * 24 = 204.128,量化误差为 0.128/24 = 0.008,固答案为0.008。

      答案:结合分析,得出答案为A。

      感觉这题的第一问有些毛病,位宽为 8 位时也符合【无损定点化】。我算了一下,位宽为 7 位(小数为3位)时仍然是【无损定点化】,位宽为 6 位时才不是【无损定点化】。但这是选择题,只能选 A 了。

    参考资料:

    http://fpgabbs.com/thread-771-1-1.html

    https://www.cnblogs.com/bixiaopengblog/p/7728538.html

    https://mp.weixin.qq.com/s/kKMyIzrPBJDdLRd71WjDKg

  • 相关阅读:
    关于String和StringBuilder、StringBuffer的一个简单性能测试
    HTML网页BODY中如何设置背景图拉伸的最有效方法
    JS鼠标事件大全
    去除链接虚线框的推荐方法
    CSS实现文字颠倒旋转效果
    三种方法解决IE6下png透明失效的问题
    js获取节点 dom操作
    IE HACK
    javascript作用域(Scope)
    RGB配色表
  • 原文地址:https://www.cnblogs.com/xianyufpga/p/13518872.html
Copyright © 2020-2023  润新知