• DDR,GDDR,HBM的进化和区别


    DDR就是双倍速率。

    • 1600MHz的内存条为例,X64的位宽,带宽就是:1600MHz*2倍速率*64bit/8/1000=3.2*8=25.6GB/s;
      • 8ChannelIntel ICX处理器为例,带宽可以达到8*25.6GB/s=204.8GB/s
      • 8ChannelAMD ROME处理器为例,带宽可以达到8*25.6GB/s=204.8GB/s
    • 1333MHz的内存条为例,X64的位宽,带宽就是:1333*2倍速率*64bit/8/1000=2.666*8=21.328GB/s;
      • 6ChannelIntel SKL处理器为例,带宽可以达到6*21.328GB/s=127.968GB/s

     

    GDDR可以做到四倍速率。

    • 1750MHz的内存为例,单个颗粒X64的位宽,带宽就是:1750MHz*4倍速率*64bit/8/1000=7*8=56GB/s
      • Nvidia Geforce GTX 1080 Ti为例,使用了11GBGDDR5X,内存时钟是2750MHz4倍频,内存频率是11GHz,内存位宽是X352bit,那么内存带宽为:2750MHz*4倍速率*352bit/8/1000=484GB/s
      • Nvidia Geforce RTX 2080 Ti为例,使用了11GBGDDR6,内存时钟是3500MHz4倍频,内存频率是14GHz,内存位宽是X352bit,那么内存带宽为:3500MHz*4倍速率*352bit/8/1000=616GB/s

    优点是带宽比较高,功耗比较低。

    缺点是,适合并发,不适合随机访问;时序复杂,工艺要求高;不适合配合CPUCache line的读取。

     

    HBM双倍速率,但是堆叠提高位宽。

    2013年是HBM2016年是HBM2

    优势在堆叠,通过TSV和基底通信

    每个die2128bit位宽的Channel

    4层堆叠叫做4-Hi,带宽可以达到4*2*128=1024bit

    • HBM500MHz的内存为例,单个颗粒的带宽可达到:500Mhz*2倍频*2Channel*128bit*4Die/8/1000=1GHz*1024bit/8=128GB/s
    • HBM2时钟加倍,以500MHz的内存为例,单个颗粒的带宽可以达到2*128GB/s=256GB/s

    Nvidia Tesla V100S为例(GPUHBM之间使用硅中介进行2.5D的封装)

    应当是使用了4颗,带宽为:1107MHz*2倍频*4096bit/8/100=1113.568GB/s

    HBM的优势封装比较小,堆叠设计。缺点是TSV工艺造成成本比较高。


    万事走心 精益求美


  • 相关阅读:
    面向对象的-作用域
    什么时候会有作用域的形成
    面向对象-作用域
    1.3tableView向左滑动出现多个按钮操作
    tableView自带删除与添加操作
    使用偏好设置归档放到哪里
    使用RSA对数据进行加密
    12.22UIAlertController 使用
    在PCH中定制自己的LOG打印日志,分别在DEBUG 与 RELEASE的状态下处理,及如何把PCH引入到项目中
    在程序document文件夹里边创建新的文件夹及删除文件夹
  • 原文地址:https://www.cnblogs.com/kongchung/p/11955514.html
Copyright © 2020-2023  润新知