人工智能芯片支持超低功耗器件的推理
AI chip supports inference in ultra-low-power devices
伦敦——下一代GreenWaves的超低功耗人工智能加速器GAP9,在处理比其前身GAP8大10倍的算法时,其功耗将减少5倍。新设备将提供高达50mW,总功耗为50兆瓦。这要归功于结构改进和最新的FD-SOI(完全耗尽绝缘体上的硅)工艺技术的结合。
与上一代设备一样,GAP9的目标是在网络最边缘的系统中进行人工智能推断,例如小型、电池供电的物联网传感器节点。例如,GreenWaves的数据显示GAP9在160 x 160图像上运行MobileNet V1,通道缩放仅需12毫秒,功耗为806μW/帧/秒。
总部位于法国格勒诺布尔的GreenWaves选择了GlobalFoundries的22nm FDX FD-SOI工艺,以最大限度地降低本已是超低功耗架构的功耗。
“对于GAP9,利用客户对GAP8的反馈调整了GAP8的架构,但同时也转向了市场领先的半导体工艺,”GreenWaves营销副总裁Martin Croome说。“正在利用FD-SOI中的体偏压能力来实现更低的功耗。”
架构改进
GreenWaves为GAP9做了一些架构上的改进。
又增加了一个RISC-V内核,使总数达到10个。在某些模式下,一个核心用作织物控制器以及低强度计算。其九个组成一个计算集群,共享一级数据区。这个集群中的一个核心(新内核)被用作任务组主机,计算内存移动并管理其8个核心上的任务。
内部RAM增加了三倍,达到1.6MB,内存带宽增加到了41.6GB/s,L2达到了7.2GB/s。
“这(内存带宽)现在对MCU类设备非常重要,”克罗姆说。
GreenWaves的GAP9超低功耗AI芯片的架构现在使用10个RISC-V内核。
GAP9架构的变化还包括更高的最高频率;GAP8的时钟频率为175MHz,GAP9将运行在或接近400MHz。新的电力状态也被加入,包括“昏睡”状态,当数据可以获得,但功率消耗仍然低于1兆瓦。在这种状态下,处理器可以运行在一个低压差调节器(LDO)上,可以快速启动。这使得GAP9第一次指令的时间缩短到了几微秒(Croome说,GAP8在等待DC-DC转换器稳定下来的过程中花费了大约700微秒)。这种快速启动功能在捕获基于时间的信号(如语音)时非常有用。
所有10个核心现在都能够处理“transprecision”浮点数:IEEE格式16和32位浮点加上支持矢量化的附加8位和16位格式。此功能可用于降低需要浮点运算法则的能量需求。GAP9还支持矢量化的4位和2位运算,用于开发深度量化的应用程序。
其新功能包括双向多通道音频接口。
GAP9预计将于2021年实现量产,并于2020年上半年提供样品。克罗姆说,预计定价将比GAP8溢价50%。考虑到不同的时间、功率数据和价位,该公司预计这两款产品都会找到未来的市场。