天河一号是今年秋天中国超级计算机领域的大事件(凤凰新闻),我特意关注了一下超级计算机前500强排行榜,并摘抄前六名的数据如下:
# | System Name | Vendor | OS | Processor | Interconnect | Rmax (PFlops) | Rpeak (PFlops) | Cores | Installation Year |
1 | Jaguar | Cray Inc. | Linux | AMD Six Core 2600 MHz | Proprietary | 1.759 | 2.331 | 224162 | 2009 |
2 | Roadrunner | IBM | Linux | PowerXCell 8i 3200 MHz | Infiniband | 1.042 | 1.376 | 122400 | 2009 |
3 | Kraken XT5 | Cray Inc. | Linux | AMD Six Core 2600 MHz | Proprietary | 0.832 | 1.029 | 98928 | 2009 |
4 | JUGENE | IBM | CNK/SLES 9 | PowerPC 450 850 MHz | Proprietary | 0.826 | 1.003 | 294912 | 2009 |
5 | Tianhe-1 | NUDT | Linux | Intel EM64T Xeon 2530 MHz | Infinband DDR 4x | 0.563 | 1.206 | 71680 | 2009 |
6 | Pleiades | SGI | SLES10 + SGI ProPack 5 | Intel EM64T Xeon 3000 MHz | Infiniband | 0.544 | 0.673 | 56320 | 2009 |
可见天河一号 Rmax/Rpeak 的比率仅仅为 0.467, 效率是前10名中最低的, 如果猜的不差应该是因为它CPU和GPU混搭的结构导致的 (Intel Xeon processors and AMD GPUs,前10只有天河一号是这种架构) , 看来GPU走向通用高性能计算还要个三五年才能修成正果。另外国内新闻号称天河一号达到了PFlops(每秒10^15次浮点运算)量级,由上表可见是吹牛了,那只是理论峰值而已。
出版于2003年的“The Sourcebook of Parallel Computing” 预计第一个PFlops的超级计算机会在2009年出现,结果保守了,2008年下半年就有了,真所谓形式比人强啊! :)
“超级计算机前500强排行榜”一直以来都采用LINPACK程序做基准测试,前几天心血来潮也用LINPACK测了一下我新买的DELL Studio 14笔记本,RMax 是 16.7893 GFLOPS,还行,是排第一个Jaguar的大约10万分之一 (1/104,769),:) 而新闻上讲nVidia's Tesla C1060 GPU 单精度浮点运算可以达到 933 GFLOPS,看来未来的高性能计算中,GPU必然占越来越大的份额这一点是无需质疑的了。