之前自己DIY了一台服务器,大家都问了我不少问题,后来给朋友采购一台GPU服务器,辗转于各大厂商。甚是心累。自己DIY想的问题少一些,正式采购GPU服务器还是要考虑很多问题的。比如说性价比就有几个方面:
1、一台服务器多张卡(8张 or 10张)好,还是一台服务器搞两张卡多台服务器好,这个问题后来咨询了多个厂家,以前GPU卡都是通过SLI建立P2p access的,最大只能并行4张卡,现在有些厂家自己琢磨了一个小黑科技,通过增加一块扩展主板,8张或者10张卡全部放扩展板上,这样达到了8张卡同时建立p2p access,而不通过SLI了。从而1颗CPU可以控制8张显卡了。加速比大概是7.3倍左右。比多台服务器要好不少。
2、多台服务器建立GPU集群是一个什么模样:一台主控master节点(不需要GPU),一台数据节点(不需要GPU),然后根据需要配备GPU服务器做计算节点,整个集群要配一个千M还是万M的交换机(这个交换机的我记不清楚,反正是要一个专用的数据交换设备的),适合于大厂,就是说你一台8卡的GPU或者10卡的GPU都不能满足需求了才配集群。集群的加速比一般般,大概是3个计算节点可以达到2.1倍的样子,因为深度学习并行化本来就比较麻烦,他的模型参数交换量大,训练过程也较复杂。这一块我当时毕业论文还专门研究了。如果想要直接上集群,然后自己家的运维团队还没建起来,那必须找个专业厂家好好规划一下的。否则自己瞎折腾会得不偿失。
3、一般的小厂我觉得搞个8块的 gtx1080TI的服务器比较合适,便宜。贵一点的推荐搞个8卡的pascal的titan x。其它卡也有其它卡的功效,我个人认为这两个卡比较合算。搞个一台服务器也要考虑不少问题的,比如说GPU卡的散热,光靠nvidia的那个风扇散热是不够的,需要搞一个专业的服务器机箱来散热的,八张卡搞在一块你散热没搞好几个月就会烧坏卡。其次需要好的主板,主板是数据流动各种支撑,很重要,然后就是CPU,这些东西网上京东买不合适,还是需要专业厂家给你配的。还有就是之前说的几张卡如何建立P2p access的问题。七七八八的,要搞明白还是要些精力的,不然心里不踏实。
4、 可以省钱的地方我觉得就是不需要厂家给我装深度学习编程框架,我自己搞个tensorflow 或者caffe 分分钟的事情。这个我没有要厂家的服务。
好了,我知道的基本讲完了。上一个推荐的服务器列表,这个是我跟厂家软磨硬泡拿到的价格,厂家说给我50个团购的名额,转发给大家。我也不知道是不是厂家促销的心机,反正觉得还算合适吧。需要的记得报上樱园玻尔兹曼机的名字。
LTHPC深度学习静音工作站 LT-7048A
系统规格参数
单精度22TFLOPS
GPUs 2颗公版NVIDIA Titan X PASCAL
GPU内存 每颗GPU 12GB
CPU 双路 8核英特尔至强E5-2620 v4 2.1GHz
NVIDIA CUDA核心数量7168
系统内存 128 GB 2400 MHz DDR4
存储空间 1块800GB固态硬盘 一块10TB企业级氦气硬盘 最大支持130TB
网络 双千兆以太网 可选万兆 高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
最大系统重量 28KG
系统尺寸 深 648x 宽 452 x 高 178 (mm)
电源最高要求 1200W
工作温度范围 10 - 35°C
含税人民币63999元
LTHPC深度学习一体机 LT-7048GR
系统规格参数
单精度43.2TFLOPS
GPUs 4 颗 公版GTX 1080Ti
GPU 内存 每颗 GPU 11 GB
CPU 双路 8核英特尔至强E5-2620 v4 2.1GHz
NVIDIA CUDA核心数量14336
系统内存 128 GB 2400 MHz DDR4
存储空间 1块800GB固态硬盘 一块10TB企业级氦气硬盘 最大支持130TB
网络 双千兆以太网 可选万兆 高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
最大系统重量 28KG
系统尺寸 深 673x 宽 438 x 高 176 (mm)
电源最高要求 2000W
工作温度范围 10 - 35°C
含税人民币76999元
LTHPC深度学习一体机 LT-7048GR
系统规格参数
单精度44TFLOPS
GPUs 4 NVIDIA Titan X PASCAL
GPU 内存 每颗 GPU 12 GB
CPU 双路 8核英特尔至强E5-2620 v4 2.1GHz
NVIDIA CUDA核心数量14336
系统内存 128 GB 2400 MHz DDR4
存储空间 1块800GB固态硬盘 一块10TB企业级氦气硬盘 最大支持130TB
网络 双千兆以太网 可选万兆 高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
最大系统重量 28KG
系统尺寸 深 673x 宽 438 x 高 176 (mm)
电源最高要求 2000W
工作温度范围 10 - 35°C
含税人民币102999元
LTHPC深度学习一体机 LT-7048GR
系统规格参数
双精度18.8TFLOPS/单精度37.2TFLOPS/半精度74.8TFLOPS
GPUs 4 NVIDIA Tesla P100
GPU 内存 每颗 GPU 16 GB
CPU 双路 12核英特尔至强E5-2650 v4 2.2GHz
NVIDIA CUDA核心数量14336
系统内存 256 GB 2400 MHz DDR4
存储空间 1块800GB固态硬盘 一块10TB企业级氦气硬盘 最大支持130TB
网络 双千兆以太网 可选万兆 高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
最大系统重量 28KG
系统尺寸 深 673x 宽 438 x 高 176 (mm)
电源最高要求 2000W
工作温度范围 10 - 35°C
含税人民币299900元
LTHPC深度学习一体机 LT-4028GR
系统规格参数
单精度88TFLOPS
GPUs 8 NVIDIA Titan X PASCAL
GPU 内存 每颗 GPU 12 GB
CPU 双路 12核英特尔至强E5-2650 v4 2.2GHz
NVIDIA CUDA核心数量14336
系统内存 256 GB 2400 MHz DDR4
存储空间 4块800GB固态硬盘
网络 双千兆以太网 可选万兆 高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
最大系统重量 28KG
系统尺寸 深 737x 宽 437 x 高 178 (mm)
电源最高要求 3200W
工作温度范围 10 - 35°C
含税人民币201900元
LTHPC深度学习一体机 LT-4028GR2
系统规格参数
单精度110TFLOPS
GPUs 10 NVIDIA Titan X PASCAL
GPU 内存 每颗 GPU 12 GB
CPU 双路 12核英特尔至强E5-2650 v4 2.2GHz
NVIDIA CUDA核心数量14336
系统内存 256 GB 2400 MHz DDR4
存储空间 4块800GB固态硬盘
网络 双千兆以太网 可选万兆 高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
最大系统重量 28KG
系统尺寸 深 737x 宽 437 x 高 178 (mm)
电源最高要求 4000W
工作温度范围 10 - 35°C
含税人民币229900元
关注微信公众号 “樱园的玻尔兹曼机” 留言回复
‘’服务器‘’
三个字。
获取商谈密钥。
或添加微信 keithguofan详谈