深度学习工作站推荐一下

深度学习工作站推荐一下

之前自己DIY了一台服务器，大家都问了我不少问题，后来给朋友采购一台GPU服务器，辗转于各大厂商。甚是心累。自己DIY想的问题少一些，正式采购GPU服务器还是要考虑很多问题的。比如说性价比就有几个方面：

1、一台服务器多张卡（8张 or 10张）好，还是一台服务器搞两张卡多台服务器好，这个问题后来咨询了多个厂家，以前GPU卡都是通过SLI建立P2p access的，最大只能并行4张卡，现在有些厂家自己琢磨了一个小黑科技，通过增加一块扩展主板，8张或者10张卡全部放扩展板上，这样达到了8张卡同时建立p2p access，而不通过SLI了。从而1颗CPU可以控制8张显卡了。加速比大概是7.3倍左右。比多台服务器要好不少。

2、多台服务器建立GPU集群是一个什么模样：一台主控master节点（不需要GPU），一台数据节点（不需要GPU），然后根据需要配备GPU服务器做计算节点，整个集群要配一个千M还是万M的交换机（这个交换机的我记不清楚，反正是要一个专用的数据交换设备的），适合于大厂，就是说你一台8卡的GPU或者10卡的GPU都不能满足需求了才配集群。集群的加速比一般般，大概是3个计算节点可以达到2.1倍的样子，因为深度学习并行化本来就比较麻烦，他的模型参数交换量大，训练过程也较复杂。这一块我当时毕业论文还专门研究了。如果想要直接上集群，然后自己家的运维团队还没建起来，那必须找个专业厂家好好规划一下的。否则自己瞎折腾会得不偿失。

3、一般的小厂我觉得搞个8块的 gtx1080TI的服务器比较合适，便宜。贵一点的推荐搞个8卡的pascal的titan x。其它卡也有其它卡的功效，我个人认为这两个卡比较合算。搞个一台服务器也要考虑不少问题的，比如说GPU卡的散热，光靠nvidia的那个风扇散热是不够的，需要搞一个专业的服务器机箱来散热的，八张卡搞在一块你散热没搞好几个月就会烧坏卡。其次需要好的主板，主板是数据流动各种支撑，很重要，然后就是CPU，这些东西网上京东买不合适，还是需要专业厂家给你配的。还有就是之前说的几张卡如何建立P2p access的问题。七七八八的，要搞明白还是要些精力的，不然心里不踏实。

4、可以省钱的地方我觉得就是不需要厂家给我装深度学习编程框架，我自己搞个tensorflow 或者caffe 分分钟的事情。这个我没有要厂家的服务。

好了，我知道的基本讲完了。上一个推荐的服务器列表，这个是我跟厂家软磨硬泡拿到的价格，厂家说给我50个团购的名额，转发给大家。我也不知道是不是厂家促销的心机，反正觉得还算合适吧。需要的记得报上樱园玻尔兹曼机的名字。

LTHPC深度学习静音工作站 LT-7048A

系统规格参数

单精度22TFLOPS
GPUs 2颗公版NVIDIA Titan X PASCAL
GPU内存每颗GPU 12GB
CPU 双路 8核英特尔至强E5-2620 v4 2.1GHz

NVIDIA CUDA核心数量7168
系统内存 128 GB 2400 MHz DDR4
存储空间 1块800GB固态硬盘一块10TB企业级氦气硬盘最大支持130TB
网络双千兆以太网可选万兆高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序（用于测试工作站是否安装正确）
最大系统重量 28KG
系统尺寸深 648x 宽 452 x 高 178 (mm)
电源最高要求 1200W
工作温度范围 10 - 35°C

含税人民币63999元

LTHPC深度学习一体机 LT-7048GR
系统规格参数

单精度43.2TFLOPS
GPUs 4 颗公版GTX 1080Ti
GPU 内存每颗 GPU 11 GB
CPU 双路 8核英特尔至强E5-2620 v4 2.1GHz

NVIDIA CUDA核心数量14336
系统内存 128 GB 2400 MHz DDR4
存储空间 1块800GB固态硬盘一块10TB企业级氦气硬盘最大支持130TB
网络双千兆以太网可选万兆高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序（用于测试工作站是否安装正确）
最大系统重量 28KG
系统尺寸深 673x 宽 438 x 高 176 (mm)
电源最高要求 2000W
工作温度范围 10 - 35°C

含税人民币76999元

LTHPC深度学习一体机 LT-7048GR
系统规格参数

单精度44TFLOPS
GPUs 4 NVIDIA Titan X PASCAL
GPU 内存每颗 GPU 12 GB
CPU 双路 8核英特尔至强E5-2620 v4 2.1GHz

NVIDIA CUDA核心数量14336
系统内存 128 GB 2400 MHz DDR4
存储空间 1块800GB固态硬盘一块10TB企业级氦气硬盘最大支持130TB
网络双千兆以太网可选万兆高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序（用于测试工作站是否安装正确）
最大系统重量 28KG
系统尺寸深 673x 宽 438 x 高 176 (mm)
电源最高要求 2000W
工作温度范围 10 - 35°C

含税人民币102999元

LTHPC深度学习一体机 LT-7048GR
系统规格参数

双精度18.8TFLOPS/单精度37.2TFLOPS/半精度74.8TFLOPS
GPUs 4 NVIDIA Tesla P100
GPU 内存每颗 GPU 16 GB
CPU 双路 12核英特尔至强E5-2650 v4 2.2GHz

NVIDIA CUDA核心数量14336
系统内存 256 GB 2400 MHz DDR4
存储空间 1块800GB固态硬盘一块10TB企业级氦气硬盘最大支持130TB
网络双千兆以太网可选万兆高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序（用于测试工作站是否安装正确）
最大系统重量 28KG
系统尺寸深 673x 宽 438 x 高 176 (mm)
电源最高要求 2000W
工作温度范围 10 - 35°C

含税人民币299900元

LTHPC深度学习一体机 LT-4028GR
系统规格参数

单精度88TFLOPS
GPUs 8 NVIDIA Titan X PASCAL
GPU 内存每颗 GPU 12 GB
CPU 双路 12核英特尔至强E5-2650 v4 2.2GHz

NVIDIA CUDA核心数量14336
系统内存 256 GB 2400 MHz DDR4
存储空间 4块800GB固态硬盘
网络双千兆以太网可选万兆高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序（用于测试工作站是否安装正确）
最大系统重量 28KG
系统尺寸深 737x 宽 437 x 高 178 (mm)
电源最高要求 3200W
工作温度范围 10 - 35°C

含税人民币201900元

LTHPC深度学习一体机 LT-4028GR2
系统规格参数

单精度110TFLOPS
GPUs 10 NVIDIA Titan X PASCAL
GPU 内存每颗 GPU 12 GB
CPU 双路 12核英特尔至强E5-2650 v4 2.2GHz

NVIDIA CUDA核心数量14336
系统内存 256 GB 2400 MHz DDR4
存储空间 4块800GB固态硬盘
网络双千兆以太网可选万兆高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序（用于测试工作站是否安装正确）
最大系统重量 28KG
系统尺寸深 737x 宽 437 x 高 178 (mm)
电源最高要求 4000W
工作温度范围 10 - 35°C

含税人民币229900元

关注微信公众号 “樱园的玻尔兹曼机” 留言回复

‘’服务器‘’

三个字。

获取商谈密钥。

或添加微信 keithguofan详谈
相关阅读:
oracle数据段详解
 监听静态注册与动态注册
 Oracle网络相关概念与常用配置文件
 pycharm社区版安装及遇到的问题
 强化学习-K摇臂赌博机
 概率图模型
 半监督学习
 卷积神经网络
 递归神经网络
 玻尔兹曼机及其相关模型
原文地址：https://www.cnblogs.com/whu-zeng/p/7298000.html