• 深度学习工作站推荐一下


    之前自己DIY了一台服务器,大家都问了我不少问题,后来给朋友采购一台GPU服务器,辗转于各大厂商。甚是心累。自己DIY想的问题少一些,正式采购GPU服务器还是要考虑很多问题的。比如说性价比就有几个方面:

    1、一台服务器多张卡(8张 or 10张)好,还是一台服务器搞两张卡多台服务器好,这个问题后来咨询了多个厂家,以前GPU卡都是通过SLI建立P2p access的,最大只能并行4张卡,现在有些厂家自己琢磨了一个小黑科技,通过增加一块扩展主板,8张或者10张卡全部放扩展板上,这样达到了8张卡同时建立p2p access,而不通过SLI了。从而1颗CPU可以控制8张显卡了。加速比大概是7.3倍左右。比多台服务器要好不少。

    2、多台服务器建立GPU集群是一个什么模样:一台主控master节点(不需要GPU),一台数据节点(不需要GPU),然后根据需要配备GPU服务器做计算节点,整个集群要配一个千M还是万M的交换机(这个交换机的我记不清楚,反正是要一个专用的数据交换设备的),适合于大厂,就是说你一台8卡的GPU或者10卡的GPU都不能满足需求了才配集群。集群的加速比一般般,大概是3个计算节点可以达到2.1倍的样子,因为深度学习并行化本来就比较麻烦,他的模型参数交换量大,训练过程也较复杂。这一块我当时毕业论文还专门研究了。如果想要直接上集群,然后自己家的运维团队还没建起来,那必须找个专业厂家好好规划一下的。否则自己瞎折腾会得不偿失。

    3、一般的小厂我觉得搞个8块的 gtx1080TI的服务器比较合适,便宜。贵一点的推荐搞个8卡的pascal的titan x。其它卡也有其它卡的功效,我个人认为这两个卡比较合算。搞个一台服务器也要考虑不少问题的,比如说GPU卡的散热,光靠nvidia的那个风扇散热是不够的,需要搞一个专业的服务器机箱来散热的,八张卡搞在一块你散热没搞好几个月就会烧坏卡。其次需要好的主板,主板是数据流动各种支撑,很重要,然后就是CPU,这些东西网上京东买不合适,还是需要专业厂家给你配的。还有就是之前说的几张卡如何建立P2p access的问题。七七八八的,要搞明白还是要些精力的,不然心里不踏实。

    4、 可以省钱的地方我觉得就是不需要厂家给我装深度学习编程框架,我自己搞个tensorflow 或者caffe 分分钟的事情。这个我没有要厂家的服务。 

    好了,我知道的基本讲完了。上一个推荐的服务器列表,这个是我跟厂家软磨硬泡拿到的价格,厂家说给我50个团购的名额,转发给大家。我也不知道是不是厂家促销的心机,反正觉得还算合适吧。需要的记得报上樱园玻尔兹曼机的名字。

    LTHPC深度学习静音工作站 LT-7048A

    系统规格参数 

    单精度22TFLOPS
    GPUs 2颗公版NVIDIA Titan X PASCAL  
    GPU内存 每颗GPU 12GB
    CPU 双路 8核英特尔至强E5-2620 v4 2.1GHz

    NVIDIA CUDA核心数量7168
    系统内存 128 GB 2400 MHz DDR4
    存储空间 1块800GB固态硬盘 一块10TB企业级氦气硬盘 最大支持130TB
    网络 双千兆以太网 可选万兆 高速IB
    软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
    最大系统重量 28KG
    系统尺寸 深 648x 宽 452 x 高 178 (mm)
    电源最高要求 1200W
    工作温度范围 10 - 35°C

    含税人民币63999元

    LTHPC深度学习一体机 LT-7048GR
    系统规格参数 

    单精度43.2TFLOPS
    GPUs 4 颗 公版GTX 1080Ti 
    GPU 内存 每颗 GPU 11 GB
    CPU 双路 8核英特尔至强E5-2620 v4 2.1GHz

    NVIDIA CUDA核心数量14336
    系统内存 128 GB 2400 MHz DDR4
    存储空间 1块800GB固态硬盘 一块10TB企业级氦气硬盘 最大支持130TB
    网络 双千兆以太网 可选万兆 高速IB
    软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
    最大系统重量 28KG
    系统尺寸 深 673x 宽 438 x 高 176 (mm)
    电源最高要求 2000W
    工作温度范围 10 - 35°C

    含税人民币76999元

    LTHPC深度学习一体机 LT-7048GR
    系统规格参数 

    单精度44TFLOPS
    GPUs 4 NVIDIA Titan X PASCAL 
    GPU 内存 每颗 GPU 12 GB
    CPU 双路 8核英特尔至强E5-2620 v4 2.1GHz

    NVIDIA CUDA核心数量14336
    系统内存 128 GB 2400 MHz DDR4
    存储空间 1块800GB固态硬盘 一块10TB企业级氦气硬盘 最大支持130TB
    网络 双千兆以太网 可选万兆 高速IB
    软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
    最大系统重量 28KG
    系统尺寸 深 673x 宽 438 x 高 176 (mm)
    电源最高要求 2000W
    工作温度范围 10 - 35°C

    含税人民币102999元

    LTHPC深度学习一体机 LT-7048GR
    系统规格参数 

    双精度18.8TFLOPS/单精度37.2TFLOPS/半精度74.8TFLOPS
    GPUs 4 NVIDIA Tesla P100  
    GPU 内存 每颗 GPU 16 GB
    CPU 双路 12核英特尔至强E5-2650 v4 2.2GHz

    NVIDIA CUDA核心数量14336
    系统内存 256 GB 2400 MHz DDR4
    存储空间 1块800GB固态硬盘 一块10TB企业级氦气硬盘 最大支持130TB
    网络 双千兆以太网 可选万兆 高速IB
    软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
    最大系统重量 28KG
    系统尺寸 深 673x 宽 438 x 高 176 (mm)
    电源最高要求 2000W
    工作温度范围 10 - 35°C

    含税人民币299900元

    LTHPC深度学习一体机 LT-4028GR
    系统规格参数 

    单精度88TFLOPS
    GPUs 8 NVIDIA Titan X PASCAL 
    GPU 内存 每颗 GPU 12 GB
    CPU 双路 12核英特尔至强E5-2650 v4 2.2GHz

    NVIDIA CUDA核心数量14336
    系统内存 256 GB 2400 MHz DDR4
    存储空间 4块800GB固态硬盘 
    网络 双千兆以太网 可选万兆 高速IB
    软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
    最大系统重量 28KG
    系统尺寸 深 737x 宽 437 x 高 178 (mm)
    电源最高要求 3200W
    工作温度范围 10 - 35°C

    含税人民币201900元

    LTHPC深度学习一体机 LT-4028GR2
    系统规格参数 

    单精度110TFLOPS
    GPUs 10 NVIDIA Titan X PASCAL 
    GPU 内存 每颗 GPU 12 GB
    CPU 双路 12核英特尔至强E5-2650 v4 2.2GHz

    NVIDIA CUDA核心数量14336
    系统内存 256 GB 2400 MHz DDR4
    存储空间 4块800GB固态硬盘 
    网络 双千兆以太网 可选万兆 高速IB
    软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
    最大系统重量 28KG
    系统尺寸 深 737x 宽 437 x 高 178 (mm)
    电源最高要求 4000W
    工作温度范围 10 - 35°C

    含税人民币229900元

    关注微信公众号 “樱园的玻尔兹曼机” 留言回复

    ‘’服务器‘’

    三个字。

    获取商谈密钥。

    或添加微信 keithguofan详谈

  • 相关阅读:
    oracle数据段详解
    监听静态注册与动态注册
    Oracle网络相关概念与常用配置文件
    pycharm社区版安装及遇到的问题
    强化学习-K摇臂赌博机
    概率图模型
    半监督学习
    卷积神经网络
    递归神经网络
    玻尔兹曼机及其相关模型
  • 原文地址:https://www.cnblogs.com/whu-zeng/p/7298000.html
Copyright © 2020-2023  润新知