• 计算显卡对比


    科学计算显卡的几个主要性能指标:
    1、运算能力:FLOPS 每秒浮点运算次数,TFLOPS表示每秒万亿(10^12)次浮点计算;
    2、计算性能: 
    3、显存大小:显存大小也决定了实验中能够使用的样本数量和模型复杂度。
    4. cuda 核心数量
     
    1、CUDA compute capability对比(computer capability 并不代表显卡的计算能力,主版本号说明GPU的架构,副版本号相当于更新的版本)
        GTX Titan x :5.2
        GTX 980      :5.2
     Tesla P100 :
        Tesla K80    :3.7
        Tesla K40    :3.5
        K4200         : 3.0
     
    2、计算性能(TFLOPS) 比较
                                    单精度single        双精度double
     
        GTX Titan x :     7                            0.2 
        GTX 980      :      4.6                        0.15
          Tesla P100 :      10.6                     5.3
        Tesla K80    :      8.73                      2.91 
        Tesla K40    :      4.29                      1.43
        K4200         :       2.0
     
        单精度能够保证小数点后6到7位计算准确(2^23),双精度则是14到15位(2^52)
     
    3、显存大小
     
        GTX Titan x :12Gb
        GTX 980      :4Gb
         Tesla P100 :  16G
        Tesla K80    :24Gb
        Tesla K40    :12Gb
        K4200         :4Gb
     
    4. cuda 核心数量
        GTX Titan x 
        GTX 980    
        Tesla P100 : 3584
        Tesla K80    : 4992
        Tesla K40    : 2880
        K4200      
     
    5、价格比较(网上商城京东淘宝报价)
        GTX Titan x :8000+-
        GTX 980      :6000+-
        Tesla P100    : 45000++ 
        Tesla K80    :33000+-
        Tesla K40    :25000+-
        K4200         :6000+-
     

    1、GTX 系列显卡优缺点:

        优点:单精度计算能力强大,显存最大12Gb,性价比高
     
        缺点:双精度计算能力弱,没有计算纠错ECC 内存,对于超高精度计算不利
     
    2、Tesla 或 quadro显卡优缺点:
        优点:双精度计算能力最强,拥有ECC内存增强计算准确率,
     
        缺点:单精度计算能力差,价格较高
     
    总结:单从性能上选择,Tesla K80是最强大的,但也最贵;综合性价比来考虑 GTX Titan X 最好。
     
     
     
  • 相关阅读:
    015.Python函数名的使用以及函数变量的操作
    014.Python函数
    013.Python的文件操作
    012.Python的字典和集合的相关函数
    git入门
    Visual Studio 常见的快捷键
    SVN使用
    C++ 一些特性
    C++ 引用、构造函数、移动语义
    WPF的AutoCompleteBox控件
  • 原文地址:https://www.cnblogs.com/cofludy/p/7356383.html
Copyright © 2020-2023  润新知