计算显卡对比

计算显卡对比

科学计算显卡的几个主要性能指标：

1、运算能力：FLOPS 每秒浮点运算次数，TFLOPS表示每秒万亿（10^12）次浮点计算；

2、计算性能：

3、显存大小：显存大小也决定了实验中能够使用的样本数量和模型复杂度。

4. cuda 核心数量

1、CUDA compute capability对比（computer capability 并不代表显卡的计算能力，主版本号说明GPU的架构，副版本号相当于更新的版本）

GTX Titan x ：5.2

GTX 980 ：5.2

　Tesla P100　:

Tesla K80 ：3.7

Tesla K40 ：3.5

K4200 ： 3.0

2、计算性能（TFLOPS）比较

                            单精度single     双精度double

GTX Titan x ： 7                     0.2

GTX 980 ：     4.6 0.15

Tesla P100　: 10.6 5.3

Tesla K80 ： 8.73 2.91

Tesla K40 ： 4.29 1.43

K4200 ： 2.0

单精度能够保证小数点后6到7位计算准确（2^23），双精度则是14到15位(2^52)

3、显存大小

GTX Titan x ：12Gb

GTX 980 ：4Gb

Tesla P100　: 16G

Tesla K80 ：24Gb

Tesla K40 ：12Gb

K4200 ：4Gb

4. cuda 核心数量

GTX Titan x

GTX 980

Tesla P100　: 3584

Tesla K80 ： 4992

Tesla K40 ： 2880

K4200

5、价格比较（网上商城京东淘宝报价）

GTX Titan x ：8000+-

GTX 980 ：6000+-

Tesla P100 ： 45000++

Tesla K80 ：33000+-

Tesla K40 ：25000+-

K4200 ：6000+-

1、GTX 系列显卡优缺点：

优点：单精度计算能力强大，显存最大12Gb，性价比高

缺点：双精度计算能力弱，没有计算纠错ECC 内存，对于超高精度计算不利

2、Tesla 或 quadro显卡优缺点：

优点：双精度计算能力最强，拥有ECC内存增强计算准确率，

缺点：单精度计算能力差，价格较高

总结：单从性能上选择，Tesla K80是最强大的，但也最贵；综合性价比来考虑 GTX Titan X 最好。
相关阅读:
015.Python函数名的使用以及函数变量的操作
 014.Python函数
 013.Python的文件操作
 012.Python的字典和集合的相关函数
 git入门
 Visual Studio 常见的快捷键
 SVN使用
 C++ 一些特性
 C++ 引用、构造函数、移动语义
 WPF的AutoCompleteBox控件
原文地址：https://www.cnblogs.com/cofludy/p/7356383.html