记录问题:
昨天新到一批GPU (N卡),M40 + M60 + M6 + M4
使用nvidia-smi看不到的 product-name,亦即,那一项显示的内容为ERR!
但是其他的部分内容,例如nivdia-smi -d CLOCK什么的都是可以查看的,
确诊:驱动版本太低;
解决:升级驱动;
在 http://www.nvidia.com/download/driverResults.aspx/97645/en-us 这里下载驱动,注意的是,虽然这里有tesla和geforce的区别,但是
下载下来发现,同一时间节点的驱动,几乎都是一致的,至少我验证了quadro,tesla以及geforce,在2016.1.25这一批的驱动,md5都是相同的;
接下来就是安装咯
现在N卡的驱动安装,按照手册中给出的方式一般就轻松搞定了 (LINK 戳),
需要注意的是,在这种傻瓜式的方法当中,注意runlevel的影响;我就是踩到这个坑了:
1,自己使用terminal远程ssh登录过去,然后基于.run 文件进行安装,一路无异常,但是安装完后,没有nvidia-xconfig的配置跳出,当时也没多注意,
但是之后再使用nvidia-smi以及运行程序的时候,就报出标题错误或者 no available devices
2,所以,在机器tty下执行: alt+F4 (或者alt+F5,F6也可以),进入tty,在这里的runlevel默认是3,安装驱动一路无话,最后会蹦出xconfig,完成这一
步骤之后,驱动从当前的352.39 升级到了 352.79;tesla M-class的设备都可以正常使用了。。。。