前情提要:最近跑程序,突然有天提示cuda没了,具体大意是cuda没安装,但其实我已经安装好久了,而且程序也跑了很多次了,后来查明白,其原因有二:
(1)linxu系统的不稳定性,经常会导致这样那样的问题。这样的时候一般是要重装了,缺啥装啥。
(2)Ubuntu18.04内核更新导致的。重新更换成旧内核就行。
网上搜索的教程连接如下:https://blog.csdn.net/hangzuxi8764/article/details/86572093
个人摸索出来的一点经验,写下来以防忘记。我们需要先去探查一下具体问题在那里,我分为两步:
1.在终端输入 nvcc -V ,查看驱动和cuda在不在。
这就表示该在的都在,驱动也在。
2.在终端输入 nvidia-smi,再次查看驱动可不可以用。
提示这个,就证明你的驱动确实有问题,非常符合上面列举的第二个原因。那你就只需两步:
1.输入 sudo apt-get install dkms
2.输入 sudo dkms install -m nvidia -v 460.84
这里的460.84是你前面安装的驱动版本号,比如:NVIDIA-Linux-x86_64-460.84.run 那你的版本号就是460.84,如果不记得了,可以这么查看:进入/usr/src目录中,可以看到里面有nvidia文件夹,后缀就是其版本号 。
输入 cd /usr/src
但我没办法按此进入,路径有问题,庆幸的是我记得我的版本号
这两步以后,你的驱动就ok啦。
可以再次输入 nvidia-smi,查看
如图,就没问题了,事实上,到此我的问题就解决了,但如果这样还解决不了,那就只能归为第一个原因,然后缺啥装啥,第一个首先还是装驱动,可以参考 https://www.cnblogs.com/senfm/p/14887402.html
补充一点小知识,为了防止我的环境再次崩溃,我直接限制了我的更新,来源(https://www.cnblogs.com/carle-09/p/11504544.html):
祝好!