• ubuntu16.04安装cuda8.0试错锦集


    ubuntu16.04安装cuda8.0试错锦集


    参考文献:

    1. [http://www.jianshu.com/p/35c7fde85968]
    2. [http://blog.csdn.net/sinat_19628145/article/details/60475696]


    系统信息:

    1. 系统:ubuntu16.04
    2. cuda版本:cuda_8.0.61_375.26_linux
    3. 显卡:NVIDIA GeForce GTX 750 ti


    前期检查:

    1. 最好是先看官方文档:[http://docs.nvidia.com/cuda/pdf/CUDA_Installation_Guide_Linux.pdf]
    2. 做好重装系统的心理准备,多来几遍就很得心应手了。毕竟贴主装了七八次。。。。
      主要是三个步骤;
      一.检查自己电脑的环境,是否支持cuda下载要求。
      二.安装。有两种安装方式,建议使用.run文件。
      三.试运行,检查是否安装成功


    一.检查电脑环境

    !!!!打开系统后,按 F2 进入 boot 界面,确定secure boot 选项是 disable,如果是enable状态,请先切换到disable选项,否则后续会出错。

    1、检查自己的GPU是否支持CUDA

    lspci | grep -i nvidia

    我的GPU是支持的,在这里查看:[https://developer.nvidia.com/cuda-gpus] 有的话就可以继续啦,不然只能换个显卡了。

    2、检查自己的系统,以方便日后找相关安装包

    uname -m && cat /etc/*release 
    

    3、检查自己的gcc版本
    gcc --version

    ps:没有的话可以通过 sudo apt-get install gcc安装

    4、检查是否安装了kernel header和 package development
    uname -r

    查看 kenel header信息
    可以通过下面的命令行安装:

    sudo apt-get install linux-headers-$(uname -r)

    检查全部通过。继续安装。哪里不符合,请参照官方教程。



    二、安装cuda

    "这里有两种安装方式.官方文档中,第三章讲的是deb。第四章讲的是run。deb比run简单,但是很有可能出错,而且后期肯呢个会无法调用某些C++库函数,所以选择run文件安装。

    1、提前下载自己对应版本的run安装包,记住下载地址。
    官网找一个合适的
    [https://developer.nvidia.com/cuda-downloads]

    2、禁止ubuntu系统自带的nouveau显卡驱动。

    2.0查看自己的驱动状态

    lsmod | grep nouveau

    如果有显示就要执行下面的操作了,一般新系统都是有输出的。

    2.1创建blacklist-nouveau.conf

    1)

    touch /etc/modprobe.d/blacklist-nouveau.conf    
        gedit blacklist-nouveau.conf
    

    或者
    2)

    sudo vi /etc/modprobe.d/blacklist-nouveau.conf
    

    在新建的文件里添加如下内容

    blacklist nouveau  
    options nouveau modeset=0   
    

    按照1)进行的用户直接Ctrl+s保存然后关闭文件
    按照2)进行的用户输入内容结束后,按ESC,光标跳到文件尾部,输入:wq保存并退出。

    2.3更新:

    sudo update-initramfs -u  
    

    2.4检查是否禁用成功

    lsmod | grep nouveau

    没有东西输出变是成功啦。一般这时候需要先重启才能生效。重启:reboot



    三、安装run文件

    1、重启系统后,不要进入登陆界面(!!!否则可能会安装失败),直接按Ctrl+Alt+F1进入文本模式(命令行界面),输入用户名和密码,登录账户。

    2、关闭图形化界面
    sudo service lightdm stop
    {可以先输入命令$lsmod | grep nouveau测试是否禁用成功}

    3、使用cd 命令切换到cuda_8.0.61_375.26_linux.run的目录,执行

    sudo sh cuda_8.0.27_linux.run

    “安装的时候,要让你先看一堆文字(EULA),我们直接不停的按##空格键到100%; 遇到提示是否安装openGL ,选择no,其他的可以一路accept, yes或回车,不建议安装samples.以及x-config。

    安装成功后,会显示installed,否则会显示failed。”

    4、重启图形化界面
    sudo service lightdm start

    高能!!!登录时能进入桌面,不会一直在重复登录,成功已近大半。
    贴主就是因为没有把secure boot的状态设置为disabled,走了很多弯路。



    四、检查是否安装成功
    1、执行
    ls /dev/nvidia*

    可能出现不同结果,

    ××× 若结果显示
    

    /dev/nvidia0 /dev/nvidiactl /dev/nvidia-uvm

    或显示出类似的信息,应该有三个(包含一个类似/dev/nvidia-nvm的),则安装成功
    
    ×××如果结果是这俩种情况
    

    ls: cannot access /dev/nvidia*: No such file or directory

    或是
    

    /dev/nvidia0 /dev/nvidiactl中的一个或两个,但没有/dev/nvidia-num

    按照官方的做法:新建把.sh文件(我命名为zzq.sh)

    touch nvi.sh
    sudo gedit nvi,sh
    

    在新建的文件中加入如下内容:(注意空格)

       #!/bin/bash  
        /sbin/modprobe nvidia  
        if [ "$?" -eq 0 ]; then  
        # Count the number of NVIDIA controllers found.  
        NVDEVS=`lspci | grep -i NVIDIA`  
        N3D=`echo "$NVDEVS" | grep "3D controller" | wc -l`  
        NVGA=`echo "$NVDEVS" | grep "VGA compatible controller" | wc -l`  
        N=`expr $N3D + $NVGA - 1`  
        for i in `seq 0 $N`; do  
        mknod -m 666 /dev/nvidia$i c 195 $i  
        done  
        mknod -m 666 /dev/nvidiactl c 195 255  
        else  
        exit 1  
        fi  
        /sbin/modprobe nvidia-uvm  
        if [ "$?" -eq 0 ]; then  
        # Find out the major device number used by the nvidia-uvm driver  
        D=`grep nvidia-uvm /proc/devices | awk '{print $1}'`  
        mknod -m 666 /dev/nvidia-uvm c $D 0  
        else  
        exit 1  
        fi   
    

    给这个脚本赋予执行权限,然后执行

    sudo chmod a+x nvi.sh  
    sudo ./nvi.sh
    

    2、配置环境:
    sudo gedit /etc/profile

    在最后面加上这些:

    export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}  
    export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}  
    export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}  
    

    【P.S. 上面代码里面的 表示的换行】

    然后重新加载环境变量

    sudo source /etc/profile

    3、测试

    cat /proc/driver/nvidia/version 
    nvcc -V`
    nvidia-smi
    

    有输出则成功。撒花。

    CV小蜡肉
  • 相关阅读:
    SDOI2011古代朱文
    LIS 堆优化
    ZR2019 广州 游记
    LG2709 小B的询问
    [SCOI2009] 生日礼物
    [SDOI2008]沙拉公主的困惑
    [LG3396]哈希冲突
    ZROI2018.8.2 菜鸡互啄杯组队 ACM 赛
    ZROI 菜鸡互啄杯 III
    [LG4016] 负载平衡问题
  • 原文地址:https://www.cnblogs.com/zzq-123456/p/7258736.html
Copyright © 2020-2023  润新知