• ubuntu 核显输出 独显计算


    转载 https://wxzs5.github.io/2018/06/04/dl-env/
    本文为NVIDIA显卡深度学习环境配教程,主要内容为在ubuntu环境下安装NVIDIA显卡驱动、CUDA以及cuDNN。前面如何配置好Ubuntu基本工作环境请参考安装Ubuntu后应该做的事,本文提供一种可行稳妥的安装方法,更详细的安装方式还可参考CUDA官方安装文档与cuDNN官方安装文档。以下操作均在ubuntu 16.04.4 下测试通过,其他发行版本可作参考。

    安装NVIDIA显卡驱动
    NVIDIA显卡驱动一般有三种安装方法:

    使用PPA源安装:最安全,最方便。但是未必有最新驱动,而且下载速度可能慢一点,需要准备好梯子。
    安装CUDA时,顺便安装驱动,但未必是最新驱动(不推荐)。
    官网下载NVIDIA驱动程序然后本地安装(下载runfile)。
    apt-get安装(推荐)
    卸载原有驱动
    若已有N卡驱动,则需要先卸载:

    sudo apt-get remove --purge nvidia*
    

    如果是runfile安装:

    sudo chmod +x NVIDIA*.run
    sudo ./NVIDIA-Linux-x86_64*.run –uninstall
    

    安装NVIDIA驱动
    然后执行:

    sudo add-apt-repository ppa:xorg-edgers/ppa #添加ppa源
    sudo add-apt-repository ppa:graphics-drivers/ppa #添加ppa源
    sudo apt-get update #更新apt-get
    sudo apt-get install nvidia-390 #安装390版本的driver
    

    然后可能下载较慢但是最安全,这样安装系统会自动帮你禁用nouveau,所以这样安装完后不用手动禁用nouveau。

    runfile 安装
    去NVIDIA驱动程序下载官网下载合适的最新驱动,然后本地安装(下载runfile)。
    禁用Nouveau驱动

    grep nvidia /etc/modprobe.d/* /lib/modprobe.d/*
    这个很重要 这个遇到 下面的问题很重要 
    Unable to load the 'nvidia-drm' kernel module
    找这个文件blacklist-nvidia.conf 注释blacklist nvidia-drm
    /lib/modprobe.d/blacklist-nvidia.conf:#blacklist nvidia-drm
    

    打开配置文件:

    sudo vim /etc/modprobe.d/blacklist.conf
    

    然后在文本最后添加(禁用nouveau第三方驱动,之后也不需要改回来):

    blacklist nouveau
    options nouveau modeset=0

    然后执行:

    sudo update-initramfs -u
    

    重启后,执行:

    lsmod | grep nouveau
    如果没有屏幕输出,说明禁用nouveau成功。
    

    命令行安装驱动
    在NVIDIA驱动程序下载官网下载合适的最新驱动,然后按下Ctrl+Alt+F1进入命令行模式,进入驱动所在文件夹,输入以下命令:

    sudo service lightdm stop #这会关闭图形界面,但不用紧张
    sudo chmod +x NVIDIA-Linux-x86_64-*.run #给驱动run文件赋予执行权限
    sudo ./NVIDIA-Linux-x86_64-*.run –no-opengl-files #后面的参数非常重要,不可省略
    –no-opengl-files:表示只安装驱动文件,不安装OpenGL文件。这个参数不可省略,否则会导致登陆界面死循环。
    –no-x-check:表示安装驱动时不检查X服务,非必需。
    –no-nouveau-check:表示安装驱动时不检查nouveau,非必需。
    -Z, --disable-nouveau:禁用nouveau。此参数非必需,因为之前已经手动禁用了nouveau。
    -A:查看更多高级选项
    

    必选参数解释:因为NVIDIA的驱动默认会安装OpenGL,而Ubuntu的内核本身也有OpenGL、且与GUI显示息息相关,一旦NVIDIA的驱动覆写了OpenGL,在GUI需要动态链接OpenGL库的时候就引起问题。
    之后,按照提示安装,成功后重启即可。 如果提示安装失败,不要急着重启电脑,重复以上步骤,多安装几次即可。

    测试

    nvidia-smi #若列出GPU的信息列表,表示驱动安装成功
    nvidia-settings #若弹出设置对话框,亦表示驱动安装成功
    image2
    

    安装CUDA
    参考官方文档

    到CUDA官方下载页面下载CUDA包(runfile)

    建议安装版本:cuda 9.0 (tensorflow 现在支持得最好的cuda版本)
    然后按照以下步骤安装:

    安装
    首先确保文件具有运行权限,然后运行:

    sudo ./cuda_*linux.run --no-opengl-libs
    
    –no-opengl-libs:表示只安装驱动文件,不安装OpenGL文件。必需参数,原因同上。注意:不是-no-opengl-files。
    –toolkit:表示只安装CUDA Toolkit,不安装Driver和Samples。
    –help:查看更多高级选项。
    

    之后,按照提示安装即可。依次选择:

    accept #同意安装
    n #不安装Driver,因为已安装最新驱动
    y #安装CUDA Toolkit
    <Enter> #安装到默认目录
    y #创建安装目录的软链接
    n #不复制Samples,因为在安装目录下有/samples
    CUDA Sample测试
    #编译并测试设备 deviceQuery:
    cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
    sudo make
    然后执行:
    ./deviceQuery
    

    如果测试的最后结果是Result = PASS,说明CUDA安装成功。

    把CUDA加到环境变量中

    vim ~/.bashrc
    

    加入以下变量:

    export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}} 
    export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
    使设置生效:
    
    source ~/.bashrc
    

    安装cuDNN
    参考官方文档

    到cuDNN官方下载页面下载与CUDA版本相匹配的cuDNN包,要注册一个Nvidia账号,然后才可以下载。
    建议的版本:cudnn 7.0 for cuda 9.0

    进入安装包所在目录,依次输入以下命令:

    tar -xzvf cudnn-9.0-linux-x64-v7.tgz
    sudo cp cuda/include/cudnn.h /usr/local/cuda/include
    sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
    sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
    

    至此,关于NVIDIA显卡环境的一切已全部配置完成。

    安装 Tensorflow GPU 版本
    关于GPU加速训练过程不再强调,推荐tensorflow 1.6 版本,刚好和cuda对应起来,非常稳定。

    pip install tensorflow-gpu==1.6 --user #python2
    pip3 install tensorflow-gpu==1.6 --user #python3
    

    安装 Pytorch GPU 版本
    到Pytorch官网安装最新版本就可以了,pytorch用户体验很好,一般没有兼容性问题。选择你的Python版本和安装方式,推荐使用pip安装,选好cuda 9.0,然后官网会生成安装命令,copy到命令行执行即可安装。

    安装 MxNet GPU 版本
    参考MxNet官网安装教程安装最新版本就可以了。

    安装依赖

    sudo apt-get update
    sudo apt-get install -y wget python
    

    wget https://bootstrap.pypa.io/get-pip.py && sudo python get-pip.py
    安装cuda 9.0 版

    pip install mxnet-cu90 --pre --user #python2
    pip3 install mxnet-cu90 --pre --user  #python3
    

    其他有一些可选安装项可以看MxNet官网安装选择性安装。
    希望能交流更多技术,关注小白的微信公众号吧。
    在这里插入图片描述

    小白技术社
  • 相关阅读:
    C++ Null 指针的使用
    Canal相关
    安装调试MySql经常遇到的问题
    Mysql 常用操作
    asp.net web项目 绑定ip地址运行方式
    Nginx for windows 安装部署
    Nginx 配置文件介绍
    Nginx 代理静态网站
    RabbitMQ windows下的安装与配置
    ES kibana 常用指令
  • 原文地址:https://www.cnblogs.com/xbjss/p/13326667.html
Copyright © 2020-2023  润新知