我这里主要参考了:https://blog.csdn.net/yimingsilence/article/details/79631567
并根据自己在安装中遇到的情况做了一些改动。
先说明一下我的Ubuntu和GPU版本:
Ubuntu 16.04
GPU:GEFORCE GTX 1060
1. 查看显卡型号
使用命令:lspci | grep -i nvidia 查看电脑上的显卡,是否是nvidia版本。
2. 安装NVIDIA显卡驱动
具体做法参考之前博客的介绍。
3. 安装cuda 8
下载地址:https://developer.nvidia.com/compute/cuda/8.0/Prod2/local_installers/cuda_8.0.61_375.26_linux-run
下载下来之后是一个.sh文件,运行这个文件就开始安装了,后面会出现条款,全部同意即可。不过中间有一步,如果已经通过2自己安装过驱动了就不用安装了,如果没有就安装。
4. 设置cuda的环境变量
在~/.bashrc中的末尾添加:
export CUDA_HOME=/usr/local/cuda-8.0
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
export PATH=/usr/local/cuda-8.0/bin:$PATH
然后source ~/.bashrc立即生效。
5. 检查和验证之前的操作是否正确
(1)使用命令:nvcc --version,查看nvcc版本;
(2)使用命令:nvidia-smi,查看驱动是否安装成功,这一步之前可能需要reboot一下使得刚装的驱动生效;
(3)运行一下官方的例子。进入到samples文件夹(在用户目录下或者/usr/local/cuda/samples下都有),进入1_Utilities/deviceQuery中,make 然后运行./deviceQuery,会输出一堆信息,如果最后是PASS,则说明之前都对。
6. 安装cudnn
官网下载地址:https://developer.nvidia.com/rdp/cudnn-download
我选择了cuDNN v5.1 Library for linux,下载之后使用命令:tar -xvf filename,解压即可。然后把lib和include拷贝到cuda目录:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
然后修改拷过去的文件的访问权限:
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
然后命令行进入 cuda/lib64 路径下,运行以下命令:
sudo cp lib* /usr/local/cuda/lib64/ #复制动态链接库
cd /usr/local/cuda/lib64/sudo rm -rf libcudnn.so libcudnn.so.5 #删除原有动态文件
sudo ln -s libcudnn.so.5.1.10 libcudnn.so.5 #生成软衔接
sudo ln -s libcudnn.so.5 libcudnn.so #生成软链接
最后更新链接库:sudo Idconfig
到这里cuda和cudnn就安装完成了,下面开始anaconda和pytorch的安装
7. anaconda安装
下载地址:https://www.anaconda.com/download/
下载下来,是一个.sh文件,然后运行这个命令即可(运行命令./sh)。
设置虚拟环境:conda create -n env_name python=3.6.5以创建一个虚拟环境env_name。
使用命令:conda env_name,来激活虚拟环境
8. 安装pytorch
下载地址:https://pytorch.org/get-started/previous-versions/
我选择下载的是:https://download.pytorch.org/whl/cu80/torch-0.4.1-cp36-cp36m-linux_x86_64.whl
然后使用命令安装:pip install torch-0.4.1-cp36-cp36m-linux_x86_64.whl
再安装torchvision:pip install torchvision
9. 测试安装是否成功
import torch
import torchvision
如果没报错就说明安装成功了。