Linux 服务器环境配置踩坑日记
1 下载安装 Anaconda
在清华镜像站中找到想要的 anaconda 版本。
然后直接找到想要放下载文件的目录
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.3.1-Linux-x86_64.sh
然后安装 anaconda
bash Anaconda3-5.3.1-Linux-x86_64.sh
一路回车各种操作确认安装。
可能需要激活一下 base 环境(记得把home目录换成自己用户的)
eval "$(/home/ivy/anaconda3/bin/conda shell.bash hook)"
2 确认一下自己的显卡驱动版本和支持的CUDA
下面的命令可以查看显卡的情况,也会显示驱动版本和支持的CUDA
nvidia-smi
这里查显卡驱动和CUDA版本的对应 https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
这里查 TensorFlow, cuDNN 和 CUDA 版本的对应关系 https://tensorflow.google.cn/install/source_windows?hl=en#gpu
3 安装 PyTorch
创建一个虚拟环境来安装 PyTorch(python 版本自己随意)
conda create -n torch-gpu python=3.7
conda activate torch-gpu
根据自己的情况在官网找到安装的命令,如
conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch
安装完了。可以进入 python 环境验证一下 GPU 环境
import torch
torch.cuda.is_available()
4 安装 TensorFlow
创建一个虚拟环境来安装 TensorFlow(python 版本自己随意)
conda create -n tf-gpu python=3.7
conda activate tf-gpu
根据自己在步骤 2 找到的版本安装
pip install tensorflow_gpu==2.3.0
conda install cudatoolkit=10.1 cudnn=7.6 h5py
(踩的坑,为什么 conda install 找不到 tensorflow_gpu 的包)
然后在 python 环境测试一下
import tensorflow as tf
len(tf.config.list_physical_devices('GPU'))
Refs
[1] Installing Pytorch with GPU Support (CUDA) in Ubuntu 18.04 — Complete Guide
[2] Installing TensorFlow GPU & Enabling CUDA in Ubuntu 18.04— Complete Guide