• 【Deep Learning】win10下配置tensorflow1.4(gpu版本)


    这里写图片描述

    环境:

    系统:win10

    显卡:NVIDIA GTX960M

    python:3.6

    tensorflow:1.4

    下载

    下载CUDA8.0(必须8.0)https://developer.nvidia.com/cuda-80-ga2-download-archive

    下载CUDNN6.0(必须6.0)https://developer.nvidia.com/rdp/cudnn-download

    下载python3.6(必须3.0以上)https://www.python.org/downloads/

    安装CUDA8.0

    下载CUDA8.0后进行默认安装,等待完成后环境变量里会有:

        CUDA_PATH
    
        CUDA_PATH_V8_0

    两个环境变量。

    命令行里输入:

    nvcc -V //(大写的V)

    输出

        nvcc: NVIDIA (R) Cuda compiler driver
        Copyright (c) 2005-2016 NVIDIA Corporation
        Built on Mon_Jan__9_17:32:33_CST_2017
        Cuda compilation tools, release 8.0, V8.0.60

    表明安装成功。

    安装CUDNN6.0

    下载CUDNN6.0,是一个压缩包,解压后会有三个文件夹bin,lib和include。将这三个文件夹下的内容复制到CUDA8.0的安装目录下的对应文件夹下即可。

    如:

    将bin下的cudnn64_6.dll复制到C:Program FilesNVIDIA GPU Computing ToolkitCUDAv8.0下的bin文件夹下。

    安装python3.6

    下载python3.6后直接安装,完成后配置环境变量如:

    //python.exe所在目录
    C:Program FilesPython36
    //pip3.exe所在目录
    C:Program FilesPython36Scripts

    在命令行输入:

    python -V //(大写的V)

    输出:

    Python 3.6.3

    表明安装成功

    安装tensorflow1.4

    打开命令行(必须以管理员身份运行),输入

    pip3 install tensorflow-gpu

    等待下载安装完成(约67M)。

    下载速度可能比较慢,所以可以更换为阿里云的镜像

        pip3 install tensorflow-gpu -i https://mirrors.aliyun.com/pypi/simple/

    这样下载速度会提高很多。

    安装完成后,进入python命令行测试。输入:

    tf.Session()

    输出:

    2017-12-08 17:47:08.439868: I C:	f_jenkinshomeworkspace
    el-winMwindows-gpuPY36	ensorflowcorecommon_runtimegpugpu_device.cc:1120] Creating TensorFlow device (/device:GPU:0) -> (device: 0, name: GeForce GTX 960M, pci bus id: 0000:01:00.0, compute capability: 5.0)
        <tensorflow.python.client.session.Session object at 0x000002887924D908>

    表明配置成功。(识别的出显卡信息:device: 0, name: GeForce GTX 960M, pci bus id: 0000:01:00.0, compute capability: 5.0)

    vscode下测试

    首先配置python运行环境(省略),然后新建测试文件test.py

    输入:

    import tensorflow as tf
    
    with tf.device('/gpu:0'):
       a = tf.constant([1.0, 2.0, 3.0])
       b = tf.constant([1.0, 2.0, 3.0])
    sess = tf.Session()
    print(sess.run(a+b))

    输出:

    [ 2.  4.  6.]

    整个环境配置成功。

  • 相关阅读:
    namenode无法自动切换的问题
    HDFS 安全模式的理解
    程序启动-Runloop
    浅谈MVC和MVVM模式
    Runtime 运行时之一:消息转发
    Runtime 运行时之一:消息传递
    Runtime 运行时之一:类与对象
    GCC 编译详解
    UIView中的坐标转换
    Xcode 利用VVDocumenter 生成注释 通过设置 再生成注释文档
  • 原文地址:https://www.cnblogs.com/cnsec/p/13286752.html
Copyright © 2020-2023  润新知