• 寒假学习日报(二)


      今日把运行环境完善了一些,hadoop分布式还没有做,之后就去学习tensorflow了。

      我下载的tensorflow版本是2.3.0,老师下发的视频演示的是1.0版本的,因此在写代码时要注意方法的调用,我查了一些资料得知2.0版本的tensorflow较于1.0版本改了很多东西,因此在使用1.0版本的方法时需要写下如下代码:

    import tensorflow as tf
    #此行代码不加会报TypeError错误,原因为已安装的tensorflow版本为2.3,下列实验代码对应的版本为1.几版本
    tf.compat.v1.disable_eager_execution()

      补上这个代码之后,后续的代码在使用方法时都需要补上【compat.v1.】如tf.Session()在1.0版本可用,而2.0版本已经没有这个方法了,因此在使用时应该这么写

    tf.compat.v1.Session()

      搞清楚版本差别之后,今日跟着视频学习了使用tensorflow实现简单的线性回归模型构造,下面给出代码和实现效果:

    import numpy as np
    import tensorflow as tf
    import matplotlib.pyplot as plt
    #随机生成1000点,围绕直线:y=0.1x+0.3
    tf.compat.v1.disable_eager_execution()
    num_points=1000
    vectors_set=[]
    for i in range(num_points):
        x1=np.random.normal(0.0, 0.55)
        y1=x1*0.1+0.3+np.random.normal(0.0, 0.03)
        vectors_set.append([x1, y1])
    #生成样本
    x_data = [v[0] for v in vectors_set]
    y_data = [v[1] for v in vectors_set]
    
    plt.scatter(x_data,y_data,c='r')

    #生成1维的W矩阵,取值是[-1,1]之间的随机数
    W=tf.Variable(tf.compat.v1.random_uniform([1], -1.0, 1.0), name='W')
    #生成1维的b矩阵,初始值是0
    b=tf.Variable(tf.zeros([1]), name='b')
    #经过计算得出预估值y
    y = W*x_data+b
    
    #以预估值y和实际值y_data之间的均方误差作为损失
    loss=tf.reduce_mean(tf.square(y - y_data), name='loss')
    #采用梯度下降法来优化参数
    optimizer = tf.compat.v1.train.GradientDescentOptimizer(0.5)
    #训练的过程就是最小化这个误差值
    train=optimizer.minimize(loss, name='train')
    
    sess=tf.compat.v1.Session()
    init=tf.compat.v1.global_variables_initializer()
    sess.run(init)
    #输出初始化的W,b
    print("W=", sess.run(W),"b=",sess.run(b),"loss=",sess.run(loss))
    #执行20次训练
    for step in range(20):
        sess.run(train)
        print("W=", sess.run(W),"b=",sess.run(b),"loss=",sess.run(loss))

    plt.scatter(x_data,y_data,c='r')
    plt.plot(x_data,sess.run(W)*x_data+sess.run(b))
    plt.show()

       可见训练出来的W和b越来越接近0.1和0.3。

      在学习tensorflow的过程中,有些函数的使用与numpy类似,因此比较容易理解,后续需要训练更复杂的模型,因此需要一定的数学基础。

      此外今日还看了一些Spark的概念,由于它可以在Hadoop文件系统中并行运行,由于分布式hadoop未能完全搭建,因此没有进行实践。

      最后就是今天的一些疑难点,与tensorflow和spark无关,主要是在安装idea的时候出现了问题,总是出错,前前后后尝试了7-8次,最后成功安装了2019.3.3版本,同时将maven库路径之类的调整了一下,大部分时间也都浪费在了这里。

      明日目标:hadoop分布式搭建,Spark安装并实践,tensorflow学习。

  • 相关阅读:
    第一个Java程序
    kibana 创建index pattern 索引模式时过慢导致无法创建成功 以及解决方案
    各种推导式
    生成器表达式
    生成器函数进阶
    迭代器和生成器
    pyhton 监听文件输入实例
    window 日志清除
    window iis重启
    TCP/IP四层模型
  • 原文地址:https://www.cnblogs.com/20183711PYD/p/14264201.html
Copyright © 2020-2023  润新知