• Hadoop伪分布式教程


    hadoop所有的配置文件都是在 etc/hadoop下

    步骤一启动HDFS并运行MapReduce

    (1)配置集群

    第一步:在hadoop下修改core-site.xml文件

         vim etc/hadoop/core-site.xml

    <configuration>

    <!-- 指定HDFS中Name Node的地址-->

    <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
    </property>

    <!-- 指定Hadoop运行时产生文件的储存目录-->
    <property>
    <name>dfs.replication</name>
    <value>/opt/module/hadoop-2.7.2/data/tem</value>
    </property>

    </configuration>

    第二步:修改hadoop-evn.sh的java_home路径

      echo $JAVA_HOME

      输出结果为 /opt/software/javajdk

      复制

      vim hadoop-evn.sh

       修改 export JAVA_HOME=/opt/software/javajdk

        保存退出

    第三步:在hadoop下配置副本集(配置后本地运行环境就不行了)

      vim hdfs-site.xml

    <configuration>
    <name>dfs.replication</name>
    <value>1</value>
    </configuration>

    保存退出

     

    (2)启动集群

    第一步:格式化Name Node(第一次启动时格式化,以后就不要总格式化解决方法如下图)

        bin/hdfs namenode -format       进入bin目录下hdfs文件下的namenode -format命令

    第二步:启动Name Node

        sbin/hadoop-daemon.sh  start  namenode

        (启动后使用  jps 命令查看进程 必须安装jdk才能使用)

    第三步:启动DATa Node

    sbin/hadoop-daemon.sh start datanode

    (启动后使用  jps 命令查看进程 必须安装jdk才能使用)

    启动后可通过http://192.168.1.101:50070/  查看ip地址为你的ip地址(外界主机访问需要关闭防火墙)

    (3)查看集群 

      jps

     步骤二,启动YARN并运行MapReduce

      (1)配置集权

      第一步:配置yarn-env.sh

      cd etc/hadoop/

      vim yarn-env.sh

      把JAVA_HOME注释打开并修改为JAVA_HOME路径(不知道的可以使用 echo JAVA_HOME查询)

      export JAVA_HOME=/opt/software/javajdk

      第二步:配置yarn-site.xml

      vim yarn-site.xml

       <configuration>

        <!--Reducer 获取数据的方式-->

    <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value>
    </property>
    <property>

    <!--指定yarn的ResourceManager的地址-->
      <name>yarn.resourcemanager.hostname</name>
      <value>hadoop1</value>
    </property>

    </configuration>

      第三步:配置mapred-env.sh

      vim mapred-env.sh

      把JAVA_HOME注释打开并修改为JAVA_HOME路径(不知道的可以使用 echo JAVA_HOME查询)

      export JAVA_HOME=/opt/software/javajdk

      第四步:配置(对mapred-site.xml.template重命令为)mapred-site.xml

        mv mapred-site.xml.template mapred-site.xml

        vim mapred-site.xml 

      <property>

        <!--指定MR运行在YARN上-->

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

      </property>

     (2)启动集群

      第一步:启动前必须保证NameNode和DataNode已经启动

      第二步:启动ResourceManager

       在Hadoop根目录下  sbin/yarn-daemon.sh start resourcemanager

      第三步:启动NodeManager sbin/yarn-daemon.sh start nodemanager

    (3)集群操作

      第一步:yarn的浏览器页面查看显示页面如下

      http://hadoop1:8088/cluster

    步骤三:配置历史服务器

    步骤四:配置日志的聚集

     

     

  • 相关阅读:
    二叉查找中使用位运算符
    Python2021专业版激活码
    南邮计算机方向
    7.字符串、异常处理、文件和流(C++学习笔记)
    6.多态与抽象(C++学习笔记)
    5.对象类与继承(C++学习笔记)
    4.数组与指针(C++学习笔记)
    3.C++函数(C++学习笔记)
    2.C++控制语句(C++学习笔记)
    1.基本知识(C++学习笔记)
  • 原文地址:https://www.cnblogs.com/lovetl/p/12021718.html
Copyright © 2020-2023  润新知