• hadoop入门学习系列之一hadoop伪分布式模式下安装及运行


    一 . 安装JDK

       查询目前系统的JDK: rpm -qa|grep jdk.

       卸载JDK yum -y remove xx

       tar -xzvf jdk-7u80-linux-x64.tar.gz

       配置环境变量: vim /etc/profile

       export JAVA_HOME=/opt/softwares/jdk1.7.0_80

       export PATH=$PATH:$JAVA_HOME/bin

       source /etc/profile

       验证安装 java -version

    二 . 配置伪分布式 hadoop

       tar -zxvf hadoop-2.6.5.tar.gz

       修改配置文件

       1. hadoop-env.sh  hadoop要用的环境变量

         export JAVA_HOME=/opt/softwares/jdk1.7.0_80

       2. 修改core-site.xml hadoop core的配置项

       <?xml version="1.0" encoding="UTF-8"?>

    <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
    <configuration>

    <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
    </property>
    </configuration>

    3. 修改 hdfs-site.xml.hdfs守护进程的配置项

    <?xml version="1.0" encoding="UTF-8"?>
    <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

    <configuration>
    <property>
    <name>dfs.replication</name>
    <value>1</value>
    </property>
    </configuration>

    4. 修改mapred-site.xml mapreduce的配置项

    <?xml version="1.0"?>
    <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

    <configuration>
    <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
    </property>
    </configuration>

    5. 修改yarn-site.xml yarn守护进程的配置项

    <?xml version="1.0"?>

    <configuration>

    <!-- Site specific YARN configuration properties -->
    <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
    </property>
    </configuration>

    6. 修改mapred-env.sh和yarn-env.sh文件

    export JAVA_HOME=/opt/softwares/jdk1.7.0_80

    三 、运行wordcount程序

    bin/hdfs namenode -format
    sbin/hadoop-daemon.sh start namenode
    sbin/hadoop-daemon.sh start datanode
    jps
    sbin/yarn-daemon.sh start resourcemanager
    sbin/yarn-daemon.sh start nodemanager
    bin/hdfs dfs -mkdir -p /user/hadoopuser/mapreduce/wordcount/input
    bin/hdfs dfs -put wcinput/wc.input /user/hadoopuser/mapreduce/wordcount/input/
    bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar wordcount /user/hadoopuser/mapreduce/wordcount/input/ /user/hadoopuser/mapreduce/wordcount/output
     
  • 相关阅读:
    C语言基础课程 第二课 HelloWorld不为菜鸟所知的秘密
    C语言基础课程 第一课 Linux环境配置小实战httpserver
    Linux企业级开发技术(6)——libevent企业级开发之内存管理
    Linux企业级开发技术(7)——libevent企业级开发之锁和线程
    Linux内存管理学习笔记--概述
    5月16日云栖精选夜读:从0到1构建大数据生态系列1:数据蛮荒中的拓荒之举
    luoguP1063 能量项链
    bzoj1060 [ZJOI2007]时态同步
    bzoj1864 [Zjoi2006]三色二叉树
    bzoj1864 [Zjoi2006]三色二叉树
  • 原文地址:https://www.cnblogs.com/lovefendi/p/7125373.html
Copyright © 2020-2023  润新知