• 攻城狮在路上(陆)-- 配置hadoop本地windows运行MapReduce程序环境


    本文的目的是实现在windows环境下实现模拟运行Map/Reduce程序。最终实现效果:MapReduce程序不会被提交到实际集群,但是运算结果会写入到集群的HDFS系统中

    一、环境说明:

        操作系统:win7

        eclipse:Version: Mars Release (4.5.0)

        hadoop:2.5.1

    二、预备文档(仅是说明,以第三步为准):

    System.setProperty("HADOOP_USER_NAME", "root");

    本地测试环境(windows):

        在windows的hadoop目录bin目录有一个winutils.exe

        1、在windows下配置hadoop的环境变量

        2、拷贝debug工具(winutils.exe)到HADOOP_HOME/bin

        3、修改hadoop的源码 ,注意:确保项目的lib需要真实安装的jdk的lib

        4、MR调用的代码需要改变:

            a、src不能有服务器的hadoop配置文件

            b、在调用是使用:

                Configuration config = new  Configuration();

                config.set("fs.defaultFS", "hdfs://node7:8020");

                config.set("yarn.resourcemanager.hostname", "node7");

    三、基本步骤说明:

    1、首先下载hadoop包,这里使用的是hadoop-2.5.1。解压后的路径是:E:hadoophadoop-2.5.1

    2、下载winutils.exe。将该软件拷贝到E:hadoophadoop-2.5.1in下

    image

    3、在windows中配置HADOOP_HOME环境变量为E:hadoophadoop-2.5.1,并加入到path环境变量中。

    4、修改hadoop源码,在新建的Java project中拷贝下面路径的Java代码。路径保持和原来一致。

    org/apache/hadoop/io/nativeio/NativeIO.java
    org/apache/hadoop/mapred/YARNRunner.java

    image

    5、在java project的buildpath中设置,jdk不要使用eclipse自带的,修改为自己本地安装的Jdk。

    6、其他限制条件:

        A、src中不能有服务器的hadoop配置文件。

        B、在调用时使用下面的代码:根据实际配置进行修改下面的参数

    System.setProperty("HADOOP_USER_NAME", "root");
    
    Configuration config = new  Configuration();
    
    config.set("fs.defaultFS", "hdfs://node7:8020");
    
     config.set("yarn.resourcemanager.hostname", "node7");

    7、运行代码:在eclipse中以DEBUG执行main方法即可。可以在Mapper和Reduce中打断点调试。

  • 相关阅读:
    更改数据库sa密码
    单例模式实现 (Singleton)
    linux特殊符号大全
    “增强现实与多媒体”博客园开张了
    关于.NET运行多个版本
    DevExpress V7.2.3源码 Salesman or Opium Up to you
    there is no bool datatype in oralce datatype system
    .NET时代,还有多少人读库源码 求FCL源码
    当学术界在解决其理论问题,工程界形成形成了一个已开发者为核心的生态链
    Div css 管理后台 简易Demo
  • 原文地址:https://www.cnblogs.com/tq03/p/5101916.html
Copyright © 2020-2023  润新知