• 搭建Hadoop2.6.0+Eclipse开发调试环境(以及log4j.properties的配置)


    上一篇在win7虚拟机下搭建了hadoop2.6.0伪分布式环境。为了开发调试方便,本文介绍在eclipse下搭建开发环境,连接和提交任务到hadoop集群。

    1. 环境

    Eclipse版本Luna 4.4.1

    安装插件hadoop-eclipse-plugin-2.6.0.jar,下载后放到eclipse/plugins目录即可。

    2. 配置插件

    2.1 配置hadoop主目录

    解压缩hadoop-2.6.0.tar.gz到C:Downloadshadoop-2.6.0,在eclipse的Windows->Preferences的Hadoop Map/Reduce中设置安装目录。

    2.2 配置插件

    打开Windows->Open Perspective中的Map/Reduce,在此perspective下进行hadoop程序开发。

        

    打开Windows->Show View中的Map/Reduce Locations,如下图右键选择New Hadoop location…新建hadoop连接。

    确认完成以后如下,eclipse会连接hadoop集群。

    如果连接成功,在project explorer的DFS Locations下会展现hdfs集群中的文件。

    3. 开发hadoop程序

    3.1 程序开发

    开发一个Sort示例,对输入整数进行排序。输入文件格式是每行一个整数。

     View Code

    3.2 配置文件

    把log4j.properties和hadoop集群中的core-site.xml加入到classpath中。我的示例工程是maven组织,因此放到src/main/resources目录。

    程序执行时会从core-site.xml中获取hdfs地址。

    3.3 程序执行

    右键选择Run As -> Run Configurations…,在参数中填好输入输出目录,执行Run即可。

     执行日志:

     View Code

    4. 可能出现的问题

    4.1 权限问题,无法访问HDFS

    修改集群hdfs-site.xml配置,关闭hadoop集群的权限校验。

    <property>

    <name>dfs.permissions</name>

    <value>false</value>

    </property>

    4.2 出现NullPointerException异常

    在环境变量中配置%HADOOP_HOME%为C:Downloadhadoop-2.6.0

    下载winutils.exe和hadoop.dll到C:Downloadhadoop-2.6.0in

    注意:网上很多资料说的是下载hadoop-common-2.2.0-bin-master.zip,但很多不支持hadoop2.6.0版本。需要下载支持hadoop2.6.0版本的程序。

    4.3 程序执行失败

    需要执行Run on Hadoop,而不是Java Application。

  • 相关阅读:
    日期时间基本知识
    VScode 常用操作
    js实现图片的Blob base64 ArrayBuffer 的各种转换
    window.postMessage()实现(iframe嵌套页面)跨域消息传递
    软件工程概论个人总结
    软件工程学习进度表(第十六周)
    《构建之法》阅读笔记
    软件工程学习进度表(第十五周)
    《人月神话》阅读笔记06
    《人月神话》阅读笔记05
  • 原文地址:https://www.cnblogs.com/snowbook/p/5807277.html
Copyright © 2020-2023  润新知