Windows下面调试程序比在Linux下面调试方便一些,于是用Windows下的Eclipse远程连接Hadoop。
1. 下载相应版本的hadoop-eclipse-plugin插件,复制到eclipse的plugins目录下面,再次启动Eclipse。
2. 解压hadoop的.tar.gz文件,并设置环境变量HADOOP_HOME和Path。
3. 在Eclipse下面的Windows->Preferences下面找到Hadoop Map/Reduce,设置Hadoop installation location。
4. 定义Hadoop Location。
5. 如果设置正确的话,可以连接到Hadoop并且在Project Explorer里看到DFS Locations。如果没有连接成功,可能就是文件权限的问题,为了方便,可以在为Hadoop新建一个Administrator用户(和Windows用户同名),这样就可以连接上去了,详见。
6. 新建Map/Reduce Project,编写Hadoop程序。
7. 选中相应的类,Run as->Run on Hadoop,就可以运行了,运行后刷新DFS Locations,可以看到结果。