1 准备环境
1.1 Ubuntu 或者 VMware Workstation Pro+Ubuntu
1.2 Jdk
1.3 eclipse 或其他开发工具(可选)
2 安装Hadoop
2.1 从http://hadoop.apache.org/下载hadoop-2.7.3.tar.gz(或其他版本)
2.2 解压压缩包hadoop-2.7.3.tar.gz到/opt/hadoop-2.7.3(或其他自定义文件夹)
解压命令: tar -zxvf hadoop-1/2.x.x.tar.gz
安装Hadoop完成
3 运行Hadoop
3.1 把要执行的jar包放到/opt/hadoop-2.7.3 目录
3.2 创建/opt/hadoop-2.7.3/input 目录,本例子还需要放一个包含一些字符的文本文档到input目录(具体例子见下一篇笔记)
3.3 进入/opt/hadoop-2.7.3/bin目录 执行 hadoop jar wordcount.jar wordcount.MyJob input output 命令
wordcount.jar 是jar包的名称
wordcount.MyJob 是要执行的类的名称
3.4 执行命令后终端输出 JobClient:Job complete: job_xxx_xxx,并且output目录有一个文件名类似于part-r-xxxxx的文件,说明MapReduce程序运行成功