- 配置计算调度系统Yarn和计算引擎Map/Reduce
- namenode上配置mapred-site.xml
12345
<
property
>
<
name
>mapreduce.framework.name</
name
>
<
value
>yarn</
value
>
</
property
>
- yarn-site.xml的配置
12345678910111213141516
<
property
>
<
name
>yarn.resourcemanager.hostname</
name
>
<
value
>master</
value
>
</
property
>
<
property
>
<
name
>yarn.nodemanager.aux-services</
name
>
<
value
>mapreduce_shuffle</
value
>
</
property
>
<
property
>
<
name
>yarn.nodemanager.auxservices.mapreduce.shuffle.class</
name
>
<
value
>org.apache.hadoop.mapred.ShuffleHandler</
value
>
</
property
>
- 启动yarn集群start-yarn.sh
- jps观察启动结果
- 可以使用yarn-daemon.sh单独启动resourcemanager和nodemanager
- 通过网页http://master:8088/观察yarn集群
- find /usr/local/hadoop -name *example*.jar 查找示例文件
- 通过hadoop jar xxx.jar wordcount /input /output来运行示例程序
- 通过网页来观察该job的运行情况
- hadoop job -kill job_id --> mapred job -kill job_id mapred job -list
- 经验:yarn-site如果是集中启动,其实只需要在管理机上配置一份即可,但是如果单独启动,需要每台机器一份,在网页上可以看到当前机器的配置,以及这个配置的来源(最好在每台slave中都配置,测试时没有配置slave机器,虽然也可以正常启动,但是master并没有连接到slave上。)