首先,假设须要打印日志,不须要用log4j这些东西,直接用System.out.println就可以,这些输出到stdout的日志信息能够在jobtracker网站终于找到。
其次,假设在main函数启动的时候用System.out.println打印的日志,直接在控制台就能够看到。
再其次,jobtracker网站非常重要。
http://your_name_node:50030/jobtracker.jsp
另外,在cluster summary表格中能够看到map/reduce slots的情况,方便了解集群计算资源。能够写个脚本定时收集slots信息,方便分析出集群高峰和空暇时间段。