Hadoop的学习前奏（二）——Hadoop集群的配置

Hadoop的学习前奏（二）——Hadoop集群的配置

前言：

Hadoop集群的配置即完全分布式Hadoop配置。

笔者的环境：

Linux: CentOS 6.6(Final) x64
JDK: java version "1.7.0_75"
OpenJDK Runtime Environment (rhel-2.5.4.0.el6_6-x86_64 u75-b13)
OpenJDK 64-Bit Server VM (build 24.75-b04, mixed mode)
SSH: OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013
Hadoop: hadoop-1.2.1

步骤：

注：本文的实验是基于伪分布式Hadoop环境的。这里默认你的系统已经可以安装伪分布式的Hadoop了。如果你的系统还不能安装伪分布式Hadoop，请参考《Hadoop的学习前奏——在Linux上安装与配置Hadoop》一文完成配置。

1.首先在三台主机上创建相同的用户

2.在三台主机上分别设置/etc/hosts和/etc/hostname

$ vim /etc/hosts



$ vim /etc/hostname



3.在这三台主机上安装OpenSSH，并配置SSH可以免密码登录。

关于在单机上进行免密码登录的部分，我在上一篇博客中有详细说明。如果你的配置出了问题以致无法免密码登录，上一篇博客中有具体的做法，这里不再赘述。

将master中的authorized_keys复制给两台slave，做法如下：

$ scp authorized_keys slave1:~/.ssh/

$ scp authorized_keys slave2:~/.ssh/

4.配置三台主机的Hadoop文件。

$ vim core-site.xml



$ vim hdfs-site.xml



$ vim mapred-site.xml



$ vim masters



$ vim slaves



至此，Hadoop的配置已基本完成，你可以通过

5.启动Hadoop

bin/hadoop namenode -format

bin/start-all.sh

6.验证

你可以通过以下命令或是通过访问http://master:50030和http://master:50070查看集群状态

hadoop dfsadmin -report
相关阅读:
《JAVA与模式》之备忘录模式
 《JAVA与模式》之调停者模式
 如何将GTK+2.0的信号、回调处理映射成类成员函数的调用VC中测试（单类继承）
第一个GTK程序：中国农历附录2 libtool
【转载】成员函数指针与高性能的C++委托
 第一个GTK程序：中国农历附录4 动态库
 第一个GTK程序：中国农历附录3 静态库
 【转载】C++中实现委托（Delegate）
如何将GTK+2.0的信号、回调处理映射成类成员函数的调用VC中测试（虚拟继承类及多继承）
第一个GTK程序：中国农历附录5 变量名
原文地址：https://www.cnblogs.com/fengju/p/6336063.html

Hadoop的学习前奏（二）——Hadoop集群的配置

前言：

笔者的环境：

步骤：