Hadoop完全分布式环境部署

Hadoop完全分布式环境部署
1. Hadoop的集群规划
2. 前置安装
3. JDK安装
4. Hadoop集群部署
1. Hadoop的集群规划

　　前面我们都了解了Hadoop和Yarn的运行原理和架构，

　　Hadoop包含：NameNode，DataNode，SeconderNameNode节点

　　Yarn包含：ResourceManage NodeManger节点

　　集群规划：
1. 分别设置他们的主机名(vi /etc/sysconfig/network)，
2. 设置后重启LinuX
3. 分别根据节点的方式配置ip地址(子节点跟主节点在同一节点上)
4. vi /etc/sysconfig/network-scripts/ifcfg-eth0
5. 设置主节点和子节点之间的ip和主机名的映射关系
6. vi /etc/hosts 主节点排第一，依次往下
7. 关闭子节点防火墙 (chkconfig iptables off)
2.前置安装
- ssh免密登陆
1. 每台机器执行：ssh-keygen -t rsa 命令
2. 在主节点执行：ssh-copy-id -i ~/.ssh/id-rsa.pub 节点名(主机名)
3. 验证：在主节点使用：ssh 子节点名 (如果不需要密码则配置成功)
3.JDK安装
1. 设置子节点的目录结构
2. 在主节点执行：拷贝主节点jdk压缩包的路径到各个子节点中(scp -r jdk路径用户名@主机名：~/目录地址)
4. 在各个子节点配置环境变量（vi /etc/profile）
4.Hadoop集群的部署
1. 在主节点修改slaves文件(vi /etc/slaves)
2. 把各个子节点相关的配置文件，环境变量修改下
3. 在主节点格式化Hadoop（hadoop namenode -format）
4. 在主节点启动HDFS
5. 在主节点启动YARN
6. 查看各个节点进程：sbin目录下执行jps
　　主节点：
1. 1. Jps
  2. SecondaryNameNode
  3. NodeManager
  4. NameNode
  5. ResourceManager
  6. DataNode
　　子节点：
1. 1. Jps
  2. DataNode
  3. NodeManager
5.验证是否成功：

　　进到hadoop中的share/hadoop/mapreduce 执行命令：

出现：Estimated value of Pi is 4.000000000 表示成功

常见错误及解决办法：
相关阅读:
【Storm篇】--Storm从初始到分布式搭建
 【Storm篇】--Storm 容错机制
 git命令log与reflog的比较
 长时间不操作Navicat或Putty会断线?
git使用ssh密钥
 公钥能用公钥解吗？
什么是公钥,,什么是密钥啊 ?有什么区别吗?
CSS滑动门
 Html设置文本换行与不按行操作
 设置鼠标光标与页面favicon
原文地址：https://www.cnblogs.com/wyk1/p/13941818.html