hdfs高可用搭建

hdfs高可用搭建
搭建HDFS高可用

在搭建hdfs高可用过程中，以node1、node2和node3来搭建高可用环境，每个节点所分配的作用如表4.3所示。

由表4.3中可以看出，NameNode（NN）分别配置在node1和node2上，ZKFC配置在node1和node3上，JournalNode（JN）配置在node1、node2和node3上，ZooKeeper（ZK）配置在node1、node2和node3上，DataNode（DN）配置在node1、node2和node3上。接下来开始高可用的搭建，首先来配置ZooKeeper。

配置ZooKeeper

首先从官网http://zookeeper.apache.org/下载ZooKeeper，这里以ZooKeeper-3.4.13为例，并上传到node1上。

解压缩ZooKeeper：

tar -zvxf ../appinstall/zookeeper-3.4.13.tar.gz

在ZooKeeper-3.4.13的conf文件夹下创建zoo.cfg文件并写入以下配置：
```
tickTime=2000
initLimit=5
syncLimit=2
dataDir=/opt/Zookeeper/data
clientPort=2181
server.1=node1:2888:3888
server.2=node2:2888:3888
server.3=node3:2888:3888
```
其中，dataDir代表存放ZooKeeper数据文件的目录，server.1、server.2和server.3中的1、2、3分别对应第1个节点、第2个节点和第3个节点，其中2888和3888代表接收和发送数据的端口。

创建myid，为了保障server.1、server.2和server.3，可以分别和第1个节点（node1）、第2个节点（node2）和第3个节点（node3）对应起来，还需要在dataDir所对应的文件夹中创建myid文件。具体操作如下。

在node1节点上创建/opt/ZooKeeper/data文件夹，并在其中创建myid文件。

接着在myid文件中写入1，这样就和server.1对应起来了。通过more myid命令可以查看myid文件中的内容。

在node2和node3中的/opt/ZooKeeper/data下分别创建myid文件，并分别写入2和3，此处与node1操作类似，写入后分别通过more查看文件内容。

复制node1上的ZooKeeper到node2和node3节点上。

启动ZooKeeper。进入每个节点的ZooKeeper的bin目录并启动ZooKeeper，启动命令如下：

注意：每个节点都要单独启动

检查ZooKeeper是否配置成功，在每个节点输入jps命令查看进程，会发现有个QuorumPeerMain，这就是ZooKeeper的进程

这样就代表ZooKeeper集群已经配置成功。

配置Hadoop配置文件

Hadoop配置文件一共有4个，分别是：

hadoop-env.sh的配置，是关于Hadoop运行环境的配置，在配置高可用时，分别定义了JAVA_HOME及运行NameNode、DataNode、ZKFC和JournalNode进程的用户：

export JAVA_HOME=/app/jdk1.8.0_211
export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_ZKFC_USER=root
export HDFS_JOURNALNODE_USER=root

core-site.xml文件的配置如下：
```
<configuration>
    
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://mycluster</value>
    </property>
    
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/hadoopdata</value>
    </property>
    
    <property>
        <name>hadoop.http.staticuser.user</name>
        <value>root</value>
    </property>
    
    <property>
        <name>ha.zookeeper.quorum</name>
        <value>node1:2181,node2:2181,node3:2181</value>
    </property>
</configuration>
```
其中，hadoop.http.staticuser.user是定义在网页界面访问数据时使用的用户名，ha.zookeeper.quorum是定义ZooKeeper集群(注意zookeeper要小写)。

hdfs-site.xml文件的配置如下：
```
<configuration>
    
    <property>
        <name>dfs.nameservices</name>
        <value>mycluster</value>
    </property>
    
    <property>
        <name>dfs.ha.namenodes.mycluster</name>
        <value>nn1,nn2</value>
    </property>
    
    <property>
        <name>dfs.namenode.rpc-address.mycluster.nn1</name>
        <value>node1:8020</value>
    </property>
    
    <property>
        <name>dfs.namenode.rpc-address.mycluster.nn2</name>
        <value>node2:8020</value>
    </property>
    
    <property>
        <name>dfs.namenode.http-address.mycluster.nn1</name>
        <value>node1:9870</value>
    </property>
    
    <property>
        <name>dfs.namenode.http-address.mycluster.nn2</name>
        <value>node2:9870</value>
    </property>
    
    <property>
        <name>dfs.namenode.shared.edits.dir</name>
        <value>qjournal://node1:8485;node2:8485;node3:8485/wen</value>
    </property>
    
    <property>
        <name>dfs.client.failover.proxy.provider.mycluster</name>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>
    
    <property>
        <name>dfs.ha.fencing.methods</name>
        <value>sshfence</value>
    </property>
    
    <property>
        <name>dfs.ha.fencing.ssh.private-key-files</name>
        <value>/root/.ssh/id_rsa</value>
    </property>
    
    <property>
        <name>dfs.journalnode.edits.dir</name>
        <value>/opt/journalnode/data</value>
    </property>
    
    <property>
        <name>dfs.ha.automatic-failover.enabled</name>
        <value>true</value>
    </property>
    
    <property>
    <name>dfs.permission</name>
    <value>false</value>
    </property>
</configuration>
```
其中，dfs.nameservices是配置HDFS集群ID，dfs.ha.namenodes.mycluster是配置NameNode的ID号，dfs.namenode.rpc-address.mycluster.nn1是定义NameNode的主机名和RPC协议的端口，dfs.namenode.http-address.mycluster.nn1是定义NameNode的主机名和HTTP协议的端口。

dfs.namenode.shared.edits.dir是定义共享edits的URL，dfs.client.failover.proxy.provider.mycluster是定义返回active namenode的类。

dfs.ha.fencing.methods是定义NameNode切换时的隔离方法，主要是为了防止“脑裂”问题，dfs.ha.fencing.ssh.private-key-files是定义隔离方法的密钥，dfs.journalnode.edits.dir是保存edits文件的目录，dfs.ha.automatic-failover.enabled用于定义开启自动切换。

workers文件的配置如下：
```
node1
node2
node3
```
workers主要配置DataNode节点，在workers配置文件中写入以上内容，代表node1、node2和node3是DataNode节点。

将配置文件复制到其他节点上
```
 scp ./hadoop-env.sh root@node2:/app/hadoop-3.2.1/etc/hadoop/
 scp ./hadoop-env.sh root@node3:/app/hadoop-3.2.1/etc/hadoop/
 scp ./core-site.xml root@node3:/app/hadoop-3.2.1/etc/hadoop/
 scp ./core-site.xml root@node2:/app/hadoop-3.2.1/etc/hadoop/
 scp ./hdfs-site.xml root@node2:/app/hadoop-3.2.1/etc/hadoop/
 scp ./hdfs-site.xml root@node3:/app/hadoop-3.2.1/etc/hadoop/
 scp ./workers root@node2:/app/hadoop-3.2.1/etc/hadoop/
 scp ./workers root@node3:/app/hadoop-3.2.1/etc/hadoop/
```
启动JN节点

启动JN节点，命令如下：
```
hdfs --daemon start journalnode
```
在node1、node2和node3上分别启动JournalNode，然后通过jps命令进行查看，这里以node1为例。代码如下：

格式化,在node1上执行格式化操作，执行命令如下：
```
hdfs namenode -format
```
复制元数据到node2节点上

由于我们需要把node1和node2设置为两个NameNode，所以搭建高可用时要求node1和node2上的元数据是一样的，因此需要将node1上的元数据复制到node2上。在这里需要注意的是，执行格式化命令后，会在/opt/hadoopdata目录下生成元数据，执行命令如下：
```
scp -r /opt/hadoopdata root@node2:/opt/
```
格式化ZKFC

ZKFC（ZooKeeper Failover Controller）是在HDFS高可用前提下，基于ZooKeeper的自动切换原理触发NameNode切换的一个进程。

在NameNode节点上启动的ZKFC进程内部，运行着如下3个对象服务。

·HealthMonitor：定期检查NameNode是否不可用或是否进入了一个不健康的状态，并及时通知ZooKeeper Failover Controller。

·ActiveStandbyElector：控制和监控NameNode在ZooKeeper上的状态。

·ZKFailoverController：协调HealthMonitor和ActiveStandbyElector对象并处理它们通知的event变化事件，完成自动切换的过程。

通 hdfs zkfc -formatZK 命令格式化ZKFC（ZooKeeper Failover Controller），执行命令如下：

启动ZKF，hdfs --daemon start zkfc ，启动后jps，DFSZKFailoverController进程启动表示成功，如下表示启动成功(若namenode2没有启动成功，可在namenode2手动启动zkfc)

启动集群

执行start-dfs.sh命令启动集群：

从上面的提示中可以看出node1和node2作为HDFS高可用的NameNode，node1、node2和node3作为用来保证NameNode间数据共享的JournalNode。

通过浏览器查看集群状态

在浏览器中分别打开http://192.168.10.11:9870/和http://192.168.10.12:9870/，会看到下面两个界面，可以看出node2为active状态，node1是standby状态，如图所示。

高可用测试

目前node1是standby（备用）状态，node2是active（活跃）状态，现在我们先查看NameNode进程的ID号，随后杀死在node2中处于active状态的NameNode进程，测试当此节点失效时，备用NameNode（即node1）能否接管已失效节点的任务并开始服务于来自客户端的请求，命令如下：

接着我们打开node1，发现node1的状态已经变成了active状态，如图4.12所示。这样，关于Hadoop 3的高可用就配置成功了。关于高可用的配置，读者可以参考官网http://hadoop.apache.org/docs/r3.1.0/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailability WithQJM.html。
author@nohert
相关阅读:
【原】 POJ 1012 Joseph 约瑟夫解题报告
 【原】 POJ 1001 Exponentiation 大整数乘法解题报告
 POJ——1517
毕业了，校园里走走看看——华中科技大学
 毕业答辩后
 CV编程常用的获取鼠标圈定区域的方法
 送走了GB
POJ——2546
奥巴马在YY21#524
POJ——3517
原文地址：https://www.cnblogs.com/gzgBlog/p/13759720.html

hdfs高可用搭建

搭建HDFS高可用

配置ZooKeeper

配置Hadoop配置文件

将配置文件复制到其他节点上

启动JN节点

复制元数据到node2节点上

格式化ZKFC

启动集群

高可用测试