• 在Hadoop集群上的HBase配置


    之前,我们已经在hadoop集群上配置了Hive,今天我们来配置下Hbase。

    一、准备工作

    1.ZooKeeper下载地址:http://archive.apache.org/dist/zookeeper/zookeeper-3.4.10/zookeeper-3.4.10.tar.gz

     2.Hbase下载地址:http://mirrors.shuosc.org/apache/hbase/stable/hbase-1.2.6-bin.tar.gz

    二、ZooKeeper集群安装配置

    1.下载ZooKeeper

    2.解压下载的安装包

    3.将解压的目录移动到安装目录

    4.配置系统环境变量

    5.使配置生效

    6.将conf目录下的zoo_sample.cfg文件拷贝一份,命名为为:zoo.cfg

    7.配置zoo.cfg文件

    a>.tickTime:Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳

    b>.initLimit:Zookeeper的Leader 接受客户端(Follower)初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 5个心跳的时间长度后 Zookeeper 服务器还没有收到客户端的返回信息,那么表明这个客户端连接失败。总的时间长度就是 5*2000=10 秒

    c>.syncLimit:表示 Leader 与 Follower 之间发送消息时请求和应答时间长度,最长不能超过多少个tickTime 的时间长度,总的时间长度就是 2*2000=4 秒

    d>.clientPort:客户端连接端口

    e>.dataDir:数据目录

    f>.dataLogDir:日志目录

    g>.server.A=B:C:D:其中A 是一个数字,表示这个是第几号服务器;B 是这个服务器的 ip 地址;C 表示的是这个服务器与集群中的 Leader 服务器交换信息的端口;D 表示的是万一集群中的 Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的 Leader,而这个端口就是用来执行选举时服务器相互通信的端口。如果是伪集群的配置方式,由于 B 都是一样,所以不同的 Zookeeper 实例通信端口号不能一样,所以要给它们分配不同的端口号。

    8.在dataDir目录下创建myid文件

    master机器的内容为0,slave1机器的内容为1,slave2机器的内容为2,这些内容对应conf目录下zoo.cfg配置中的server.A中的A。若有更多依此类推

    9.在master节点上将配置好的zookeeper分发给各个slave

     注:再次提醒别忘了更改/home/hadoop/software/zookeeper-3.4.10/data/myid和/etc/profile中zookeeper的环境变量配置

     10.启动zookeeper服务

    注:需要在master和slave机上都启动。输入jps命令查看进程,其中,QuorumPeerMain是zookeeper进程,表示启动成功。

    11.查看zookeeper状态

    显示为leader或者follower

    12.停止zookeeper服务

     三、Hbase安装配置

    1.解压Hbase压缩包

    2.将解压的目录移动到安装配置目录

    3.将Hbase安装目录配置到环境变量中

    4.修改文件conf/hbase-env.sh,修改内容如下
    export JAVA_HOME=/usr/local/jdk/jdk1.8.0_121
    export HBASE_MANAGES_ZK=false//true为使用Hbase自带ZK,false为使用独

     5.修改conf/hbase-site.xml,修改内容如下

    <configuration>
        <property>
            <name>hbase.rootdir</name>
            <value>hdfs://master:9000/hbase</value>
        </property>

        <property>
            <name>hbase.cluster.distributed</name>
            <value>true</value>
        </property>

        <property>
            <name>hbase.zookeeper.quorum</name>
            <value>master:2181,slave1:2181,slave2:2181</value>
        </property>

        <property>
            <name>hbase.zookeeper.property.dataDir</name>
            <value>/home/hadoop/software/hbase-1.2.6/zookeeper_tmp</value>
        </property>
    </configuration>

    备注:在上面的配置文件中,第一个属性指定本机的hbase的存储目录;第二个属性指定hbase的运行模式,true代表全分布模式;第三和第四个属性是关于Zookeeper集群的配置。我的Zookeeper安装在master,slave1和slave2上。

    5.修改conf/regionservers文件,修改内容如下

    master

    slave1

    slave2

    注意:一般 regionservers 不在 master 上部署。

    6.将Hbase拷贝到 slave节点同样目录下,并将Hbase安装目录配置到slave节点的环境变量中

    四、启动集群

    1.启动启动ZooKeeper(每个节点都需要启动)

    2.在master启动hadoop

    3.在master启动hive

    slave节点:

    4.在master启动hbase

    slave节点:

    5.通过浏览器查看:输入:http://192.168.19.128:16030

    6.进人和退出hbase的shell

    进人hbase的shell的命令:hbase shell

    退出hbase的shell命令:exit

  • 相关阅读:
    让你的 Python 代码优雅又地道
    Python3简单爬虫抓取网页图片
    Python 全集变量
    python-ConfigParser模块【读写配置文件】
    Python 第三方插件库
    Python 安装 lxml 插件
    Python cmd中输入'pip' 不是内部或外部命令,也不是可运行的程序或批处理文件。
    SQLServer代理新建或者编辑作业报错
    Python pycharm 常用快捷键
    python 安装插件 requests、BeautifulSoup
  • 原文地址:https://www.cnblogs.com/web424/p/7591272.html
Copyright © 2020-2023  润新知