• clickhouse集群部署方法和验证方法


    集群节点信息

    192.168.30.118 

    192.168.30.117

    192.168.30.116

    192.168.30.115

    注意:1个节点,1副本

    1、安装依赖组建JDK

    (1)下载版本:jdk-8u333-linux-x64.tar.gz

    (2)下载连接:https://www.oracle.com/java/technologies/downloads/#java8-linux

    (3)linux中创建目录:/usr/local,将下载的jdk上传到此目录下,并将jdk-8u333-linux-x64重命名为jdk1.8

    mv jdk-8u333-linux-x64 jdk1.8

    (4)解压文件:(把下载的文件上传到服务器再次进行解压)

    tar -zxvf jdk-8u333-linux-x64.tar.gz

    (5)配置环境变量

    vim /etc/profile

    i 是insert 简写,进入编辑输入模式

    / 是可以搜索关键字

    :wq 保存退出

    :q 不保存退出

    :q! 强制退出

    添加如下内容(注意:java_home按照自己的jdk存放目录来放)

    export JAVA_HOME=/root/jdk/jdk1.8.0_333
    export CLASSPATH=$:CLASSPATH:$JAVA_HOME/lib/
    export PATH=$PATH:$JAVA_HOME/bin

    按 Esc 退出编辑模式,输入 :wq 保存并退出

    (6)生效环境变量

    source /etc/profile

    (7)检查是否安装成功

    javac -version
    
    java  -version

     

    2、搭建zookeeper集群

    在这三个节点搭建一个zookeeper集群(如果搭建可以直接忽略这一步),先在一个节点上根据以下配置

    参考安装方法:https://www.cnblogs.com/jiashengmei/p/11991243.html

    最终的zookeeper在zoo.cfg的内容如下,注意:只需要进行3个节点的zookeeper集群配置即可

    dataDir=/data
    dataLogDir=/datalog
    tickTime=2000
    initLimit=5
    syncLimit=2
    autopurge.snapRetainCount=3
    autopurge.purgeInterval=0
    maxClientCnxns=60
    standaloneEnabled=true
    admin.enableServer=true
    clientPort=12181
    
    server.118=192.168.30.118:12888:13888    #12888:13888不用改,改的示例:server.数字=IP:12888:13888,注意此处的数字,最后写在对应IP地址的myid的文件中
    server.117=192.168.30.117:12888:13888
    server.116=192.168.30.116:12888:13888 

    在192.168.30.118服务器上,myid的文件中,添加118

    在192.168.30.117服务器上,myid的文件中,添加117

    在192.168.30.116服务器上,myid的文件中,添加116

    3、安装clickhouse

    安装方式:clickhouse的官网安装方法:https://clickhouse.com/#quick-start

    注意:如下的内容,每个

    开始安装

    sudo apt-get install apt-transport-https ca-certificates dirmngr
    sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 8919F6BD2B48D754
    
    echo "deb https://packages.clickhouse.com/deb stable main" | sudo tee \
        /etc/apt/sources.list.d/clickhouse.list
    sudo apt-get update
    
    sudo apt-get install -y clickhouse-server clickhouse-client
    
    sudo service clickhouse-server start    #此句是启动clickhouse的服务
    clickhouse-client # or "clickhouse-client --password" if you set up a password.

    验证clickhouse是否安装成功,执行命令

    sudo service clickhouse-server status 

    安装完后的目录,即存放安装后文件的路径:/etc/clickhouse-server

    执行完如上的步骤,则执行如下的命令,查看clickhouse是否部署成功

    //客户端连接,直接在命令行运行即可
    clickhouse-client 

    备注:clickhouse常用的其他命名

    sudo service clickhouse-server start 
    sudo service clickhouse-server restart    #重启clickhouse
    sudo service clickhouse-server status    #查看clickhouse的状态
    sudo service clickhouse-server stop   #停止clickhouse

     集群版的部署

    注意事项:每次修改了配置文件的内容,记得重启clickhouse的服务:systemctl restart clickhouse-server 

    1、进入cd /etc/clickhouse-server目录下,创建touch metrika.xml,再次修改config.xml文件,修改后的内容如下,

    vim config.xml
    <timezone>Asia/Shanghai</timezone>
     <listen_host>0.0.0.0</listen_host>   #在文档中有,此行取消注释即可
    <include_from>/etc/clickhouse-server/metrika.xml</include_from>    #此行在conf文档中没有,需要手动的添加上
    <macros incl="macros" optional="true"/> #此行在conf文档中没有,需要手动的添加上
     <zookeeper>                                #根据zookeeper的配置IP,写在这里即可
            <node index="118">                  #"118"指的是:在zookeeper中的server.118后的数字,server.118=192.168.30.118:12888:13888
                <host>192.168.30.118</host>
                <port>12181</port>                #12181端口是自己给定的,也可用默认的2181
            </node>
            <node index="117">
                <host>192.168.30.117</host>
                <port>12181</port>
            </node>
            <node index="116">
                <host>192.168.30.116</host>
                <port>12181</port>
            </node>
    </zookeeper>

    2、目录cd /etc/clickhouse-server/文件下,手动创建文件:metrika.xml

    vim metrika.xml

    直接复制粘贴如下的内容到metrika.xml文档中即可,注意修改自己的IP地址,端口9000可以不用改,用默认即可

    <yandex>
        <clickhouse_remote_servers>
            <ck_cluster>
    <!--4分片1副本--> <shard> <internal_replication>true</internal_replication> <replica> <host>192.168.30.118</host> <port>9000</port> #注意:若在users.xml中设置了用户和密码,此处要添加<user>test</user><password>123</password> </replica> </shard> <shard> <internal_replication>true</internal_replication> <replica> <host>192.168.30.117</host> <port>9000</port> </replica> </shard> <shard> <internal_replication>true</internal_replication> <replica> <host>192.168.30.116</host> <port>9000</port> </replica> </shard> <shard> <internal_replication>true</internal_replication> <replica> <host>192.168.30.115</host> <port>9000</port> </replica> </shard> </ck_cluster> </clickhouse_remote_servers> <macros>
    <shard>01</shard> #注意:这里的内容,每个服务器的配置文件必须相同,否则复制表将无法操作 <replica>192.168.30.118</replica> #注意:每台服务器的配置文件。写自己的IP地址 </macros> <networks> <ip>::</ip> </networks> <clickhouse_compression> <case> <min_part_size>10000000000</min_part_size> <min_part_size_ratio>0.01</min_part_size_ratio> <method>lz4</method> </case> </clickhouse_compression> </yandex>

    3、若需查看clickhouse的log日志,在config.xml文件中就包含了,比如:

    /var/log/clickhouse-server/clickhouse-server.log
    /var/log/clickhouse-server/clickhouse-server.err.log

    4、进行完如上的配置,重新启动clickhouse,再次查看clickhouse是否启动成功

    sudo service clickhouse-server restart    #重启clickhouse
    sudo service clickhouse-server status    #查看clickhouse的状态

    ˙注意:状态也要是 active (running) 才可以

    5、连接clickhouse数据库,查看集群是否部署成功

     //客户端连接
    clickhouse-client
    
    //验证数据库
    show databases;
    
    //查看集群
    select * from system.clusters;

     6、验证zookeeper是否与当前数据库clickhouse进行了正确的配置,可以正确连接到

    直接在clickhouse的数据库中,输入如下的命令进行验证:

    SELECT * FROM system.zookeeper WHERE path = '/clickhouse';

    7、clickhouse数据中创建表,验证集群能力

    首先进入到clickhouse数据库:

    clickhouse-client

    (1)创建一个测试库

    create database abc;

    (2)分别在4个(118、117、116、115)节点上,创建本地表cluster3s1r_local。(直接复制,不用做任何的更改)

    CREATE TABLE abc.cluster3s1r_local
    (
        `id` Int32,
        `website` String,
        `wechat` String,
        `FlightDate` Date,
        Year UInt16
    )
    ENGINE = MergeTree(FlightDate, (Year, FlightDate), 8192);

    (3)在第一个(118)节点上,创建分布式表

    #ck_cluster:为metrika.xml配置文件中建立的标签
    CREATE TABLE abc.cluster3s1r_all AS cluster3s1r_local ENGINE = Distributed(ck_cluster, abc, cluster3s1r_local, rand());

     (4)往分布式表cluster3s1r_all中插入数据,cluster3s1r_all 会随机插入到四个节点的本地表(cluster3s1r_local)中#

    INSERT INTO default.cluster3s1r_all (id,website,wechat,FlightDate,Year)values(1,'https://niocoder.com/','java干货','2020-11-28',2020);
    
    INSERT INTO default.cluster3s1r_all (id,website,wechat,FlightDate,Year)values(2,'http://www.merryyou.cn/','javaganhuo','2020-11-28',2020);
    
    INSERT INTO default.cluster3s1r_all (id,website,wechat,FlightDate,Year)values(3,'http://www.xxxxx.cn/','xxxxx','2020-11-28',2020);

    (5)可以查看四个节点本地表的数据和分布式表的数据

    # 查询总量查分布式表 
    select * from cluster3s1r_all; 
    
    #各机器节点的本地表
    select * from cluster3s1r_local; 

     具体的内容可参考这篇文章:

    文章一:https://www.cnblogs.com/qa-freeroad/p/14394135.html

    文章二:https://www.cnblogs.com/ywjfx/p/14329605.html

  • 相关阅读:
    CentOS7 linux下yum安装redis以及使用
    nssm 在windows上部署服务
    netcore 2.2 封装 AutoMapper
    git pull/push免密输入
    缓存常见问题
    批量维护关系数据
    测试跨域html
    ODBC配置
    spring boot监控之prometheus配置
    REST Client
  • 原文地址:https://www.cnblogs.com/syw20170419/p/16250500.html
Copyright © 2020-2023  润新知