KAFKA最新版 3.0.0集群部署测试

KAFKA最新版 3.0.0集群部署测试

关于kafka的信息可以参考官方文档： https://kafka.apache.org/documentation/ （如果英文不好直接右击翻译成中文就可以，比看网上一堆文章都强）

环境信息：
IP 角色
10.0.83.71 zookeeper、kafka
10.0.83.72 zookeeper、kafka
10.0.83.73 zookeeper、kafka
先把主机名改掉，分别到3台机器上改自己的：

hostnamectl set-hostname kafka1
hostnamectl set-hostname kafka2
hostnamectl set-hostname kafka3

### 到3台机器上编辑/etc/hosts文件
10.0.83.71 kafka1
10.0.83.72 kafka2
10.0.83.73 kafka3
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
分别到3台机器上安装java8
yum -y install java-1.8.0-openjdk-devel
1.
关掉防火墙（如果不关，等下把集群通讯的8182，8183，8184几个开放也可以）
[root@kafka1 ~]# systemctl stop firewalld
[root@kafka2 ~]# systemctl stop firewalld
[root@kafka3 ~]# systemctl stop firewalld
1.
2.
3.
https://www.apache.org/dyn/closer.cgi?path=/kafka/3.0.0/kafka_2.12-3.0.0.tgz

下载kafka，并修改配置文件
https://dlcdn.apache.org/kafka/3.0.0/kafka_2.12-3.0.0.tgz

tar zxvf kafka_2.12-3.0.0.tgz -C /opt/

cd /opt/kafka_2.12-3.0.0/config/

配置zookeeper集群，修改配置文件zookeeper.properties
vim zookeeper.properties
tickTime=2000
initLimit=20
syncLimit=10
server.1=10.0.83.71:2182:2183
server.2=10.0.83.72:2182:2183
server.3=10.0.83.73:2182:2183
1.
2.
3.
4.
5.
6.
7.
tickTime: 这个时间是作为 Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔，也就是每个 tickTime 时间就会发送一个心跳

nitLimit：这个配置项是用来配置 Zookeeper 接受客户端（这里所说的客户端不是用户连接 Zookeeper 服务器的客户端，而是 Zookeeper 服务器集群中连接到 Leader 的 Follower 服务器）初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 5个心跳的时间（也就是 tickTime）长度后 Zookeeper 服务器还没有收到客户端的返回信息，那么表明这个客户端连接失败。总的时间长度就是 5*2000=10 秒

syncLimit：这个配置项标识 Leader 与Follower 之间发送消息，请求和应答时间长度，最长不能超过多少个 tickTime 的时间长度，总的时间长度就是5*2000=10秒

clientPort：这个端口就是客户端连接 Zookeeper 服务器的端口，Zookeeper 会监听这个端口，接受客户端的访问请求

server.1 这个1是服务器的标识也可以是其他的数字，表示这个是第几号服务器，用来标识服务器，这个标识要写到快照目录下面myid文件里

10.0.83.71为集群里的IP地址，第一个端口是master和slave之间的通信端口，默认是2182，第二个端口是leader选举的端口，集群刚启动的时候选举或者leader挂掉之后进行新的选举的端口默认是2183）

创建zookeeper所需的目录
分别在3个机器上执行：
第一台：

[root@kafka1 ~]# mkdir -p /data/zookeeper
[root@kafka1 ~]# echo "1" > /data/zookeeper/myid

1.
2.
3.
第二台：

[root@kafka2 ~]# mkdir -p /data/zookeeper
[root@kafka2 ~]# echo "2" > /data/zookeeper/myid
1.
2.
第三台：

[root@kafka3 ~]# mkdir -p /data/zookeeper
[root@kafka3 ~]# echo "3" > /data/zookeeper/myid
1.
2.
启动Zookeeper
[root@kafka1 ~]# cd /opt/kafka_2.12-3.0.0/
[root@kafka1 kafka_2.12-3.0.0]# ./bin/zookeeper-server-start.sh ./config/zookeeper.properties

[root@kafka2 ~]# cd /opt/kafka_2.12-3.0.0/
[root@kafka2 kafka_2.12-3.0.0]# ./bin/zookeeper-server-start.sh ./config/zookeeper.properties

[root@kafka3 ~]# cd /opt/kafka_2.12-3.0.0/
[root@kafka3 kafka_2.12-3.0.0]# ./bin/zookeeper-server-start.sh ./config/zookeeper.properties
1.
2.
3.
4.
5.
6.
7.
8.
9.
效果图：

配置Kafka集群环境
1）修改Kafka配置文件config/server.properties
注意注释掉所有节点的broker.id
[root@kafka2 ~]# cd /opt/kafka_2.12-3.0.0/
[root@kafka2 kafka_2.12-3.0.0]# vim config/server.properties
log.dirs=/data/kafka-logs
#broker.id=0
zookeeper.connect=kafka1:2181,kafka2:2181,kafka3:2181
listeners=PLAINTEXT://10.0.83.72:9092
advertised.listeners=PLAINTEXT://10.0.83.72:9092
1.
2.
3.
4.
5.
6.
7.
8.
创建日志目录：

mkdir -p /data/kafka-logs
1.
分别在3台机器上启动kafka

cd /opt/kafka_2.12-3.0.0
./bin/kafka-server-start.sh ./config/server.properties
1.
2.
启动之后如果不放心可以检查下zookeeper的2181和kafka的9092端口是否正常

[root@kafka3 kafka_2.12-3.0.0]# netstat -nlpt | grep -E "9092|2181"
tcp6 0 0 10.0.83.73:9092 :::* LISTEN 147669/java
tcp6 0 0 :::2181 :::* LISTEN 146348/java

[root@kafka1 kafka_2.12-3.0.0]# netstat -nlpt | grep -E "9092|2181"
tcp6 0 0 10.0.83.71:9092 :::* LISTEN 138011/java
tcp6 0 0 :::2181 :::* LISTEN 136719/java

[root@kafka2 kafka_2.12-3.0.0]# netstat -nlpt | grep -E "9092|2181"
tcp6 0 0 10.0.83.72:9092 :::* LISTEN 132679/java
tcp6 0 0 :::2181 :::* LISTEN 131438/java

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
创建topic测试：

[root@kafka1 kafka_2.12-3.0.0]# ./bin/kafka-topics.sh --create --bootstrap-server kafka1:9092 --replication-factor 1 --partitions 1 --topic tp1
Created topic tp1.
1.
2.
查看所有的topic

[root@kafka1 kafka_2.12-3.0.0]# ./bin/kafka-topics.sh --list --bootstrap-server kafka1:9092
tp1
1.
2.
模拟一个数据

[root@kafka1 kafka_2.12-3.0.0]# ./bin/kafka-console-producer.sh --bootstrap-server kafka1:9092 --topic tp1
>测试数据
>ceshi1
1.
2.
3.
起一个消费者：

[root@kafka1 kafka_2.12-3.0.0]# ./bin/kafka-console-consumer.sh --bootstrap-server kafka1:9092 --topic tp1

测试数据
ceshi1

1.
2.
3.
4.
5.
到这里kafka集群已经ok
把zookeeper和kafka做成系统服务并开机自动启动（可以把之前在终端执行的启动命令关了，不然起不来）
在3台机器上分别运行
[root@kafka1 ~]# mkdir /etc/cluster/
1.
创建zookeeper的service文件
[root@kafka1 cluster]# cat /etc/cluster/zookeeper.service

[Unit]
Description=zookeeper

[Service]
ExecStart=/opt/kafka_2.12-3.0.0/bin/zookeeper-server-start.sh /opt/kafka_2.12-3.0.0/config/zookeeper.properties
SyslogIdentifier=zookeeper

[Install]
WantedBy=multi-user.target
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
加为系统服务并开机启动
[root@kafka1 cluster]# ln -s /etc/cluster/zookeeper.service /lib/systemd/system

[root@kafka1 cluster]# systemctl start zookeeper

### 开机启动：
[root@kafka1 cluster]# systemctl enable zookeeper
1.
2.
3.
4.
5.
6.
设置kafka系统服务并开机启动
[root@kafka1 cluster]# cat /etc/cluster/kafka.service

[Unit]
Description=kafka

[Service]
ExecStart=/opt/kafka_2.12-3.0.0/bin/kafka-server-start.sh /opt/kafka_2.12-3.0.0/config/server.properties
SyslogIdentifier=kafka

[Install]
WantedBy=multi-user.target
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
设置开机启动
[root@kafka1 cluster]# ln -s /etc/cluster/kafka.service /lib/systemd/system/
[root@kafka1 cluster]# systemctl start kafka
[root@kafka1 cluster]# systemctl enable kafka
1.
2.
3.
查看服务状态：
[root@kafka1 cluster]# systemctl status kafka
● kafka.service - kafka
Loaded: loaded (/etc/cluster/kafka.service; enabled; vendor preset: disabled)
Active: active (running) since Sun 2021-12-05 20:49:52 EST; 45min ago
Main PID: 138011 (java)
Tasks: 74 (limit: 48706)
Memory: 383.6M

查看服务日志：
登录后复制
[root@kafka1 cluster]# journalctl -u kafka -f
相关阅读:
【19】什么时候该改变开发集和评估指标
 【18】训练/开发/测试集划分
 【17】满足和优化指标
 【16】机器学习中的单一评估指标
 【15】ML项目流程与正交化
 【14】Softmax回归
 【13】正则化网络激活函数（Batch归一化）
【12】超参数及超参数的选择
 【11】神经网络的优化算法
 06-----Nodejs介绍
原文地址：https://www.cnblogs.com/jxldjsn/p/15781432.html