zookeeper1:192.168.1.11
zookeeper2:192.168.1.12
zookeeper3:192.168.1.13
kafka1:192.168.1.14
kafka2:192.168.1.15
kafka3:192.168.1.16
kafka3:192.168.1.17
kafka-manager:192.168.1.18
一、下载
下载地址:
http://kafka.apache.org/downloads.html
http://mirrors.hust.edu.cn/apache/
http://zookeeper.apache.org/releases.html
已经安装好java-1.8
[root@zookeeper1 ~]# yum install java-1.8.0
二、Zookeeper安装
此处使用版本zookeeper-3.4.10.tar.gz
2.1 上传解压缩
# 下载 ZooKeeper
[root@zookeeper1 ~]# wget https://mirrors.aliyun.com/apache/zookeeper/zookeeper-3.4.10/zookeeper-3.4.10.tar.gz
# 解压文件
[root@zookeeper1 ~]# tar -zxf zookeeper-3.4.10.tar.gz -C /opt/
[root@zookeeper1 ~]# cd /opt/
[root@zookeeper1 opt]# ln -s zookeeper-3.4.10 zookeeper
[root@zookeeper1 opt]# cd zookeeper
[root@zookeeper1 zookeeper]# cp ./conf/zoo_sample.cfg ./conf/zoo.cfg
2.2 修改配置文件
zookeeper1,zookeeper2,zookeeper3都是同样的配置
[root@zookeeper1 zookeeper]# vim ./conf/zoo.cfg
tickTime=2000
initLimit=5
syncLimit=2
dataDir=/opt/push/kafka-test/zookeeper/data
dataLogDir=/opt/push/kafka-test/zookeeper/logs
clientPort=2181
server.1=192.168.1.11:2888:3888
server.2=192.168.1.12:2888:3888
server.3=192.168.1.13:2888:3888
[root@zookeeper1 zookeeper]# mkdir data logs
[root@zookeeper1 zookeeper]# echo '1' > /opt/zookeeper/data/myid
# 其它两台此处需要修改
[root@zookeeper2 zookeeper]# echo '2' > /opt/zookeeper/data/myid
[root@zookeeper3 zookeeper]# echo '3' > /opt/zookeeper/data/myid
三、Kafka安装
此处使用版本为kafka_2.11-1.1.0.tgz
3.1 上传解压缩
# 下载 Kafka
[root@kafka1 ~]# wget https://archive.apache.org/dist/kafka/1.1.0/kafka_2.11-1.1.0.tgz
# 解压tar文件
[root@kafka1 ~]# tar -zxf kafka_2.11-1.1.0.tgz.gz -C /opt/
[root@kafka1 ~]# cd /opt/
root@kafka1 opt]# ln -s kafka_2.11-1.1.0 kafka
root@kafka1 opt]# cd kafka
3.2 修改配置文件
进入kafka的安装配置目录
[root@kafka1 kafka]# cp config/server.properties config/server.properties.bak # 备份kafka默认配置文件
主要关注:server.properties
这个文件即可,我们可以发现在目录下:
有很多文件,这里可以发现有Zookeeper文件,我们可以根据Kafka内带的zk集群来启动,但是建议使用独立的zk集群
server.properties(broker.id和host.name每个节点都不相同)
//当前机器在集群中的唯一标识,和zookeeper的myid性质一样
broker.id=0
//Socket服务器侦听的地址,当前kafka对外提供服务的端口默认是9092
listeners = PLAINTEXT://your.host.name:9092
//代理将向生产者和消费者做广告的主机名和端口
advertised.listeners=PLAINTEXT://your.host.name:9092
//这个是borker进行网络处理的线程数
num.network.threads=3
//这个是borker进行I/O处理的线程数
num.io.threads=8
//发送缓冲区buffer大小,数据不是一下子就发送的,先回存储到缓冲区了到达一定的大小后在发送,能提高性能
socket.send.buffer.bytes=102400
//kafka接收缓冲区大小,当数据到达一定大小后在序列化到磁盘
socket.receive.buffer.bytes=102400
//这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数,这个值不能超过java的堆栈大小
socket.request.max.bytes=104857600
//消息存放的目录,这个目录可以配置为“,”逗号分割的表达式,上面的num.io.threads要大于这个目录的个数这个目录,
//如果配置多个目录,新创建的topic他把消息持久化的地方是,当前以逗号分割的目录中,那个分区数最少就放那一个
log.dirs=/home/hadoop/log/kafka-logs
//默认的分区数,一个topic默认1个分区数
num.partitions=1
//每个数据目录用来日志恢复的线程数目
num.recovery.threads.per.data.dir=1
//默认消息的最大持久化时间,168小时,7天
log.retention.hours=168
//这个参数是:因为kafka的消息是以追加的形式落地到文件,当超过这个值的时候,kafka会新起一个文件
log.segment.bytes=1073741824
//每隔300000毫秒去检查上面配置的log失效时间
log.retention.check.interval.ms=300000
//设置zookeeper的连接端口
zookeeper.connect=localhost:2181
//设置zookeeper的连接超时时间
zookeeper.connection.timeout.ms=6000
kafka1:
[root@kafka1 kafka]# vim config/server.properties
broker.id=1 # 当前机器在集群中的唯一标识
listeners=PLAINTEXT://192.168.1.14:9092 # 监听端口
advertised.listeners=PLAINTEXT://192.168.1.14:9092 # 提供给生产者,消费者的端口号。可以不设置则使用listeners的值
zookeeper.connect=192.168.1.11:2181,192.168.1.12:2181,192.168.1.13:2181/kafka # 连接zookeeper
kafka2:
[root@kafka2 kafka]# vim config/server.properties
broker.id=2 # 当前机器在集群中的唯一标识
listeners=PLAINTEXT://192.168.1.15:9092 # 监听端口
advertised.listeners=PLAINTEXT://192.168.1.15:9092 # 提供给生产者,消费者的端口号。可以不设置则使用listeners的值
zookeeper.connect=192.168.1.11:2181,192.168.1.12:2181,192.168.1.13:2181/kafka # 连接zookeeper
kafka3:
[root@kafka3 kafka]# vim config/server.properties
broker.id=3 # 当前机器在集群中的唯一标识
listeners=PLAINTEXT://192.168.1.16:9092 # 监听端口
advertised.listeners=PLAINTEXT://192.168.1.16:9092 # 提供给生产者,消费者的端口号。可以不设置则使用listeners的值
zookeeper.connect=192.168.1.11:2181,192.168.1.12:2181,192.168.1.13:2181/kafka # 连接zookeeper
kafka4:
[root@kafka4 kafka]# vim config/server.properties
broker.id=4 # 当前机器在集群中的唯一标识
listeners=PLAINTEXT://192.168.1.17:9092 # 监听端口
advertised.listeners=PLAINTEXT://192.168.1.17:9092 # 提供给生产者,消费者的端口号。可以不设置则使用listeners的值
zookeeper.connect=192.168.1.11:2181,192.168.1.12:2181,192.168.1.13:2181/kafka # 连接zookeeper
四、启动
3.1 首先启动zookeeper集群
所有zookeeper节点都需要执行
[root@zookeeper1 kafka]# ./bin/zkServer.sh start
3.2 启动Kafka集群服务
所有kafka节点都需要执行
[root@kafka1 kafka]# ./bin/kafka-server-start.sh config/server.properties
或者:
[root@kafka1 kafka]# ./bin/kafka-server-start.sh -daemon config/server.properties # 后台启动
3.3 创建的topic
[root@kafka1 kafka]# bin/kafka-topics.sh --create --zookeeper kafka1:2181 --replication-factor 3 --partitions 3 --topic topic2
3.4 查看topic副本信息
[root@kafka1 kafka]# ./bin/kafka-topics.sh --describe --zookeeper kafka1:2181 --topic topic2
3.5 查看已经创建的topic信息
[root@kafka1 kafka]# ./bin/kafka-topics.sh --list --zookeeper kafka1:2181
3.6 生产者发送消息
kafka1显示接收到消息
[root@kafka1 kafka]# ./bin/kafka-console-producer.sh --broker-list kafka1:9092 --topic2
3.7 消费者消费消息
在kafka2上消费消息
[root@kafka2 kafka]# ./bin/kafka-console-consumer.sh --zookeeper kafka1:2181 --from-beginning --topic topic2
五、kafka-manager安装
官网:https://github.com/yahoo/kafka-manager
[root@kafka-manager ~]# git clone https://github.com/yahoo/kafka-manager.git
[root@kafka-manager ~]# cd kafka-manager
# 部署
[root@kafka-manager kafka-manager]# ./sbt clean dist
解压缩生成的zip文件
# 启动
[root@kafka-manager kafka-manager]# bin/kafka-manager
[root@kafka-manager kafka-manager]# bin/kafka-manager -Dconfig.file=/path/to/application.conf -Dhttp.port=8080