1.准备3台虚拟机
安装jdk、安装zookeeper(上一篇有讲)
创建文件存放目录
mkdir -p /export/servers/
mkdir -p /export/software/
mkdir -p /export/data/
mkdir -p /export/logs/
2.下载安装包及解压
tar -zxvf kafka_2.11-1.0.0.tgz -C /export/servers/
cd /export/servers/
mv kafka_2.11-1.0.0 kafka
3.查看目录及修改配置文件
1.查看目录
2.修改配置文件
进入配置目录,查看server.properties文件
cat server.properties |grep -v "#"
通过以上命令,查看到了默认的配置文件,对默认的文件进行修改。
修改三个地方
vi server.properties
1) Borker.id
2) 数据存放的目录,注意目录如果不存在,需要新建下。
3) zookeeper的地址信息
#broker.id 标识了kafka集群中一个唯一broker。
broker.id=0
num.network.threads=3
num.io.threads=8
socket.send.buffer.bytes=102400
socket.receive.buffer.bytes=102400
socket.request.max.bytes=104857600
#存放生产者生产的数据 数据一般以topic的方式存放
log.dirs=/export/data/kafka
num.partitions=1
num.recovery.threads.per.data.dir=1
offsets.topic.replication.factor=1
transaction.state.log.replication.factor=1
transaction.state.log.min.isr=1
log.retention.hours=168
log.segment.bytes=1073741824
log.retention.check.interval.ms=300000
#zk的信息
zookeeper.connect=node01:2181,node02:2181,node03:2181
zookeeper.connection.timeout.ms=6000
group.initial.rebalance.delay.ms=0
#可选配置
delete.topic.enable=true
host.name=192.168.72.141
4.分发配置文件及修改brokerid
将修改好的配置文件,分发到node02,node03上。
创建一个数据存放目录 /export/data/kafka
分发安装包
scp -r /export/servers/kafka/ node02:/export/servers/
scp -r /export/servers/kafka/ node03:/export/servers/
修改node02上的broker.id为1
vi /export/servers/kafka/config/server.properties
修改node03上的broker.id为2
vi /export/servers/kafka/config/server.properties
5.启动集群
cd /export/servers/kafka/bin
nohup ./kafka-server-start.sh /export/servers/kafka/config/server.properties > /dev/null 2>&1 &
输出到文件:
nohup ./kafka-server-start.sh /export/servers/kafka/config/server.properties > /export/logs/kafka/kafka.log 2>&1 &
6.自动化启动脚本
startKafka.sh
#!/bin/sh
cat /export/servers/kafka/bin/slave | while read line
do
{
echo $line
ssh $line "source /etc/profile;nohup /export/servers/kafka/bin/kafka-server-start.sh /export/servers/kafka/config/server.properties >/dev/null 2>&1 &"
}&
wait
done
stopKafka.sh
#!/bin/sh
cat /export/servers/kafka/bin/slave | while read line
do
{
echo $line
ssh $line "source /etc/profile;jps |grep Kafka |cut -c 1-5 |xargs kill -s 9 "
}&
wait
done
slave 存放的位置:/export/servers/kafka/bin/slave
node01
node02
node03
7.操作集群
创建一个订单的topic
./kafka-topics.sh --create --zookeeper node01:2181,node02:2181,node03:2181 --topic order --partitions 3 --replication-factor 2
分片数据: 三个分区 --partitions 3
每个分区的副本数据:--replication-factor 2
启动一个生产者,生产数据
./kafka-console-producer.sh --broker-list node01:9092,node02:9092,node03:9092 --topic order
启动一个消费者,消费数据
./kafka-console-consumer.sh --zookeeper node01:2181 --from-beginning --topic order
最新版本的命令:
./kafka-console-consumer.sh --bootstrap-server node01:9092,node02:9092,node03:9092 --topic order --from-beginning
查看topic的详细信息
./kafka-topics.sh --describe --topic order --zookeeper node01:2181,node02:2181,node03:2181
8.使用Java api运行
依赖
org.apache.kafka
kafka-clients
0.11.0.1
生产者的代码
import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.Producer;
import org.apache.kafka.clients.producer.ProducerRecord;
import java.util.Properties;
public class OrderProducer {
public static void main(String[] args) {
//1. 加载生产者的配置信息
Properties props = new Properties();
//kafka集群的地址
props.put("bootstrap.servers", "node01:9092,node02:9092,node03:9092");
//消息的确认机制
props.put("acks", "all");
//消息的重试
props.put("retries", 0);
//消息的批量大小
props.put("batch.size", 16384);
props.put("linger.ms", 1);
//消息的批量缓存大小
props.put("buffer.memory", 33554432);
//消息的key的序列化方式
props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
//消息的value的序列化方式
props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
//2. 创建生产者
Producer producer = new KafkaProducer(props);
//3 生产数据
for (int i = 0; i < 100; i++) {
//一条消息
/**
* 第一个参数: topic的名称
* 第二个参数: key
* 第三个参数: value
*/
ProducerRecord record = new ProducerRecord("order", Integer.toString(i), Integer.toString(i));
producer.send(record);
}
//4关闭
producer.close();
}
}
消费者的代码
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import java.util.Arrays;
import java.util.Properties;
public class OrderConsumer {
public static void main(String[] args) {
//1. 加载配置信息
Properties props = new Properties();
//kafka集群的地址
props.put("bootstrap.servers", "node01:9092,node02:9092,node03:9092");
//消费组id(必须唯一)
props.put("group.id", "ooxx");
//消费完数据,提交消费数据的偏移量
props.put("enable.auto.commit", "true");
//提交偏移量的间隔周期
props.put("auto.commit.interval.ms", "1000");
//key和value的序列化方式
props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
//2. 创建消费者
KafkaConsumer kafkaConsumer = new KafkaConsumer(props);
//3. 订阅topic的消息(可以同时订阅多个topic的消息)
kafkaConsumer.subscribe(Arrays.asList("order","news"));
//4. 消费数据
while (true) {
//拉取消息 pull
ConsumerRecords records = kafkaConsumer.poll(100);
//遍历消息
for (ConsumerRecord record : records) {
//获取消费的偏移量 消息的key 消息的value
int partition = record.partition();
System.out.println("partition = " + partition + " , offset = " + record.offset() + ", key = " + record.key() + ", value = " + record.value());
}
}
}
}
如果本机没有修改hosts ,用命令的方式可以发送和接收数据,用java代码发送接收不了
window系统的电脑的hosts文件中必须配置:ip和主机名的对应关系.
192.168.72.141 node01
192.168.72.142 node02
192.168.72.143 node03