前面已经部署好了Kafka集群(伪分布式),下面要进入java开发环境搭建。
一、环境描述
1、win10下 eclipse (kepler)
2、本机建立了虚拟机 系统: centos 6.5 ip:192.168.136.134
3、在134上部署了zookeeper 伪分布式部署 192.168.136.134:2181,192.168.136.134:2182,192.168.136.134:2183
4、在134上部署了kafka broker集群(伪分布式部署):192.168.136.134:9092,192.168.136.134:9093,192.168.136.134:9094
broker id 分别为 1,2,3
二、目标
1、在eclipse上建立工程,导入依赖库,可以正常编译, producter和consumer 都可以实现
2、可以在eclipse 调试程序, 本机 ----》 连接虚拟机的 zookeeper集群和 kafka的broker集群
3、打包后的程序,可以部署到虚拟机134上, 实现 虚机上的客户端 ---》连接虚拟机的 zookeeper集群和 kafka的broker集群
三、搭建过程
整个过程其实走了一些弯路,网络上一些内容因为版本的问题,可能会用 maven方式,实际上现在也可以直接用常用的java工程开发方式,看各自喜欢。
另外,最新的api开发更简单而且据说效率更高,所以。。。。摸索都是泪。 希望本篇可以让大家少走弯路。
1) maven方式建立工程 (可行,个人不推荐, 因为工作场所无外网)
----------具体安装maven和配置的步骤见maven实践
在eclipse集成maven已经实现后,创建一个maven工程: 打开eclipse,File->new->other 选中maven project
然后,修改pom.xml,在文件中增加如下依赖
<dependencies> <dependency> <groupId>org.apache.kafka</groupId> <artifactId>kafka_2.10</artifactId> <version>0.8.2.0</version> </dependency> </dependencies>完成后,保存。 保存会触发maven工程自己会从网络上下载依赖库,出现如下界面,就说明工程正在自动下载依赖库。
编写producter代码:
package com.newland.appkafka; import java.util.Properties; import java.util.concurrent.TimeUnit; import kafka.javaapi.producer.Producer; import kafka.producer.KeyedMessage; import kafka.producer.ProducerConfig; import kafka.serializer.StringEncoder; public class kafkaProducer extends Thread{ private String topic; public kafkaProducer(String topic){ super(); this.topic = topic; } @Override public void run() { Producer producer = createProducer(); int i=0; while(true){ producer.send(new KeyedMessage<Integer, String>(topic, "message: " + i++)); try { TimeUnit.SECONDS.sleep(1); } catch (InterruptedException e) { e.printStackTrace(); } } } private Producer createProducer() { Properties properties = new Properties(); properties.put("zookeeper.connect", <span style="color:#ff0000;">"192.168.136.134:2181,192.168.136.134:2182,192.168.136.134:2183"</span>);//声明zk properties.put("serializer.class", StringEncoder.class.getName()); properties.put("metadata.broker.list", <span style="color:#ff0000;">"192.168.136.134:9092,192.168.136.134:9093,192.168.136.134:9094</span>");// 声明kafka broker return new Producer<Integer, String>(new ProducerConfig(properties)); } public static void main(String[] args) { new kafkaProducer<span style="color:#ff0000;">("cwqsolotest")</span>.start();// 使用kafka集群中创建好的主题 test } }类似的consumer代码:
package com.newland.appkafka; import java.util.HashMap; import java.util.List; import java.util.Map; import java.util.Properties; import kafka.consumer.Consumer; import kafka.consumer.ConsumerConfig; import kafka.consumer.ConsumerIterator; import kafka.consumer.KafkaStream; import kafka.javaapi.consumer.ConsumerConnector; /** * 接收数据 * 接收到: message: 10 接收到: message: 11 接收到: message: 12 接收到: message: 13 接收到: message: 14 * @author zm * */ public class kafkaConsumer extends Thread{ private String topic; public kafkaConsumer(String topic){ super(); this.topic = topic; } @Override public void run() { ConsumerConnector consumer = createConsumer(); Map<String, Integer> topicCountMap = new HashMap<String, Integer>(); topicCountMap.put(topic, 1); // 一次从主题中获取一个数据 Map<String, List<KafkaStream<byte[], byte[]>>> messageStreams = consumer.createMessageStreams(topicCountMap); KafkaStream<byte[], byte[]> stream = messageStreams.get(topic).get(0);// 获取每次接收到的这个数据 ConsumerIterator<byte[], byte[]> iterator = stream.iterator(); while(iterator.hasNext()){ String message = new String(iterator.next().message()); System.out.println("接收到: " + message); } } private ConsumerConnector createConsumer() { Properties properties = new Properties(); properties.put("zookeeper.connect", <span style="color:#ff6600;">"192.168.136.134:2181,192.168.136.134:2182,192.168.136.134:2183"</span>);//声明zk properties.put("group.id", "group5");// 必须要使用别的组名称, 如果生产者和消费者都在同一组,则不能访问同一组内的topic数据 return Consumer.createJavaConsumerConnector(new ConsumerConfig(properties)); } public static void main(String[] args) { new kafkaConsumer<span style="color:#ff0000;">("cwqsolotest").</span>start();// 使用kafka集群中创建好的主题 test } }然后确保没有错误后,在需要测试的类上右键-》run as java application
正常情况下,就可以连接上kafka,producter向消息队列推送消息,consumer可以从消息队列接受消息。
接收到: message: 11 接收到: message: 12 接收到: message: 13 接收到: message: 14本人在运行producter时,并不顺利,eclipse控制台很不争气的报错了,
一度怀疑自己的写法,或者依赖包有问题,后来试着打包,将生成后的jar包,放到虚拟机上运行,一切正常,才确定是因为部署在本机和虚拟机两台机器的原因。
通过查找资料,大致确定了原因,就是本机和kafka服务端所在虚拟机,不是同一台机器,如果kafka服务端,设置的ip用的localhost,会发生此类问题。
于是修改kafka的server1.properties, server2.properties,server3.properties
上面是通过maven方式建立工程。
2) 下面说明一下如何建立 java 工程。
与普通的java工程一样,建立后,将producter和consumer类放到工程里, 在lib 目录下,拷贝原kafka lib目录下的jar包
红色框内为需要从kafka的libs里拷贝过来的jar包。 其中标蓝绿色的jar包,是写producter需要的, 如果只写consumer的应用并不需要。后面调试顺利。
在此工程中,又发现了一个问题,代码很多地方出现了划掉的情况,这个说明api有更新。
向同事请教,同事说最新的api,已经简化了开发, 标蓝色的jar包无需加入,要修改一下写法。
package com.newland.appkafka; <span style="color:#ff0000;">import org.apache.kafka.clients.producer.KafkaProducer; import org.apache.kafka.clients.producer.Producer; import org.apache.kafka.clients.producer.ProducerRecord;</span> import java.util.Properties; public class ProducerNewApi { public static void main(String[] args) { Properties props = new Properties(); props.put("bootstrap.servers", "192.168.136.134:9092,192.168.136.134:9093,192.168.136.134:9094"); props.put("acks", "all"); props.put("retries", 0); props.put("batch.size", 16384); props.put("linger.ms", 1); props.put("buffer.memory", 33554432); props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer"); props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer"); Producer<String, String> producer = new KafkaProducer<String, String>(props); for(int i = 0; i < 100; i++) producer.send(new ProducerRecord<String, String>("cwqsolotest", "message: " + i++)); producer.close(); } }新的api写法,在import 这里就有显著不同,引入的jar包,也只需要kafka的客户端。
在虚拟机上开一个consumer接受消息,执行结果如下: