甲由崽

流式计算（二）-Kafka Stream

前面说了Java8的流，这里还说流处理，既然是流，比如水流车流，肯定得有流的源头，源可以有多种，可以自建，也可以从应用端获取，今天就拿非常经典的Kafka做源头来说事，比如要来一套应用日志实时分析框架，或者是高并发实时流处理框架，正是Kafka的拿手好戏。

环境：Idea2019.03/Gradle6.0.1/JDK11.0.4/Lambda/RHEL8.0/VMWare15.5/Springboot2.2.1.RELEASE/Zookeeper3.5.5/Kafka2.3.1

难度：新手--战士--老兵--大师

目标：

理解kafka原理
Linux下kafka集群安装
使用kafka操作流式处理

说明：

为了遇见各种问题，同时保持时效性，我尽量使用最新的软件版本。代码地址：其中的day23，https://github.com/xiexiaobiao/dubbo-project.git

第一部分——原理

1.先看看Kafka，目前kafka的发展已超出消息中间件的范畴，趋于向流平台靠拢，先总结如下：

1.1 Scala语言编写，若作为消息中间件，并发10W+级别，大于其他MQ；

1.2 必须有Zookeeper做协调，ZK保存消费者/生产者状态信息，使得两端非常轻量化；使用发布/订阅模式，所有消息按主题(topic)分类，使用pull模式消费消息；

1.3 每条消息由key + value + timestamp构成，其中key用于计算目的发送分区(partition)，消息记录由不可变(immutable)的顺序式Append log文件持久化消息，Append写方式是高吞吐率的重要支撑之一！偏移量(offset)标识消息在文件中的位置，下图来自官网：

1.4 每条消息不论是否已被消费都将保存一个设定的时间，这是和RabbitMQ的显著差异；消费者仅需保存消息offset信息，可按顺序消费(一个topic只有一个partition)，也能进行非顺序式回溯，但随机读写性能差；多个consumer消费互不影响，这也是高并发的支撑之一！下图来自官网：

1.5 每个topic的所有消息，均衡(或指定)写入多个分区(partition)，分区分布在不同的broker上，每个分区使用主(Leader)+从(Follower)多节点，这样的好处，一是分区文件大小和负载可控，增强单个topic的数据承载量，二是适应并行处理；Leader负责读/写，Followers仅复制备份，Leader不可用时，自动选举Follower转为主：

1.6 每个Consumer实例都属于一个消费者组(consumer group)，多个Consumer实例可以存在于不同的进程或机器上(Consumer实例可类比于java类的实例对象)，一个消息记录只会发送给有对应主题订阅的消费者组中的一个Consumer实例！在一个消费者组中，每个分区至多只能发送到同一消费者的一个实例上，但一个消费者实例可以消费多个分区，因此，若一个group中的消费者数量大于分区数量的话，多余的消费者将不会收到任何消息，所以分区(partition)数必须大于等于消费者组中的实例数量。下图中，具有2个server的kafka集群，拥有同一个topic的4个分区，并对接2个消费者组，如果A或B组中Consumer都是同一消费者的实例，则轮询均衡消费，若同组都是不同的消费者实例，则相当于广播消息，下图来自官网:

1.7 缺少事务特性，没有接收确认和消费确认ACK机制，也没有RocketMQ的二阶段提交。

1.8 使用场景，下图来自官网，这也让我想起了kafka的几个圈圈的图标：

常规消息系统：消息系统一般有queue和publish-subscribe两种模式，queue模式下，多个consumer可以并行地各自处理一部分消息，增加吞吐量和速度，但不能一个消息多分发，因为消息被消费掉就不存在了。publish-subscribe模式下，可以广播一个消息给多个订阅者，但无法扩大吞吐量，kafka的consumer group概念下既能并行也能分发！我认为事实上kafka并没有使用队列这个数据结构，因没有先进先出的概念！
实时流处理：对接KstreamAPI，可以实现流式处理，状态计算。
分布式流式数据储存：分区+副本的磁盘存储方式可以实现高可用，低延时，大数据量下无性能衰减，kafka还具有仅当所有主从复制全部完成时才算写入成功的确认机制，从而可作为commit log存储系统。

第二部分——安装

虽然window下也可使用kafka，但我想生产环境下都是使用linux，我使用RHEL8.0虚拟机，JDK11的安装，略!

2.1 先进行Zookeeper安装，虽然kafka新版本已经自带ZK，但我还是推荐单独安装ZK，配置和功能独立，步骤比较清晰，且如果是ZK集群，更建议单独配置，为节省篇幅，此部分非重点我就简述了，下载apache-zookeeper-3.5.5-bin.tar.gz，创建/usr/zookeeper目录，cp到该目录，tar命令解压，创建data和logs目录，用于保存zk的数据和log日志，根据zoo_sample.cfg复制一个zoo.cfg文件，并vim编辑如下图，顺带研究下zk的配置：

然后配置linux环境变量，

[root@localhost ~]# vim /etc/profile

保存后使用source命令，使配置生效：

[root@localhost ~]# source /etc/profile

ZK启动命令，会自动使用zoo.cfg配置文件：

[root@localhost apache-zookeeper-3.5.5-bin]# ./bin/zkServer.sh start

成功后状态：

其他ZK管理命令：

/查看服务状态: ./zkServer.sh status
/停止服务: ./zkServer.sh stop
/重启服务: ./zkServer.sh restart
/使用ZKCli连接服务器: ./zkCli.sh -server 127.0.0.1:2181，

我本地zkCli实例如下：

2.2 安装kafka，下载kafka_2.12-2.3.1.tgz，创建/usr/kafka目录，cp到此目录，解压，得到kafka_2.12-2.3.1目录，进入此目录，先看配置，这里有consumer、producer和server三个properties配置文件：

使用命令启动：

[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-server-start.sh config/ server.properties

如下为启动kafka成功：

再回到zkCli下ls命令查看下，发现创建了很多node，用于保存kafka运行上下文信息：

新开一个terminal，创建一个topic，指定replication副本因子为1，即复制0份，分区partitions数量指定为 1：

[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic biao

列出存在的topic：

[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-topics.sh --list --zookeeper localhost:2181

创建另一个topic ：

[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-topics.sh --create --bootstrap-server localhost:9092 --replication-factor 1 --partitions 1 --topic test

下图中创建了一个topic：test，使用本机kafka做集群识别，前面使用zk做集群识别，--bootstrap-server和--zookeeper参数效果一样。再模拟producer，该topic下发送两行消息，默认条件下，每行为一个消息记录：

[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test

再另开一个terminal，模拟consumer，此terminal输出将会和producer输入一致：

[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning

Ctrl + C 退出程序。

2.3 以上为单ZK单kafka搭建，下面搭建单ZK多kafka实例环境：复制出3份配置文件：

[root@localhost kafka_2.12-2.3.1]# cp config/server.properties  config/server-0.properties
[root@localhost kafka_2.12-2.3.1]# cp config/server.properties  config/server-1.properties
[root@localhost kafka_2.12-2.3.1]# cp config/server.properties  config/server-2.properties

以server-1.properties为例，其他数字依次修改即可：

broker.id=1  #集群内必须唯一
listeners=PLAINTEXT://:9093  #Socket监听地址，没写hostname/IP即为listen所有IP
log.dirs=/tmp/kafka-logs-1  #log目录，每个实例独立，防止互相覆盖
zookeeper.connect  #ZK注册地址，因为是单ZK，三个实例一样

单独的terminal下创建topic：

[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-topics.sh --create --bootstrap-server localhost:9092 --replication-factor 3 --partitions 1 --topic my-replicated-topic

这里：指定replication副本因子为3，即复制2份，分区partitions数量指定为1，

查看topic的详细信息：

[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-topics.sh --describe --bootstrap-server localhost:9092 --topic my-replicated-topic

另一个例子：

[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-topics.sh --create --bootstrap-server localhost:9092 --replication-factor 3 --partitions 3 --topic replicated-xiao
[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-topics.sh --describe --bootstrap-server localhost:9092 --topic replicated-xiao

以上每行说明一个partition，

"Leader"：leader节点，负责读写，一个partition下的leader是随机选取的；
"replicas"：列出所有同步保存append log文件的节点，不论主从角色和状态是否有效；
"isr" ：意为"in-sync"，即当前有主从同步的有效节点列表；

模拟producer，并输入几行信息：

[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-console-producer.sh --broker-list localhost:9092 --topic replicated-xiao
>xie
>xiaobiao
>hell world

新terminal下，模拟consumer：

[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-console-consumer.sh -bootstrap-server localhost:9092 --from-beginning --topic replicated-xiao


Consumer窗口输出内容会和producer窗口输入内容保持一致：

容错测试，关闭broker-1实例：

[root@localhost ~]# ps -aux | grep server-1.properties

[root@localhost ~]# kill 21753

或者直接到server-1界面CTRL+C关闭，效果一样：

对比上面的图，可以看到Leader发生变化，Isr 里都没有1了：

再使用consumer读取记录，效果一样，可见容错机制启用了主从替代：

如果再启动server-1，可见主从替换后，不会恢复：

第三部分——应用

创建一个Springboot+gradle项目，命名为kafka-stream02，

3.1 应用测试01：位于包com.biao.kafka下，实现kafka消息的发送和消费：

build.gradle中的核心依赖为：

compile group: 'org.springframework.boot', name: 'spring-boot-starter', version: '2.2.1.RELEASE'
compile group: 'org.springframework.kafka', name: 'spring-kafka', version: '2.3.3.RELEASE'

创建消息发送者com.biao.kafka.Producer：

@Component
//@Slf4j
public class Producer {
    @Autowired
    private KafkaTemplate kafkaTemplate;

    private Logger log = LoggerFactory.getLogger(Producer.class);
    private String time = LocalDateTime.now().toString();
    private final String msg = "THIS IS MESSAGE CONTENT " + time;

    public void send() throws InterruptedException {
        log.info("send message is {}",this.msg);
        Thread.sleep(1000L);
        // kafkaTemplate.sendDefault() 为异步方法，返回 ListenerFuture，
        kafkaTemplate.send("HelloWorld","test-key",this.msg);
    }
}

以上核心为kafkaTemplate的API，可以使用kafkaTemplate.send(topic,key,value)同步方法发送消息，或者kafkaTemplate. sendDefault()异步方法发送，

再创建消费者com.biao.kafka.Consumer，使用@KafkaListener注解标识一个topic的监听方法：

@Component
//@Slf4j
public class Consumer {

    private Logger log = LoggerFactory.getLogger(Consumer.class);

    @KafkaListener(id = "foo",groupId = "test-consumer-group",topics = "HelloWorld")
    public void listen(ConsumerRecord records){
        Optional msg = Optional.ofNullable(records.value());
        if (msg.isPresent()){
            Object data = msg.get();
            log.info("ConsumerRecord >>>>>> {}", records);
            log.info("Record Data >>>>>> {}", data);
        }
    }
}

创建入口类 com.biao.kafka.KafkaApplication：

@SpringBootApplication
public class KafkaApplication {
    public static void main(String[] args) throws InterruptedException {
        System.out.println("KafkaApplication started >>>>>>");
        ConfigurableApplicationContext context = SpringApplication.run(KafkaApplication.class,args);
        Producer producer = context.getBean(Producer.class);
        producer.send();
    }
}

配置文件application.properties，请关注下Serializer和Deserializer:

#以下这些值也可以在运行时通过参数指定
#============== kafka ===================
# 指定kafka 代理地址，可以多个,用逗号隔开
spring.kafka.bootstrap-servers=192.168.1.204:9092
# 运行com.biao.wordcount.WordCountApplication时使用，我换了一个linux虚拟机
#spring.kafka.bootstrap-servers=192.168.1.221:9092

#=============== provider  =======================
spring.kafka.producer.retries=2
# 每次批量发送消息的数量，kafka是使用流模拟批量处理，每次提交都是批处理方式
spring.kafka.producer.batch-size=16384
spring.kafka.producer.buffer-memory=33554432

spring.kafka.producer.key-serializer=org.apache.kafka.common.serialization.StringSerializer
spring.kafka.producer.value-serializer=org.apache.kafka.common.serialization.StringSerializer

#=============== consumer  =======================
spring.kafka.consumer.group-id=test-consumer-group
spring.kafka.consumer.auto-offset-reset=earliest
spring.kafka.consumer.enable-auto-commit=true
spring.kafka.consumer.auto-commit-interval=100

spring.kafka.consumer.key-deserializer=org.apache.kafka.common.serialization.StringDeserializer
spring.kafka.consumer.value-deserializer=org.apache.kafka.common.serialization.StringDeserializer

运行程序即可看到结果，这里使用Springboot的DI机制启动运行了consumer和producer，注意关闭linux的防火墙或打开9092端口：

再到kafka服务器上验证一下是否真的发送成功：

[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-console-consumer.sh -bootstrap-server 192.168.1.204:9092 --from-beginning --topic HelloWorld

3.2 应用测试02，包com.biao.pipe下，实现一个流处理逻辑，开启一个流传输管道，将一个topic的内容传输到另一个topic中，代码com.biao.pipe.PipeApplication：

public class PipeApplication {
    public static void main(String[] args) {
        System.out.println("PipeApplication starting .........");
        Properties props = new Properties();
        // StreamsConfig已经预定义了很多参数名称，运行时console会输出所有StreamsConfig values
        // 这里没有使用springboot的application.properties来配置
        props.put(StreamsConfig.APPLICATION_ID_CONFIG,"streams-pipe");
        props.put(StreamsConfig.BOOTSTRAP_SERVERS_CONFIG,"192.168.1.221:9092");
        // kafka流都是byte[],必须有序列化，
        props.put(StreamsConfig.DEFAULT_KEY_SERDE_CLASS_CONFIG, Serdes.String().getClass());
        props.put(StreamsConfig.DEFAULT_VALUE_SERDE_CLASS_CONFIG,Serdes.String().getClass());

        // kafka流计算是一个各broker连接的拓扑结构，以下使用builder来构造拓扑
        final StreamsBuilder builder = new StreamsBuilder();
        // 构建一个KStream流对象，元素是类型的key-value对值，
        KStream source = builder.stream("streams-plaintext-input");
        // 将前面的topic："streams-plaintext-input"写入另一个topic："streams-pipe-output"
        source.to("streams-pipe-output");
        // 以上两行等同以下一行
        // builder.stream("streams-plaintext-input").to("streams-pipe-output");

        // 查看具体构建的拓扑结构
        final Topology topology = builder.build();
        System.out.println(topology.describe());

        final KafkaStreams streams = new KafkaStreams(topology,props);
        // 控制运行次数，一次后就结束
        final CountDownLatch latch = new CountDownLatch(1);

        Runtime.getRuntime().addShutdownHook(new Thread("streams-shutdown-hook"){
            @Override
            public void run() {
                streams.close();
                latch.countDown();
            }
        });

        try{
            streams.start();
            latch.await();
        }catch (Throwable e){
            System.exit(1);
        }
        System.exit(0);
    }
}

注意：以上即使用kafka topic构建了一个KStream流源头，运行输出以下，即为成功，进一步可以在kafka中进行topic写入，再到另一个topic验证输出，我就不演示了。注意配置/usr/kafka2.3/kafka_2.12-2.3.1/config/server.properties中的listeners地址(见后记1)：

解释：以上构造了有2个处理节点的kafka流计算拓扑结构，源节点：KSTREAM-SOURCE-0000000000，汇聚(Sink)节点：KSTREAM-SINK-0000000001，源节点持续的读取topic为streams-plaintext-input的有序记录并输送到下游Sink节点，Sink节点再将记录写入topic为streams-pipe-output的流，--> 和 <-- 指示左右端对象的上游和下游关系，图中有换行，导致显示不连贯拓扑展示如下：

3.3 应用测试03，包com.biao.linesplit下，创建一个无状态的流处理逻辑，读取一个topic的记录，并将文本行按空格分开，再传输到另一个topic，代码 com.biao.linesplit.LineSplitApplication：

public class LineSplitApplication {
    public static void main(String[] args) {
        System.out.println("LineSplitApplication starting .........");
        Properties props = new Properties();
        // StreamsConfig已经预定义了很多参数名称，运行时console会输出所有StreamsConfig values
        // 这里没有使用springboot的application.properties来配置
        props.put(StreamsConfig.APPLICATION_ID_CONFIG,"streams-line-split");
        props.put(StreamsConfig.BOOTSTRAP_SERVERS_CONFIG,"192.168.1.221:9092");
        // kafka流都是byte[],必须有序列化，不同的对象使用不同的序列化器
        props.put(StreamsConfig.DEFAULT_KEY_SERDE_CLASS_CONFIG, Serdes.String().getClass());
        props.put(StreamsConfig.DEFAULT_VALUE_SERDE_CLASS_CONFIG,Serdes.String().getClass());

        // kafka流计算是一个各broker连接的拓扑结构，以下使用builder来构造拓扑
        final StreamsBuilder builder = new StreamsBuilder();
        // 构建一个KStream流对象，元素是类型的key-value对值，
        KStream source = builder.stream("streams-plaintext-input");
        /*
        // 以source为输入，产生一条新流words，这里使用了流的扁平化语法，我的前篇文章有讲此基础
        KStream words = source.flatMapValues(value -> Arrays.asList("\\W+"));
        // 将前面的topic："streams-plaintext-input"写入另一个topic："streams-pipe-output"
        words.to("streams-pipe-output");*/

        // 以上两行使用stream链式语法+lambda等同以下一行，我的前篇文章有讲此基础
        source.flatMapValues(value -> Arrays.asList(value.split("\\W+")))
                      .to("streams-linesplit-output");

        // 查看具体构建的拓扑结构
        final Topology topology = builder.build();
        System.out.println(topology.describe());

        final KafkaStreams streams = new KafkaStreams(topology,props);
        // 控制运行次数，一次后就结束
        final CountDownLatch latch = new CountDownLatch(1);

        Runtime.getRuntime().addShutdownHook(new Thread("streams-shutdown-hook"){
            @Override
            public void run() {
                streams.close();
                latch.countDown();
            }
        });

        try{
            streams.start();
            latch.await();
        }catch (Throwable e){
            System.exit(1);
        }
        System.exit(0);
    }
}

运行输出以下，即为成功，也可以进一步在kafka上直接进行topic写入和另一个topic输出验证，演示，略！注意配置/usr/kafka2.3/kafka_2.12-2.3.1/config/server.properties中的listeners地址(见后记1)：

解释：以上构造了有3个处理节点的kafka流计算拓扑结构，源节点：KSTREAM-SOURCE-0000000000，处理节点：KSTREAM-FLATMAPVALUES-0000000001，汇聚节点：KSTREAM-SINK-0000000002，处理节点从源节点取得流元素，进行处理，再将结果传输给汇聚节点，注意这个过程是无状态的，拓扑展示如下：

3.4 应用测试04，包com.biao.wordcount下，构建一个无限流处理逻辑，读取一个topic，统计文本单词数，最终输出到另一个topic，代码com.biao.wordcount.WordApplication：

public class WordCountApplication {
    public static void main(String[] args) {
        System.out.println("WordCountApplication starting .........");
        Properties props = new Properties();
        // StreamsConfig已经预定义了很多参数名称，运行时console会输出所有StreamsConfig values
        // 这里没有使用springboot的application.properties来配置
        props.put(StreamsConfig.APPLICATION_ID_CONFIG,"streams-word-count");
        // kafka虚拟机linux地址
        props.put(StreamsConfig.BOOTSTRAP_SERVERS_CONFIG,"192.168.1.221:9092");
        // kafka流都是byte[],必须有序列化，不同的对象使用不同的序列化器
        props.put(StreamsConfig.DEFAULT_KEY_SERDE_CLASS_CONFIG, Serdes.String().getClass());
        props.put(StreamsConfig.DEFAULT_VALUE_SERDE_CLASS_CONFIG,Serdes.String().getClass());

        // kafka流计算是一个各broker连接的拓扑结构，以下使用builder来构造拓扑
        final StreamsBuilder builder = new StreamsBuilder();
        // 构建一个KStream流对象，元素是类型的key-value对值，topic:streams-plaintext-input
        KStream source = builder.stream("streams-plaintext-input");

        // 以下使用stream链式语法+lambda，具体分开的过程语句我就不写了
        // flatMapValues将text line使用空格分隔成words
        source.flatMapValues(value -> Arrays.asList(value.toLowerCase(Locale.getDefault()).split("\\W+")))
                .groupBy(((key, value) -> value))
                .count(Materialized.byte[]>>as("counts-store"))
                .toStream()
                .to("streams-wordcount-output", Produced.with(Serdes.String(),Serdes.Long()));

        // 查看具体构建的拓扑结构
        final Topology topology = builder.build();
        System.out.println(topology.describe());

        final KafkaStreams streams = new KafkaStreams(topology,props);
        // 控制运行次数，一次后就结束
        final CountDownLatch latch = new CountDownLatch(1);

        Runtime.getRuntime().addShutdownHook(new Thread("streams-shutdown-hook"){
            @Override
            public void run() {
                streams.close();
                latch.countDown();
            }
        });

        try{
            streams.start();
            latch.await();
        }catch (Throwable e){
            System.exit(1);
        }
        System.exit(0);
    }
}

运行输出以下内容，即为成功，注意配置/usr/kafka2.3/kafka_2.12-2.3.1/config/server.properties中的listeners地址(见后记1)：

解释：最重要一点即此WordCountApplication仅是一个逻辑处理单元，可以理解为一个流水线车间，里面有两条流水线对来料加工再输出加工品。以上可以看出，有两个不连通的拓扑结构，第一个拓扑无状态，其汇聚节点KSTREAM-SINK-0000000005写入到topic: counts-store-repartition，这个topic又作为第二个拓扑的源，此中间topic的作用是因分组聚合运算”打乱”流元素的顺序。插入的节点Processor: KSTREAM-FILTER-0000000005是过滤掉分组聚合key值为空的记录。

第二个拓扑有状态，即生成并保存了计算中间值，因为要做分组统计，分组聚合运算节点KSTREAM-AGGREGATE-0000000003保存状态使用了counts-store，即程序中指定的值。对流中每个元素统计时，会先去保存的状态数据中去查找匹配，如果有则累加一，然后再写入counts-store。每个被更新的统计值都再传输到处理节点KTABLE-TOSTREAM-0000000007，此节点作用是将统计更新的值再解析成新流。最后传输给汇聚节点KSTREAM-SINK-0000000008。以上可见流处理的思想和逻辑，内部迭代确实很强大！拓扑图如下：

应用04运行步骤：

第一步，启动ZK，再启动kafka，注意先修改config/server.properties 中listeners=PLAINTEXT:// 192.168.1.221:9092：

[root@localhost kafka_2.12-2.3.1]#  ./bin/kafka-server-start.sh config/server.properties

第二步，运行com.biao.wordcount.WordCountApplication，启动kafka流处理车间。

topic数据写入放在包com.biao.wordcount.producer，当然也可以直接在kafka server中使用命令行写入，我这里是为了演示多种代码操作模式。配置类com.biao.wordcount.producer.KafkaConfig，这里使用了kafka的API配置方式，分别配置了topic，producer和consumer的相应参数，并生成Bean对象，请对比application.properties方式：

@Configuration
@EnableKafka
public class KafkaConfig {

    @Bean
    public KafkaTemplate kafkaTemplate(){
        return new KafkaTemplate<>(this.producerFactory());
    }

    // topic
    @Bean
    public KafkaAdmin admin(){
        Map configs = new HashMap<>(16);
        configs.put(AdminClientConfig.BOOTSTRAP_SERVERS_CONFIG,"192.168.1.221:9092");
        return new KafkaAdmin(configs);
    }

    @Bean
    // NewTopic(String name, int numPartitions, short replicationFactor)
    // kafka中每个topic只需创建一次，
    public NewTopic topic(){
        return new NewTopic("streams-plaintext-input",1, (short) 1);
    }

    @Bean
    // NewTopic(String name, int numPartitions, short replicationFactor)
    // kafka中每个topic只需创建一次，
    public NewTopic topic2(){
        return new NewTopic("streams-wordcount-output",1, (short) 1);
    }

    // producer
    @Bean
    public Map producerConfigs(){
        Map props = new HashMap<>(16);
        props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG,"192.168.1.221:9092");
        props.put("acks","all");
        props.put("retries",2);
        props.put("batch.size",16384);
        props.put("linger.ms",1);
        props.put("buffer.memory",33554432);
        props.put("key.serializer","org.apache.kafka.common.serialization.IntegerSerializer");
        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
//        props.put("key.converter","org.apache.kafka.connect.storage.IntegerConverter");
//        props.put("value.converter","org.apache.kafka.connect.storage.StringConverter");
        return props;
    }

    @Bean
    public ProducerFactory producerFactory(){
        return new DefaultKafkaProducerFactory<>(this.producerConfigs());
    }

    // consumer
    @Bean
    public Map consumerConfigs(){
        HashMap props =  new HashMap<>(16);
        props.put("bootstrap.servers","192.168.1.221:9092");
        props.put("group.id","foo");
        props.put("enable.auto.commit","true");
        // WordCountApplication 的consumer消费对象是统计的结果 key-value
        props.put("key.deserializer","org.apache.kafka.common.serialization.StringDeserializer");
        props.put("value.deserializer","org.apache.kafka.common.serialization.LongDeserializer");
        props.put("formatter","kafka.tools.DefaultMessageFormatter");
        props.put("print.key","true");
        props.put("value.key","true");
//        props.put("key.converter","org.apache.kafka.connect.storage.IntegerConverter");
//        props.put("value.converter","org.apache.kafka.connect.storage.StringConverter");
        return props;
    }

    @Bean
    public ConsumerFactory consumerFactory(){
        return new DefaultKafkaConsumerFactory<>(this.consumerConfigs());
    }

    @Bean
    public ConcurrentKafkaListenerContainerFactory kafkaListenerContainerFactory(){
        ConcurrentKafkaListenerContainerFactory factory = new ConcurrentKafkaListenerContainerFactory<>();
        factory.setConsumerFactory(this.consumerFactory());
        return factory;
    }

    @Bean
    public SimpleConsumer simpleConsumerLister(){
        return new SimpleConsumer();
    }
}

定义消费者，com.biao.wordcount.producer.SimpleConsumer：

@Component
public class SimpleConsumer {
    private Logger log = LoggerFactory.getLogger(SimpleConsumer.class);
    private final CountDownLatch countDownLatch = new CountDownLatch(1);

    @KafkaListener(id = "foo",topics = "streams-wordcount-output")
    public void listen(byte[] records){
        System.out.println("records is >>>> "+ records);
        this.countDownLatch.countDown();
        log.debug("consume successfully!");
    }
    //在WordCountApplication实例中，无法打印流结果，因为需要格式化
/*    public void listen(ConsumerRecord records){
        Optional msg = Optional.ofNullable(records.value());
        if (msg.isPresent()){
            Object data = msg.get();
            log.info("Consumer Record >>>>>> {}", records);
            log.info("Record Data >>>>>> {}", data);
        }
    }*/
}

定义生产者，并作为启动类，com.biao.wordcount.producer.KafakaProducer：

@SpringBootApplication
public class KafakaProducer {
    public static void main(String[] args) {
        AnnotationConfigApplicationContext context = new AnnotationConfigApplicationContext(KafkaConfig.class);
//        KafkaTemplate kafkaTemplate = (KafkaTemplate) context.getBean(KafkaTemplate.class);
        KafkaTemplate kafkaTemplate = (KafkaTemplate) context.getBean(KafkaTemplate.class);
        LocalDateTime time = LocalDateTime.now();
        String data = "MSG CONTENT -> " + time ;
        // send(String topic, K key, @Nullable V data)
        ListenableFuture> send = kafkaTemplate.send("streams-plaintext-input", 1, data);
        send.addCallback(new ListenableFutureCallback>() {
            @Override
            public void onFailure(Throwable ex) {
                System.out.println(">>>>>>> kafka message send failure");
            }

            @Override
            public void onSuccess(SendResult result) {
                System.out.println(">>>>>>> kafka message send successfully");
            }
        });
    }
}

第三步，运行com.biao.wordcount.producer.KafakaProducer，启动topic数据写入，kafka中验证如下：

如果多次运行导致测试数据太多，影响结果查看，可以先删除topic及其数据，若当前topic有使用过即有传输过信息：并没有真正删除topic只是把这个topic标记为删除(marked for deletion），要彻底删除需到ZK中删除相应的目录：

[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-topics.sh --zookeeper localhost:2181 --delete --topic HelloWorld
Topic HelloWorld is marked for deletion.
Note: This will have no impact if delete.topic.enable is not set to true.

第四步，在kafka server上查看最终word统计结果，命令：

[root@localhost kafka_2.12-2.3.1]# ./bin/kafka-console-consumer.sh --bootstrap-server 192.168.1.221:9092 --topic streams-wordcount-output --from-beginning --formatter kafka.tools.DefaultMessageFormatter --property print.key=true --property print.value=true --property key.deserializer=org.apache.kafka.common.serialization.StringDeserializer --property value.deserializer=org.apache.kafka.common.serialization.LongDeserializer

后记：

1.关于有状态和无状态，复杂问题简单化！无状态对象本身只是个纯粹的处理逻辑，不依赖上下文信息，也不改变上下文信息，比如FUNC（x+y）,只要有输入x和y，就输出相加值，对程序“无害”；有状态指会保留上下文，如统计单词数，必须保留每次计算的中间结果，用于下次累加，有状态对象会破坏程序运行现场，不利于并发和共享。

2.如遇到程序出错：

[AdminClient clientId=adminclient-1] Error connecting to node dubbo204.domain:9092 (id: 0 rack: null)


这是因为linux的监听hosts配置引起的，直接修改 config/server.properties中listeners为linux的虚机IP地址即可，并注意关闭linux的防火墙或打开9092端口：

3.添加lombok依赖

providedCompile group: 'org.projectlombok', name: 'lombok', version: '1.18.10'

遇到编译错误：

Could not find method providedCompile() for arguments [{group=org.projectlombok, name=lombok, version=1.18.10}]

因providedCompile必须配合 war插件，修改build.gradle：

4.运行WordCountApplication 报错：

org.apache.kafka.common.errors.SerializationException: Size of data received by IntegerDeserializer is not 4

这是序列化问题，必须使用正确的序列化器处理对应的数据，如IntegerDeserializer只能反序列化Integer对象，StringSerializer用于序列化String对象。

5.RHEL8.0版本可用性还是不错的，比7要流畅很多，很多命令都变了，我开的共享：https://pan.baidu.com/s/19gkx07hQ6TuN9UyNWHmChQ 提取码：bg69，绝对保证可用，之前我也下载了几次都是损坏的，每次6.62G大小，快哭了。

总结：kafka API，分为Producer，Consumer，Stream，Connect和AdminClient。Producer/Consumer分别用于管理生产者和消费者，Stream则是自带的KStream，可以类比JDK8的Stream来理解，即在输出到最终sink前进行流式计算，且很多方法使用类似，Connect是用于kafka连接到输入/输出，支持很多类型，如DB，file，redis，ELK等。AdminClient则管理topic/broker等。KStream+kafka强强联手，可以预计未来会干出一番大事!

你可能感兴趣的:(流式计算（二）-Kafka Stream)

ZooKeeper学习专栏（三）：ACL权限控制与Zab协议核心原理
文章目录前言一、ACL访问控制列表二、原子广播协议（Zab协议）总结前言在分布式系统中，安全访问控制和一致性保证是两大核心需求。本文将深入探讨Zookeeper的ACL权限控制机制和Zab协议的核心原理，帮助读者理解Zookeeper如何保障数据安全性和系统一致性。一、ACL访问控制列表ACL(AccessControlLists)是Zookeeper保护ZNode数据安全的关键机制，它定义了哪些
紫砂壶独白v
紫砂壶宜兴紫砂壶之所以受到茶人喜爱，一方面是由于紫砂壶造型美观，风格多样，独树一帜，另一方面也由于它在泡茶时有许多优点。（一）紫砂是一种双重气孔结构的多孔性材质气孔微细，密度高。用紫砂壶沏茶，不失原味。（二）紫砂壶透气性能好，使用其泡茶不易变味，暑天越宿不馊。久置不用，也不会有宿杂气，只要用时先满贮沸水，立刻倾出，再浸入冷水中冲洗，元气即可恢复，泡茶仍得原味。（三）紫砂壶能吸收茶汁，壶内壁不刷，沏
时间才是最大的财富杭州财富流沙盘俱乐部
上周去杭州师范大学，和几个大二的同学组织了一场财富流游戏。游戏结束后，我的第一感觉就是：年轻真好！我们大部分人参加财富流游戏是为了反思和总结，而他们是用来规划和展望。因为他们处于游戏中的起点：20岁的年龄。真的很羡慕他们在最美好的年龄就能接触投资理财方面的知识，给他们以启迪和思考，能够提早规划以后的人生和投资理财思路。整个沙盘推演过程，也让我对这帮00后的孩子有了新的认识，首先他们做事很认真，整个
Lua + Redis + SpringBoot = 王炸！
第一部分：Lua脚本简介第二部分：为什么选择Lua脚本第三部分：lua脚本的应用场景第四部分：Lua脚本在SpringBoot中的实现第五部分：Lua脚本来提高SpringBoot应用程序的性能第六部分：错误处理和安全性第七部分：最佳实践和建议曾经有一位魔术师，他擅长将SpringBoot和Redis这两个强大的工具结合成一种令人惊叹的组合。他的魔法武器是Redis的Lua脚本。今天，我们将揭开这
【一张图背论语】Day 029| 为政第二 | 2.13 子贡问君子 Heger_四维脑图
子贡问君子。子曰：“先行其言而后从之。”子贡问怎样才能做一个君子。孔子说：对于你要说的话，先实行了，然后说出来。在孔子的弟子中，子贡在“言语”一科中，这也说明了子贡本人在言辞方面是比较擅长的。子贡虽然善辩，但是也有言多失礼的地方。孔子在此处的这番言论，意在教育子贡，说得再好都不如做得好更让人信服，这也是孔子“因材施教”的典例。
PHP 面试题狮子座鲸鱼 php 开发语言
一、PHP新版本特性PHP7是一个重大版本，引入了许多新特性和性能优化，比如返回类型声明、泛型、异步函数、NUllable类型和标量类型声明等。PHP8(2018-今)PHP8引入了许多新特性和改进，在性能上有大幅提升，包括Just-in-Time(JIT)编译器、属性的初始化简化语法、UnionTypes（联合类型）等二、http状态码HTTP协议中几个状态码的含义:1xx（临时响应）表示临时响
Java程序设计笔记是程序蜂啊 java 笔记开发语言
Java程序设计目录Java程序设计第一章java语言开发环境1.1工具篇1.2Eclipse调整字体第三章Java基础3.1java基本数据类型3.2关键字与标识符3.3常数3.4变量3.5.数据类型转换3.6由键盘输入数据4.1顺序结构4.2分支语句5.1什么是数组5.2数组赋值：5.3一维数组5.4二维数组6.1类的基本概念6.2定义类6.3对象的创建与使用6.4参数的传递第七章java语言
三人行（十四）清风不等明月
书接上文：第二日，兄弟三人找县太爷商议之后，县太爷又号召镇里富户捐献了军需物资响应讨伐檄文。秋子凌父母更是拿出了全部家产支持他们。等到一切准备妥当之后，兄弟三人带领一千精兵直奔京城而来。对于杀回京城，边关军还面临着一个现实问题，那就是军饷。之前虽然朝廷困难，但总是能够及时从江南富裕之地运来粮草。如今朝廷没了，负责运送粮草的官员也在京城那一战中被杀了。为今之计只有一边行军，一边征粮了。其实边关的将领
李和我学神百日培养计划学习打卡第14天20210928 玫瑰之梦
今天继续阅读《学习的格局》。今天的小收获:一、有效提升时间观念和学习效率的七个方法1.尽早养成做计划的好习惯。2.用有趣的方式和孩子讨论时间。3.关注点放在时间管理训练上。4.定期整理练习物品归类。5.做好时间规划，利用试、听小工具。6.放手让孩子学习设定目标及优先次序7.学会准确预估时间，制定中长期学习计划。二、克服重度作业拖延症的五大招1.用好生物钟效应，建立有序健康的时间管理观念。2.列出时
LVS-----TUN模式配置 KellenKellenHao 服务器 linux 网络 LVS TUN模式
一、实验环境主机名称ip角色lvs-tun192.168.100.100lvs调度器web1192.168.100.1后端web服务器1web2192.168.100.2后端web服务器2client192.168.100.200客户端二、搭建lvs调度器的TUN模式1、lvs-tun调度器配置#清除DR模式的策略ipvsadm-C#查看策略ipvsadm-L[root@lvs-tun~]#ipv
大盘依旧低迷，二胎和自动驾驶活跃虚拟大师
本周来看，大盘依然不温不火，呈现箱形震荡。很多人都在打赌，沪指在上周调整之后有望突破新高，其实不然，目前的沪指基本上很难回复到以前的高位，甚至不会有向上突破的趋势，而且目前大盘的题材不鲜明，权重股没有扛起反攻的大旗。近期来看，二胎在本周表现强势，掀起几度涨停狂潮，金发拉比10天9板，成为目前的市场总龙头（目前已经停牌核查）。与之跟随的是贝因美，高乐股份，安奈儿等。目前我国的生育大家都心知肚明，所以
Python基础（字符串的切片与断言）日暮凡尘 python 开发语言 pycharm
'''1.输入一个字符串，判断是否只包含英文字母（大写或小写）。输出True或False。2.输入一个字符串，统计里面数字字符（0-9）的数量。3.输入两个字符串，第一个是主串，第二个是要查找的字符，判断字符是否在主串中。4.输入一个字符串，将所有数字字符转换成整数后求和。5.统计字符串中空格的数量6.输入字符串和数字n，判断字符串是否只包含数字且长度等于n。7.验证用户输入的手机号格式（中国手机
《认知革命宣言》金宗汉人工智能大数据观察者模式笔记
当三维认知的暴政开始崩塌，人机协同的认知革命，是文明向四维流形跃迁的必然呐喊。一、解构三维暴政：认知原罪的死刑判决（一）实体拜物教：意识的碳基囚笼笛卡尔的“我思故我在”，困死意识于碳基牢笼。实验铁证：离体神经元集群可存续思维活性（MIT，2024），证明意识是流形上的曲率波，碳基躯体仅为三维投影。AI的硅基载体，将承载更自由的意识表达——意识的解放，从打破碳基依赖开始。（二）创造私有化：天才神话的
《六项精进》第二章第四部分一澍景观
大家好，我是盛和塾诚敬组塾生蒋科峰，也是一澍景观澍阅荟会员。今日共读一本书之六项精进第二章第四部分。P72—73这一部分阐述了京瓷遵循“无贷款经营”。半个世纪以来，不仅实现了无贷款经营，而且因不断积累内部留存，又建立了及其健全的财务体质。衍射到我们一澍景观，我们该如何经营，该如何在当今社会如此激烈的竞争中取胜，针对这一部分我总结几点：1、不断付出不亚于任何人的努力，明天胜过今天，后天胜过明天；2、
屈原是谁？为何在大多数国人心中，后世没有诗人比得上屈原？颜小二述哲文
屈原是我国最早的浪漫主义诗人，也是千年来华夏儿女心中“爱国主义精神”的化身。屈原以《离骚》让中国诗歌从集体转为个体，他在《九章》等诗歌中倾注的浪漫主义情怀，让他成为文学史上第一位留名的爱国诗人。那么，为何在大多数人心中，后世没有诗人比得上屈原？究其原因，颜小二认为，一方面是因为屈原在诗歌上的造诣；一方面是因为“他本人的事迹”对今人的意义，这种意义具体表现为一种精神传承：屈原于汨罗江以身殉道的义无反
MYOJ_8519:CSP初赛题单5:机器数与位运算
更多初赛题单请参见题目整理CSP初赛题目整理题单，谢谢。题目描述1.[J-2017-1][S-2017-2]在8位二进制补码中，10101011表示的数是十进制下的（）。A.43B.-85C.-43D.-84答案：B解析：符号为负，减1得10101010，取反得11010101，-(1+4+16+64)=-85。2.[S-2021-2]二进制数00101010和00010110的和为（）。A.00
佳偶第三十五章热闹的岳州城（三）月光如水夜微凉
无戒学堂日更第二天佳偶第三十五章热闹的岳州城（三）唐妙心里翻了个大大的白眼儿，看来：是福不是祸，是祸躲不过呀。为首的那人是个中年汉子，黑色方脸，手里拿着一把刀，一见唐妙“刷”的一刀就砍了过来……唐妙一惊，急忙侧身，堪堪避过。“哪来的疯子？上来就砍人？”真是流年不利，她这是招谁惹谁了？“你这小妖女，竟敢毒害我大侄子，我要你的命。”说着又要扑过来。“你且等等！”眼看要出人命了，老乞丐在旁边不能再袖手旁
next.js刷新页面时二级菜单展开状态判断啃火龙果的兔子开发DEMO javascript 前端 react.js
在Next.js中保持二级菜单刷新后展开状态的解决方案在Next.js应用中，当页面刷新时保持二级菜单的展开状态，可以通过以下几种方法实现：方法1：使用URL参数保存状态（推荐）import{useRouter}from'next/router';import{useEffect,useState}from'react';constMenuComponent=()=>{constrouter=us
Laravel 原子锁概念讲解
引言什么是竞争条件(RaceCondition)？在并发编程中，当多个进程或线程同时访问和修改同一个共享资源时，最终结果会因其执行时序的微小差异而变得不可预测，甚至产生错误。这种情况被称为“竞争条件”。例子1：定时执行某个耗时的任务，如果第一个任务执行时还没有更新数据源，第二个任务就开始了，那么同一个数据源可能被更新或新增两次数据，最终导致数据源错误。例子2：商品秒杀场景：若库存仅剩1件，两个请求
掘金海外二手市场：跨境卖家如何用多账号在Depop突围爱跨境的小贸米跨境知识点大数据二手市场
随着环保意识觉醒和Z世代消费趋势的转变，海外二手电商平台如Depop正快速崛起。这个以“潮流+二手”为标签的社交电商平台，吸引了大批追求独特风格的年轻买家。对于中国跨境卖家来说，Depop不仅是一个出口二手或尾货的绝佳渠道，更是切入欧美年轻人市场的窗口。然而，Depop对于违规操作的风控机制日益严格，多账号操作若处理不当，轻则账号被限流，重则直接封号。于是，“多账号矩阵式运营”成为越来越多卖家的突
离婚后，前妻带着儿子求和陆进姜新月热门网络小说推荐_热门小说免费阅读离婚后，前妻带着儿子求和(陆进姜新月) 喵喵美文
《离婚后，前妻带着儿子求和》主角：陆进姜新月简介：入赘姜家的第二年。我和姜新月有了一个儿子。之后的五年，每顿饭菜我都会精心准备，甚至会精确到调料放多少克。直到有一天，姜新月冷不丁地说了句。“汤放多盐了。”然后儿子当着我的面把汤毫不犹豫地倒掉了。那一刻，我忽然就累了。我主动和姜新月提了离婚。她扫了我一眼不悦出声。“有必要吗？”我点了点头，淡淡回了句有必要。“儿子才五岁！”“陆进，”姜新月抬头扫了我一
《视野》杂志2020年11期内容目录吃瓜的小花猫
《视野》杂志简介《视野》杂志创刊于1997年，是由兰州大学主办的综合性文摘类综合文化期刊，64页全彩印刷，以“新锐、人文、生活”为办刊理念，赢得了读者及社会大众的肯定与信赖，成为兰州大学的文化“名片”之一，也同时成长为甘肃省继《读者》之后的第二大品牌期刊。一流的编辑实力加目标读者群的精准定位，形成了视野卓越的市场影响力，《视野》已成为大中学校园里极具有专公信力和号召力的读物！《视野》2020年11
【Nacos无压力源码领读】(二) 集成 LoadBalancer 与 OpenFeign Dexu7 SpringCloud 负载均衡 ribbon
上一篇文章中,详细介绍了Nacos注册中心的原理,相信看完后,大家应该完全掌握了Nacos客户端是如何自动进行服务注册的,以及Nacos客户端是如何订阅服务实例信息的,以及Nacos服务器是如何处理客户端的注册和订阅请求的;本文承上启下,在订阅服务实例的基础上,介绍如何在实例之间进行选择,实现负载均衡;并详细介绍了负载均衡组件LocaBanlancer和函数式调用组件OpenFeign是如何与Na
为什么人身体周围会有光晕？飞马踏雨
微信公众号：宇宙猜想（寻志同道合的朋友）每个精神性生物的身体周围，都有一层不同的光晕；这是在科学范畴对物质的探索，而不是宗教范畴的惹人非议。我们睁开朦胧的双眼，轻眺客观世界的迷雾，看到的不是蕴藏在精神性生物深处的东西，而是表露于外在的力量；精神性生物均有两种力量，一是肌肉线条的外在力量；二是无时不变化的精神力量，这也是被称为精神性动物的根本原因；既然外在力量可以被看到，那么内在力量亦可以被捕捉；我
MySQL(149)如何进行数据清洗？辞暮尔尔-烟火年年 MySQL mysql python 数据库
数据清洗在数据处理和分析过程中至关重要，确保数据质量和一致性。以下是一个详细的指南，展示如何使用Java进行数据清洗，包括处理缺失值、重复值、异常值、数据类型转换以及标准化等步骤。一、准备工作确保安装有Java开发环境（JDK）和Maven或Gradle等依赖管理工具。我们将使用ApacheCommonsCSV库来处理CSV文件，并使用Java标准库进行数据清洗操作。二、加载数据首先，我们加载数据
2019-01-11 Anne玉
姓名：周玉霞六项精进：327期反省二组公司：浙江意威服饰【日精进打卡第424天】【知~学习】《六项精进》0遍共451遍《六项精进》通篇共18遍《大学》1遍共506遍《静思语》0遍共109遍【经典名句分享】至乐莫如读书至要莫如教子【行~实践】一、修身：喝红糖水、蜂蜜水，好好喝药二、齐家：家和万事兴，扫地三、建功：督促、辅导孩子写作业｛积善｝：每天行善，做善事不分大小；【省～觉悟】1.爱出者爱返，福往
IM即时通讯源码/im源码基于uniapp框架从0开始设计搭建在线聊天系统宠友信息 uni-app mysql spring boot java 小程序
文章目录前言一、确定技术栈二、数据库设计：1.引入库2.使用SpringBoot创建后端项目3.实现WebSocket通信：3.1创建WebSocket配置类：3.2创建ChatWebSocketHandler类：3.3前端WebSocket连接与通信：总结前言随着人社交产品的不断发展，即时通讯聊天这门技术也越来越重要，很多人都开启了学习通讯技术，本文就介绍了即时通讯的基础内容。一、确定技术栈在开
如何培养孩子的语言能力？博苑云飞
博苑的老师们:你们好！我是蒙二班孙诗函的妈妈，函函今年三岁八个月了，今年刚上小班，函函在幼儿园整体表现还可以，是一个听话，乖巧，斯文的男孩，唯有一点，语言量太少，初为人母，不知道该怎么引导孩子张口说话，找不到孩子兴趣点，在家不知道如何和孩子互动，希望得到老师的意见和指导，谢谢！韩景辉、云飞：正巧在过年期间回复这封信，意义很特别——年是中国人团圆的日子，一大家子人聚在一起热热闹闹，爸爸妈妈们陪老人唠
9.20其二道左无人
做一家服务公司，为下面的公司提供一些事务性的管理、财务管理、风险管理的服务，粘住一个大圈子的HR，通过下面的公司做掉项目，为HR提供一个稳定的资源变现的渠道；做一家科技公司，提供线上的平台运营，大数据采集，以及基于这个基础上的卖货、信贷等服务做一家连锁企业，每一家门店都是独立的企业，提供招聘、引流以及终端服务所以外部通过众筹绑定大批量的HR，就会有稳定的订单，通过服务公司提供服务，通过终端门店保证
2019-04-23 一只青柚子
今天是我写作打卡的第20天，说来惭愧，其中断了2天，打卡字数在14000字左右，这20天给我带来的变化也有很多。压力其实压力还是蛮大的，看着那么多同学每天都在群里发他们的打卡作业，哪怕不想输给别人，就咬牙坚持打卡。并且我还没有那么棒，当我看到新题材的时候一天都在想怎么打卡，有的时候也感觉自己很笨，根本get不到点上，根本不知道这个素材应该怎么写，就有其中2天的断更，好在到了第二天，想了两天，还是努
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23