艾欧尼亚归我了

KafkaStreams介绍

Kafka Streams介绍(—)

说明
本文是Confluent Platform 3.0版本中对于Kafka Streams的翻译。
原文地址：https://docs.confluent.io/3.0.0/streams/index.html
看了很多其他人翻译的文档，还是第一次翻译，有什么翻译的不好的地方还请指出。

介绍

Kafka Streams – 举重若轻的强大

Kafka Streams。Apache Kafka开源项目的一个组成部分。是一个功能强大，易于使用的库。用于在Kafka上构建高可分布式、拓展性，容错的应用程序。它建立在流处理的一系列重要功能基础之上，比如正确区分事件事件和处理时间，处理迟到数据以及高效的应用程序状态管理。
下面的列表强调了Kafka Streams的几个关键功能，使得Kafka Streams成为构建流处理应用程序、持续查询、转换和微服务等场景的新选择。

功能强大
高拓展性，弹性，容错
有状态和无状态处理
基于事件时间的Window，Join，Aggergations

轻量级
无需专门的集群
没有外部以来
一个库，而不是框架

完全集成
100%的Kafka 0.10.0版本兼容
易于集成到现有的应用程序
程序部署无需手工处理(这个指的应该是Kafka多分区机制对Kafka Streams多实例的自动匹配)

实时性
毫秒级延迟
并非微批处理
窗口允许乱序数据
允许迟到数据

近看Kafka Streams

在我们深入Kafka Streams的概念和架构细节以及按部就班认识Kafka Streams之前，我们先来对上面提出的列表做更多的介绍。

更简单的流处理：Kafka Streams的设计目标为一个轻量级的库，就像Kafka的Producer和Consumer似得。可以轻松将Kafka Streams整合到自己的应用程序中。对应用程序的额外要求仅仅是打包和部署到应用程序所在集群罢了。

除了Apache Kafka之外没有任何其它外部依赖，并且可以在任何Java应用程序中使用。不需要为流处理需求额外部署一个其它集群。操作和维护团队肯定会很高兴这一点。

使用Kafka作为内部消息通讯存储介质，而不是像其它流处理框架似得，重新加入其它外部组件来做消息通讯。Kafka Streams使用Kafka的分区水平拓展来对数据做有序高效的处理。这样同时兼顾了高性能，高扩展性，并使操作简便。这种决策的好处是，你不必了解和调整两个不同的消息传输层（数据在不同伸缩介质中间移动和流处理的独立消息处理层），同样，Kafka的性能和高可靠性方面的改进，都会使得Kafka Streams直接受益。也可以同时借助Kafka社区强大的开发能力。

允许和其他资源管理和配置共聚焦集成。因此，Kafka Streams能够更加无缝的集成到现有的开发、打包、部署和业务实践当中去。你可以自由地使用自己喜欢的工具，比如java 应用服务器，Puppet， Ansible，Mesos，Yarn，Docket，甚至在一台手工运行你自己应用程序进行验证的机器上。

支持本地状态容错。这样就可以进行非常高效快速的包含状态的Join和Window 聚合操作。本地状态被保存在Kafka中，在机器故障的时候，其他机器可以自动恢复这些状态继续处理。

每次处理一条数据以实现低延时，这对于欺诈监测等场景是至关重要的。这也是Kafka Streams和其他基于微批处理的流处理框架的不同。

此外，Kafka Streams在设计上基于丰富的开发经验，具有很强的实用性。它提供了流处理所有的必要的原语，允许应用程序从Kafka中读取流数据，处理数据并且将结果写回Kafka或者发送到其他外部系统中取。提供了高层次的比如Filter，Map，Join等DSL操作以及低级别API供开发者选择使用。
最后，Kafka Streams为拓展开发者提供帮助，它入门门槛低，开发路径平滑，你可以快速编写和运行一个小规模的应用程序进行验证，因为你完全不需要安装或者了解其他分布式流处理平台。并且只需要将应用程序部署在多个实例上就可以在大批量的生产工作中实现负载均衡。Kafka Streams透明地使用Kafka并行操作模型处理同一应用程序的多个实例来实现负载均衡。
综上所述，Kafka Streams是构建流处理应用中的一个引人注目的选择，请给它一个试用的机会，并运行你的第一个Hello World流处理程序。文档的下一章将带你开始由浅入深编写Kafka Streams应用程序。

需求

Kafka 0.10及更新版本
[可选]额外的avro schema支持: Confluent Schema Registry 3.0.0

#####################################################################################################

说明：

本文是Confluent Platform 3.0版本中对于Kafka Streams的翻译。

原文地址：https://docs.confluent.io/3.0.0/streams/index.html

看了很多其他人翻译的文档，还是第一次翻译，有什么翻译的不好的地方还请指出。

这是Kafka Streams介绍的第二篇，以前的介绍如下：

http://blog.csdn.net/ransom0512/article/details/51971112

1. 快速入门

1.1. 目标

本快速入门指南的目标是提供与KafkaStreams的第一个应用程序示例。我们将演示在你的第一个示例程序中，如果使用Kafka Streams库和演示一个简单的端到端的数据流。

值得注意的是，这种快速入门只涵盖了KafkaStreams的表面，这篇文档的剩余部分将会提供更多的细节，我们将在快速入门指南中为你指明方向。

1.2. 我们想做什么

在这个快速入门中，我们将运行包含Apachekafka的一个wordcount演示应用程序。下面代码的关键在于使用Java8的lambda表达式，易于阅读。(摘自WordCountLambdaExample):

//序列化/反序列化Sting和Long类型
final Serde stringSerde = Serdes.String();
final Serde longSerde = Serdes.Long();
//通过指定输入topic “streams-file-input”来构造KStream实例，
//输入数据就以文本的形式保存在topic “streams-file-input” 中。
//(在本示例中，我们忽略所有消息的key.)
KStream textLines = builder.stream(stringSerde, stringSerde, "streams-file-input");
KStream wordCounts = textLines
//以空格为分隔符，将每行文本数据拆分成多个单词。
//这些文本行就是从输入topic中读到的每行消息的Value。
//我们使用flatMapValues方法来处理每个消息Value，而不是更通用的flatMap
.flatMapValues(value -> Arrays.asList(value.toLowerCase().split("\\W+")))
//我们随后将调用countByKey来计算每个单词出现的次数
//所以我们将每个单词作为map的key。
.map((key, value) -> new KeyValue<>(value, value))
//通过key来统计每个单词的次数
//
//这会将流类型从KStream转为KTable (word-count).
//因此我们必须提供String和long的序列化反序列化方法。
//
.countByKey(stringSerde, "Counts")
//转化KTable到KStream
.toStream();
//将KStream写入到输出topic中。
wordCounts.to(stringSerde, longSerde, "streams-wordcount-output");

在上面的代码执行过程中，我们将执行如下步骤：

1、启动一台kafka集群

2、使用Kafkaconsole producer命令行生产者客户端往Kafka Topic中写入示例输入数据

3、在Java应用程序中使用kafkaStream库来处理输入数据。这里，我们使用了一个包含kafka的WordCount示例程序。

4、使用Kafkaconsole consumer命令行消费者客户端检查应用程序的输出。

5、停止Kafka集群

1.3. 启动Kafka 集群

在本章节中，我们会在一台机器上安装并启动Kafka集群。该集群有一个单节点Kafka(只有一个Broker)外加一个单节点Zookeeper构成。在wordcount演示程序中，这种集群依赖是必须的。我们假定kafka broker运行地址为localhost:9092, Zookeeper本地地址为localhost:2181。

首先，安装oracle JRE或JDK 1.7及以上版本

然后，下载和安装包含Kafka Streams的新版本Apache Kafka. 为此，我们使用Confluent Platform 3.0.0版本。

(下面操作比较简单，所以不翻译了。)

# Download and install Confluent Platform 3.0.0 from ZIP archive
$ wget http://packages.confluent.io/archive/3.0/confluent-3.0.0-2.11.zip
$ unzip confluent-3.0.0-2.11.zip
# *** IMPORTANT STEP ****
# The subsequent paths and commands used throughout this quickstart assume that
# your are in the following working directory:
$ cd confluent-3.0.0/
# Note: If you want to uninstall the Confluent Platform at the end of this quickstart,
# run the following commands.
#
# $ rm -rf confluent-3.0.0/
# $ rm -rf /var/lib/kafka # Data files of Kafka
# $ rm -rf /var/lib/kafka-streams # Data files of Kafka Streams
# $ rm -rf /var/lib/zookeeper # Data files of ZooKeeper

提示：可以通过Installationvia ZIP and TAR archives 和ConfluentPlatform Quickstart 获取更进一步信息。

我们首先启动ZooKeeper实例。该实例将监听本地2181端口。由于这是一个长期运行的服务，你应该在自己的终端中运行。

# Start ZooKeeper. Run this command in its own terminal.
$ ./bin/zookeeper-server-start ./etc/kafka/zookeeper.properties

接下来，我们启动Kakfa的Broker，这将监听本地9092端口，然后连接到我们刚刚启动的Zookeeper实例。这也是一个长期运行的服务，也应该在终端中运行它。

# Start Kafka. Run this command in its own terminal
$ ./bin/kafka-server-start ./etc/kafka/server.properties

现在，我们的单节点kafka集群已经完全运转起来了，我们就可以着手准备输入数据，运行我们的第一个kafka Streams示例程序。

1.4. 准备输入数据

提示：在本章节中，我们将使用内置的命令行工具来输入kakfa数据。在实际使用中，你应该通过其他方式将数据写入Kafka中，比如通过你自己应用程序中的Kafka客户端。

现在，我们将一些输入数据发送到Kafka的topic中，然后由Kafka Streams的应用程序做后续处理。

首先，我们要创建名称为streams-file-input的topic：

$ ./bin/kafka-topics --create \
--zookeeper localhost:2181 \
--replication-factor 1\
--partitions 1\
--topic streams-file-input

下一步，我们生成一些输入数据病保存在本地文件/tmp/file-input.txt中。

$ echo -e "all streams lead to kafka\nhello kafka streams\njoin kafka summit" > /tmp/file-input.txt

生成的文件将包含如下内容：

all streams lead to kafka
hello kafka streams
join kafka summit

最后，我们发送这些数据到input topic

$ cat /tmp/file-input.txt | ./bin/kafka-console-producer --broker-list localhost:9092 --topic streams-file-input

Kafka consoleproducer从stdin中读取数据，并将每一行作为单独的消息发送到kafka的输入流中。该消息的key是null，消息是每行内容，使用字符串编码。

注意: 你可能想知道这样一步步的快速启动和真实流处理系统的差异，在大型的实时的流处理系统中，数据总是在移动的，快速入门的目的仅仅是做功能证明。简单来说，一个端到端的数据管道建立在Kafka和Kafka Streams的各个方面。出于说教的原因，我们故意将快速入门清楚地拆分成一系列分开连续的步骤。

但在实践中，这些步骤通常会看起来有些不同并且会有并发的存在。比如输入数据可能不会来源于本地文件，而是直接从分布式系统中发送的，并且数据将被连续的写入Kafka。类似的，流处理应用程序可能在第一行数据发送之前就已经启动并运行。

1.5. 在KafkaStreams中处理输入数据

现在，我们已经生成了一些输入数据，我们可以运行我们的第一个基于Kafka Streams的java应用程序。

我们将运行WordCount演示应用程序，它使用了ApacheKafka。它实现了WordCount算法，从输入文本来计算直方图。然而和其他你之前见过的操作被绑定在数据上的WordCount实例程序不同的是，这个示例程序是数据无界，无限流动的。和有界算法的变体类似，他是一个有状态的算法，跟踪并更新word的计数器。然后因为它必须接受无界的输入数据，它会周期性低输出其当前状态和计算结果，同时继续处理更多的数据，因为它不知道是否已经处理了所有的数据。这就是他和Hadoop 的Mapreduce算法之间的典型差异。一旦我们了解这种差异，检查了实际的输出数据之后，会更容易接受它。

由于wordCount示例程序与kafka打包在一起，已经在Kafka的Broker中集成，这就意味着我们不需要做额外的事情就可以运行它，无需编译任何Java源代码。

# Run the WordCount demo application. There won't be any STDOUT output.
# You can safely ignore any WARN log messages.
$ ./bin/kafka-run-class org.apache.kafka.streams.examples.wordcount.WordCountDemo

注意，这里没有魔术式的部署，实际上，使用kafkaStreams库中的任何应用程序，就像启动任何普通的Java应用程序，该脚本kafka-run-class也只是一个简单的java -cp命令的包装。

该WordCount示例程序将从输入topic中读取数据，然后计算wordCount，将计算结果不断进行输出。演示将运行几秒钟，然后和其他典型流处理应用程序不同的是，它将会自动终止。

1.6. 检查输出结果

在本章节中，我们将使用内置的命令行工具从kafka中手工读取数据。在实际使用中，你可以通过其他方式，通过Kakfa客户端从Kafka中读取数据。比如，如果你可以在自己的应用程序中使用Kafka客户端将数据从Kakfa中迁移到其它数据系统。

现在，我们可以从kafka输出topic中读取数据并检查wordcount实例运行结果。

./bin/kafka-console-consumer --zookeeper localhost:2181 \
--topic streams-wordcount-output \
--from-beginning \
--formatter kafka.tools.DefaultMessageFormatter \
--property print.key=true\
--property key.deserializer=org.apache.kafka.common.serialization.StringDeserializer \
--property value.deserializer=org.apache.kafka.common.serialization.LongDeserializer

Wordcount的数据将会被打印在如下的控制台中：

all 1
streams 1
lead 1
to 1
kafka 1
hello 1
kafka 2
streams 2
join 1
kafka 3
summit 1

这里，第一列是Kafka消息的key的字符串格式，第二列是消息的值，long类型。你可以通过Ctrl+c命令来终止控制台输出。

但是等一下，输出看起来是不是很奇怪？为什么会出现重复的条目？比如streams出现了两次：

# Why not this, you may ask?
all 1
lead 1
to 1
hello 1
streams 2
join 1
kafka 3
summit 1

对于上面的输出的解释是，wordCount应用程序的输出实际上是持续更新的流，其中每行记录是一个单一的word(即Message Key，比如Kafka)的计数。对于同一个Key的多个记录，么个记录之后是前一个的更新。

下面的两个图说明了在输出之后发生了什么。第一列显示KTable即countByKey的计数当前状态的演化。第二列表示从状态更新到KTable的结果和最终结果，一旦产生从KTable#通Stream()转到KStream的记录，相应结果就会被输出到Kafka。

首先，文本行”所有到kafka的流”正在处理中，每个新Table项中的新单词结果正在被构建成KTable对象(绿色高亮显示部分)，并且相应的变化结果会被发送到下游KStream。

当第二个文本航的hello kafkastreams被处理的时候，我们观察到，相对第一次，已经存在的条目KTable被更新了(Kafak和Streams这两个单词). 修改后的记录被在此发送到了KStream。

这就解释了上述KStream第二列中显示的信息，为什么输出的topic上显示的内容，因为它是包含了变化的完整内容

all 1
streams 1
lead 1
to 1
kafka 1
hello 1
kafka 2
streams 2
join 1
kafka 3
summit 1

下面的展望超出了这个例子的范围。Kafka Strems使用了KTable和changlog的KStream，利用changlog Stream和KTable之间的二元性，你可以发布KStream表中从开始到结束的完整changelog，这样就可以重建KTable的内容。

1.7. 停止Kafka集群

一旦完成了快速入门，你可以按照以下顺序关闭Kafka集群。

1、在它运行的终端中，使用Ctrl+c来停止KafkaBroker，或者杀死该进程。

2、在其他终端，使用Ctrl+C停止Zookeeper实例或者杀死该进程

恭喜你，你已经运行了Kafka Streams的第一个应用程序并且将数据保存在了一个单节点的kafka集群中。Yeah！

1.8. 接下来该何去何从

至于下一步，我们会建议你：

1、阅读KafkaStreams架构，了解其主要概念和设计原则。

2、深入阅读KafkaStreams开发指南，这里包含了kafka Streams的DSL等各种文档。这些将会帮助你编写Kafka Streams的第一个应用程序。

处理Kafka Streams，你可能对下面这些也感兴趣：

1、 kafka Connect工具，在kakfa和其他数据系统必须Hadoop中迁移数据。

2、从Kafka Client中读取和写入数据到你自己的应用程序当中。

################################################################################################

在本机中，我们会总结Kafka Streams的关键概念，如果要了解更多详细信息，请参考架构和开发指南。

1. Kafka 101

在设计上，经过深思熟虑的设计，KafkaStreams和Apache Kafka紧密集成，它使用kafka

作为其内部消息层。因此，熟悉Kafka的关键概念也很重要，特别是第一章入门和第四章架构设计。你特别应该明白：

l 角色：Kafka区分生产者(Producer)，消费者(Consumer)和Brokers。Producer发布数据到Kafka Brokers，Consumer从Kafka Brokers中读取发布的数据。Producers和Consumers是完全分离的。一个Kafka集群由一个或者多个Broker组成。

l 数据：数据被存储在Kafka的Topics中。Topic是Kafka提供的最重要的抽象，它是Producer发布的同一类数据的抽象统称。在Kakfa中，每个Topic可以分为一个或者多个分区，这些分区分布在各个Brokers上面用于容错。

l 并发度：Kafka的分区数或者是给定的topic的数量是确定Kafka数据读取和写入的并发度的主要因素。由于Kafka Streams和kafka紧密集成，所以kafka Streams的并发度会在很大程度上收到Kafka并发度的影响。

2. Stream(流)

Stream是KafkaStreams提供的最重要的抽象。它代表的是无限的，不断更新的数据集，其中无限意味着大小不明确或者无大小限制。一个Stream是一个有序的，允许重放的不可变的数据记录。其中数据记录被定义为一个容错的键值对。

3. Stream Processing Application(流处理应用程序)

一个流处理应用程序可以是任何集成了Kafka Streams库的程序。在实际使用中，它很有可能就是你的Java应用程序。他可以通过由一个或者多个Processor组成的拓扑结构来定义其计算逻辑。

4. Processor Topology(处理拓扑)

处理拓扑定义了由流处理应用程序进行数据处理的计算逻辑。拓扑是由流(边)连接的流处理器的图。开发者可以通过Low-level API或者通过Kafka Streams的DSL来构建拓扑。

第四章的架构设计文档对于拓扑有更详细的描述。

5. 流处理器

流处理器用来处理拓扑中的各个节点。它代表拓扑中的每个处理步骤，用来完成数据转换功能。Kafka Streams为流处理器提供了标准操作例如Map，Filte和聚合等一系列开箱即用的功能。一个流处理器同一时间从上游接收一条输入数据，然后处理这条数据，产生一个或者多个输出记录到下个流处理器。

KafkaStreams提供了两种方法来定义流处理器：

KafkaStreams DSL API. 最常用的转换操作比如map和Filter，这样你就不必从头开始实现这些流处理器。

Low-levelAPI：这些低级API允许开发人员定义和连接定制处理器和状态存储器进行交换。

6. 时间

流处理的一个很关键的方面就是时间，以及它是如何进行建模和整合的。比如，一些像Windows这样的窗口操作就是基于时间的界限所定义的。

流处理上时间相关的概念主要如下：

事件时间：事件或者记录产生的时间。即事件在源头最初创建的时间。事件时间在语义上通常要在产生的时候嵌入一个时间戳字段。

例如：如果事件产生于汽车GPS传感器报道的位置变化，那么相关的事件时间就是GPS传感器捕捉位置变化的时间。（也就是说，这个时间通常是在流处理系统以外产生的。）

处理时间：流处理应用程序开始处理事件的时间点。（即事件进入流处理系统的时间。）这个处理时间到事件时间的间隔可能是毫秒，秒，小时，天或者更久远的时间。

例如：假设有一个应用程序用来读取和处理来自汽车GPS传感器报告的地理位置数据，并将其呈现给车队管理仪表盘。在这里，应用程序中的处理事件可能是毫秒或者秒(例如基于Apache的Kafka 和Kafka Stream流实时管道)或者小时（例如基于 Apache Hadoop或者Apache Spark的管道）。

摄取时间：数据记录由KafkaBroker保存到 kafka topic对应分区的时间点。摄取时间类似事件时间，都是一个嵌入在数据记录中的时间戳字段。不同的是，摄取时间是由Kafka Broker附加在目标Topic上的，而不是附加在事件源上的。如果事件处理速度足够快，事件产生时间和写入Kafka的时间差就会非常小，这主要取决于具体的使用情况。因此，无法在摄取时间和事件时间之间进行二选一，两个语义是完全不同的。同时，数据还有可能没有摄取时间，比如旧版本的Kafka或者生产者不能直接生成时间戳（比如无法访问本地时钟。）。

事件时间和摄取时间的选择是通过在Kafka（不是KafkaStreams）上进行配置实现的。从Kafka 0.10.X起，时间戳会被自动嵌入到Kafka的Message中，可以根据配置选择事件时间或者摄取时间。配置可以在broker或者topic中指定。Kafka Streams默认提供的时间抽取器会将这些嵌入的时间戳恢复原样。因此，应用程序的有效时间语义上依赖于这种嵌入时时间戳读取的配置。请参考：Developer Guide来获取更进一步信息。

Kafka Streams通过时间抽取器为每个记录分配时间戳。Sreams中每个记录的时间戳(可能是乱序)可以进行时间相关的操作，比如Join，也可以用于相同应用中的多个输入数据流同步。

时间提取器的具体实现方式主要是检索或者计算两种方式。可以根据数据记录的实际内容获取时间戳，也可以使用其他方式，比如本地时间戳。开发人员可以根据自己的业务需求选择不同的实现方式。

注意：Kafka Streams中的摄取时间和其他流处理系统略有不同，其他流处理系统中的摄取时间指的是从数据源中获取到数据的时间，而kafka Streams中，摄取时间是指记录被追加到Kakfa topic中的时间。

提示：使用时间是，你也应该保证时区和日历的其他方面是正确同步的，或者至少是了解之间的差异。例如，统一使用UTC或者Unix时间，指定时间信息格式一致，如统一精确到秒，你也不要混用不同语义的时间。

7. 有状态的流处理

一些流处理应用不需要状态，这意味着每个消息的处理都是彼此独立的。如果你只需要进行消息转换，或者基于某些条件进行筛选，那么你的流处理应用程序的拓扑会非常简单。

然而，能够保存状态，就是的流处理系统可以应用在更多场景。你可以进行Join，Group by或者aggregate操作，Kafka Streams DSL供了很多这样的包含状态的DSL。

8. 流和表的双重性

在我们讨论Kafka Stream的aggregate等操作之前，我们必须先介绍表，以及最重要的表和流之间的关系，即流和表的双重性。本质上，这种双重性意味着一个流可以作为表，反之亦然。Kafka的Log compact功能，就是利用了这种双重性。

表的简单形式是一个KV对的集合，也可以称为Map或者关联数组。

说明：为了使得这一章节简答，我们会跳过复合键，MultiSet等的讨论。

有如下一张表：

下面这张Stream-Table描述了流和表之间双重性的密切关系。

Stream as table：流可以被认为是一张表，其中，流上的每条数据记录代表了表的状态变化的更新日志。一个流就是一张变相的表，它可以通过重建日志的方式很容易就变成一个真正的表。同样，一个更具普适性的例子– 例如从网页事件流中统计用户网页浏览的总数– 返回一张表(这里用Key和Value分别表示用户和其浏览量的总数。)

Table as Stream：一个表可以被认为是流上一个时间点的快照。表上的每行记录，都代表该键的最新值。因此，一个表示一种变相的流，它可以通过遍历表中的每个KV对很容易变成一个真正的流。

让我们通过如下的例子进行说明：假设有一张跟踪用户浏览网页总数的统计表，随着时间的推移，当处理新的网页浏览记录的时候，表中的状态会被相应的更新，这里，不同时间点会有不同的变化，这种变化可以表示为一个changlog的流。

有意思的是，由于流和表的双重性，使用相同的流可以重构原始表(第三列)。

相同的机制还被用于如下场景，例如，数据库之间通过数据捕获机制(CDC change data capture)进行复制，Kafka Streams通过在多个节点内复制存储的状态来保证其容错性。流和表的双重性的概念在Kafka　Streams中极其重要，接下来的章节，我们将重点说明这些。

9. KStream(事件流)

说明：只有Kafka Streams的DSL才有KStream的概念。

一个KStream是一个事件流，其中每条事件记录代表了无限的包含数据的数据集的抽象。用表来解释流的概念，数据的记录始终被解释为Insert，只有追加，因为没有办法替换当前已经存在的相同key的行数据。比如戏弄卡交易，一个页面视图或者服务器日志。

为了说明这一点，我们可以想象有如下两个记录被发送到流。

("alice", 1) -->("alice", 3)

如果你的流处理一弄程序是要汇总每个用户的键值，他就会返回4，因为第二个记录不会被视为当前记录的更新。如果是要比较使用最新的Key值，那么alice就会返回3.

10. KTable(changelog流)

说明：只有Kafka Streams的DSL才有KTable的概念。

一个KTable是一个changlog更新日志流。其中每个数据记录代表一个更新的抽象。准确来说，一个数据记录的值被认为是相同Key的最后一个值的更新结果。对于该表在流上的解释，可以被认为是一个更新，因为任何相同Key值的记录都会被更新。

为了说明这一点，我们可以假设有以下两个数据记录被发送到流。

("alice", 1) -->("alice", 3)

如果你的流处理应用程序要总结每个用户的总值，它会为alice返回3，因为第二个记录会被视为记录的更新。而KStream会将这种行为返回4.

说明：Kafka日志压缩的影响，考虑KStream和KTable的另一种形式，如果一个KTable存储到Kafka的topic中，你就需要启用Kafka的日志压缩功能以节省空间。

然而，这种方式在KStream的情况下是不安全的，因为，一旦开启日志压缩，Kafka就会删除比较旧的Key值，这样就会破坏数据的语义。以数据重放为例，你会突然得到一个值为3的alice，而不是4，因为以前的记录都被日志压缩功能删除了。因此，日志压缩在KTable中使用是安全的，但是在KStream中使用是错误的。

我们已经看到了流和表的双重性在changlog中的例子，另外一个例子是关系型数据库中的捕获数据更新日志(CDC changelog data capture)记录，表示该行在数据库中的插入，更新或者删除。

KTable还提供了通过key查找数据值得功能，该查找功能可以用在Join等功能上。

11. 窗口

一个流处理器可能需要将数据划分为多个时间段，这就是流上窗口。这通常在Join或者aggregation聚合等保存本地状态的处理程序中使用。

Kafka StreamsDSL API提供了可用的窗口操作，用户可以指定数据在窗口中的保存期限。这就允许Kafka Streams在窗口中保留一段时间的旧数据以等待其它晚到的数据。如果保留期过了之后数据才到达，这条消息就不能被处理，会被丢掉。

实时的流处理系统中，数据乱序总是存在的，这主要取决于数据在有效时间内如何进行处理。对于在正处于处理期的时间内的数据，如果数据乱序，延迟到达，在语义上就可以被正常处理，如果数据到达时候，已经不在处理期，那么这种数据就不适合处理期的语义，只能被丢弃掉。

12. Join

Join操作负责在Key上对两个流的记录进行合并，并产生新流。一个基于流上的Join通常是基于窗口的，否则所有数据就都会被保存，记录就会无限增长。

KafkaStreams DSL支持不同的Join操作，比如KStram和KStream之间的Join，以及KStream和KTable之间的Join。

13. Aggregations

聚合操作需要一个输入流，并且以多个输入记录为单位组合成单个记录并产生新流。常见的聚合操作有count和sum。流上的聚合也必须基于窗口进行，否则数据和join一样都会无限制增长。

在Kafka Streams的DSL中，一个聚合输入流可以是KStream形式或者KTable形式，但是输出流永远都是KTable。这就使得Kafka Streams的输出结果会被不断更新，这样，当有数据乱序到达之后，数据也可以被及时更新，因为最终输出是KTable，新key会覆盖旧值。

###############################

转自：https://blog.csdn.net/ransom0512/article/details/52038548

你可能感兴趣的:(ELK)

redis 清理缓存 m0_74823408 面试学习路线阿里巴巴缓存 redis 数据库
----windos方法1，重启redis也能请缓存。方法2，清缓存前确保redis-server.exe进程已经启动，然后打开redis-cli.exe，跳出的CMD里面输入flushall，显示OK就可以了。flushall：清空整个redis服务器的数据(删除所有数据库的所有key)。flushdb：清空当前数据库中的所有key。方法3，清空指定Key，例如：delkey1delkey2方法
Elastic Stack 8.16.0 日志收集平台的搭建 JingAi_jia917 Elastisearch Logstash Filebeat Kibana Elastic stack ELK日志平台
简介1.1ELK介绍ELK是‌Elasticsearch‌、‌Logstash‌、‌Kibana‌三款开源工具的首字母缩写，构成了一套完整的日志管理解决方案，主要用于日志的采集、存储、分析与可视化‌。1）Logstash：数据管道工具，负责从多种来源（如文件、数据库、消息队列）采集日志，进行过滤、格式化后输出到目标（如Elasticsearch）‌；2）Elasticsearch：分布式实时搜索与
《架构300讲》学习笔记（201-250） newProxyInstance 笔记架构
前言内容来自B站IT老齐架构300讲内容。201小心selectforupdate，有效规避索引选择性锁表202设计模式之建造者模式的用途20320分钟上手ELK日志监控系统分类：【ELK】204设计模式之门面模式Facade205设计模式之适配器模式Adapter206经典设计！如何让RabbitMQ支持消息延迟投递207Docker容器基于NFS实现跨容器文件共享208数据向上追溯场景该如何优
ELK traceId 通过A服务调用B服务举例 C18298182575 elk hive hadoop
在分布式系统中，traceId需要在服务之间传递，以确保整个请求链路的日志能够被追踪。下面我们通过一个具体的例子，展示如何通过A服务调用B服务时传递traceId，并确保日志中能够正确记录traceId。实现思路A服务生成traceId：在A服务的HandlerInterceptor中生成traceId，并将其放入MDC。A服务调用B服务时传递traceId：在A服务调用B服务时，将traceId
springboot 整合 elk （Elasticsearch+Logstash+Kibana）高大王竟然被注册 spring 运维
Elasticsearch是个开源分布式搜索引擎，它的特点有：分布式，零配置，自动发现，索引自动分片，索引副本机制，restful风格接口，多数据源，自动搜索负载等。Logstash是一个完全开源的工具，他可以对你的日志进行收集、过滤，并将其存储供以后使用（如，搜索）。Kibana也是一个开源和免费的工具，它Kibana可以为Logstash和ElasticSearch提供的日志分析友好的Web界
elk的相关的基础 weixin_43806846 elk
以下是关于ELK（Elasticsearch,Logstash,Kibana）的200个基础问题及其答案，涵盖了ELK的核心概念、组件、配置、使用场景、优化等方面。Elasticsearch基础**什么是Elasticsearch？**答：Elasticsearch是一个分布式、RESTful的搜索和分析引擎，基于ApacheLucene构建。**Elasticsearch的主要用途是什么？**答
ELK Stack 安装教程 - 构建日志存储告警系统运维
介绍“ELK”是三个开源项目的首字母缩写，这三个项目分别是：Elasticsearch、Logstash和Kibana。Elasticsearch是一个搜索和分析引擎。Logstash是服务器端数据处理管道，能够同时从多个来源采集数据，转换数据，然后将数据发送到诸如Elasticsearch等“存储库”中。Kibana则可以让用户在Elasticsearch中使用图形和图表对数据进行可视化。目前最
使用docker安装elk 吴传逞 docker elk 运维
配置要求：一台Linux服务器，内存不少于2g，centos7以上系统1.安装docker安装教程：CentOSDocker安装|菜鸟教程分以下几个步骤（我只写我使用过的方式）：curl-fsSLhttps://get.docker.com|bash-sdocker--mirrorAliyun安装DockerEngine-Communityyuminstall-yyum-utils\device-
ELK安装配置 hu_wenjie OpsDev OpsDev运维开发
ELK平台介绍日志主要包括系统日志、应用程序日志和安全日志。系统运维和开发人员可以通过日志了解服务器软硬件信息、检查配置过程中的错误及错误发生的原因。经常分析日志可以了解服务器的负荷，性能安全性，从而及时采取措施纠正错误。
docker 安装ELK 8.17.3 离开水的飞鱼 docker elk 容器
ELK是指Elasticsearch、Logstash和Kibana这三个开源软件的组合。Elasticsearch是一个分布式的搜索和分析引擎，用于日志的存储,搜索,分析,查询。Logstash是一个数据收集、转换和传输工具，用于收集过滤和转换数据，然后将其发送到Elasticsearch或其他目标存储中。Kibana是一个数据可视化平台，通过与Elasticsearch的集成，提供了强大的数据
Linux 服務器上安裝和配置 ELK 堆棧（Elasticsearch、Logstash 和 Kibana）蠟筆小新工程師 jenkins 运维
1.安裝Elasticsearch更新您的系統軟件包並安裝必要的工具：bashsudoapt-getupdatesudoapt-getinstallapt-transport-httpsca-certificateswgetcurlgnupg將Elasticsearch的GPG密鑰添加到系統：bashwget-qO-https://artifacts.elastic.co/GPG-KEY-elas
ELK（elasticsearch-7.17.4-windows-x86_64+logstash-7.17.4-windows-x86_64+kibana-7.17.4-windows-x86_64） LongtengGensSupreme elk elasticsearch 大数据
1、下载ELK（elasticsearch-7.17.4-windows-x86_64+logstash-7.17.4-windows-x86_64+kibana-7.17.4-windows-x86_64）2、解压elasticsearch-7.17.4-windows-x86_64，config目录下修改elasticsearch.yml文件，修改elasticsearch.yml内容如下：#
Doris 数据集成 Kafka 不二人生 Doris 实战 doris 数据仓库
Doris数据集成Kafka这是我们Doris数据集成篇的第二篇，前面我们介绍过通过Catalog进行集成的例子Doris基础篇—数据集成Catalog目前公司的很多数据服务都开始使用Doris了，目前使用下来感觉还是很方便的，比起Hadoop那一套少了很多运维的成本，而且整体的效率也不错，现在也要把ELK那一套日志分析的替换掉，后面日志分析也走Doris。关于如何使用Doris做日志分析，可以参
ELK —— Logstash 将 MySQL 数据同步至 ElasticSearch 2301_82242204 程序员 elk mysql elasticsearch
一、搭建环境1.0环境依赖1.1搭建ElasticSearch环境1.1.1ElasticSearch简介1.1.2启动ElasticSearch1.2Logstash（多数据源采集系统）1.3Kibana（可视化面板）二、Logstash配置2.1配置数据库连接2.2配置同步ES2.3重新启动三、下一步更新计划Author：GoritDate：2021/4/7Refer：各种同类文章参考融合+自
Redis学习笔记 ——（3）哈希结构的用法、内部编码、使用场景码农小高 Redis redis 哈希算法学习
Redis学习笔记——（3）哈希结构的用法、内部编码、使用场景几乎所有的编程语言都提供了哈希（hash）类型，他们的叫法可能是哈希、字典、关联数组等。在Redis中，哈希类型是指键值本身又是一个键值对结构，例如value={{filed,value},…{filedn,valuen}}.1.哈希的用法HDELkeyfield1[field2]删除一个或多个哈希表字段HEXISTSkeyfield查
部署Wordpress(LNMP)+ELK 多练项目 Linux 系统架构 linux elk 运维
LNMP+EFK主机软件服务版本主机名192.168.100.100Nginx-1.18、Filebeatnode100192.168.100.101PHP-5.6.27node101192.168.100.102MySQL5.7node102192.168.100.103Kafkakafka103192.168.100.104Kafkanode104192.168.100.105Kafkanod
ELK接入SpringBoot【Docker Compose】 bilibilidicks elk spring boot docker
安装Docker-Composecurl-Lhttps://github.com/docker/compose/releases/download/1.17.1/docker-compose-`uname-s`-`uname-m`-o/usr/local/bin/docker-compose随便找个地，创建docker-compose.yml文件，把这坨文本复制进去version:'3'servi
elk+redis+logstash+kibana保姆式教程 weixin_51711897 elk redis jenkins
主机名ip描述elasticsearch-1192.168.5.94es集群elasticsearch-2192.168.5.95es集群elasticsearch-1192.168.5.96es集群redis192.168.5.97redis存储收集日志logstash192.168.5.98将redis数据传到es中kibana192.168.5.99将日志数据显示出来报错Couldnotin
windows10 ELK保姆级教程以及踩坑记录适用于新版8.1.3 bug柯南 ELK java
elk其实就是ElasticSearch（ES）、Logstash和Kibana三个开源的工具组成。1.ES是个开源的分布式搜索引擎，它的特点是：分布式、零配置、自动发现，索引自动分片，索引副本机制，restful风格接口，多数据源，自动搜索负载等。2.Logstash是一个完全开源的工具，开源对日志进行收集、分析、并将其储存以后使用。3.Kibana也是一个完全开源的免费的工具，它为Logsta
如何收集k8s pod的服务日志（rancher）一方有点方 kubernetes rancher 容器
一、环境情况说明当前环境是k8s+rancher+filebeat+es+kibana本文只讲解部署filebeat收集容器日志的过程、使用daemonset的方式部署filebeat，es+kibana+k8s已提前创建好的二、部署安装1、在已创建完成的k8s环境中，用kubectl先创建一个命名空间elk-log，新增一个filebeat目录,上传一下4个代码文件filebeat.daemon
高并发微服务日志管理：ELK、Loki、Fluentd 终极对决与实战指南网罗开发 java集后端云原生微服务 elk 架构
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
ELK性能优化实战总结：kafka与rabbitmq m0_56824583 程序员面试经验分享 java
4年经验应该具备哪些技能首先，简单的聊一下我认为的4年经验左右、优秀的Java程序员应该具备的技能有哪些，按“专业技能”和“项目”两块，包括但不限于以下内容。专业技能方面基础：JDK常用类的原理、源码、使用场景。设计模式：常用几种的原理、使用场景，单例、动态代理、模板、责任链等。数据结构：数组、链表、栈、队列、树。网络：TCP、HTTP、HTTPS、负载均衡算法。框架：SpringIoC原理、Sp
deepseek部署：ELK + Filebeat + Zookeeper + Kafka AustinCien deepseek elk zookeeper kafka
##1.概述本文档旨在指导如何在7台机器上部署ELK（Elasticsearch,Logstash,Kibana）堆栈、Filebeat、Zookeeper和Kafka。该部署方案适用于日志收集、处理和可视化场景。##2.环境准备###2.1机器分配|机器编号|主机名|IP地址|部署组件|----------|--------------|--------------|--------------
ElasticSearch 数据老化清理之Curator 思快奇 java elasticsearch linux 大数据分布式
前言随着接入ELK日志分析平台的系统增加，每日海量的日志数据使得磁盘空间越发紧张，从而ES的日志清理也成了一个常规操作。而ES官方也提供了一个很好用的工具——curator来实现这个事情。抽空也部署了一个，以供阅知。Curator简介据官方介绍，curator最早被称为clearESindices.py的python脚本，它的唯一功能就是删除索引清理数据，而后重命名为logstash_index_
nginx 反向代理 ElasticSearch es 布丁萨玛 nginx elasticsearch 运维
本文讲述如何使用nginx代理kibana1、更改kibana.yml文件添加前缀2、nginx添加配置location/kibana/{proxy_passhttp://127.0.0.1:5601/;rewrite^/elk/(.*)$/$1break;proxy_set_headerX-Real-IP$remote_addr;proxy_set_headerHost$host:$server
精选 ES（elasticsearch）添加、修改、查询、删除详细使用语法代码讲故事架构师成长之路 ELK 中间件 elasticsearch ES 使用查询语法
精选ES（elasticsearch）添加、修改、查询、删除详细使用语法。elasticsearch是一个分布式、RESTful风格的数据搜索和分析引擎。es使用简单，支持集群，适用于海量数据的存储、搜索与分析，应用十分广泛。Elastic有一条完整的产品线：Elasticsearch、Kibana、Logstash等，前面说的三个就是大家常说的ELK技术栈。案例一1、根据用户ID、是否隐藏、帖子
Elasticsearch安装与应用伟大无须多言 jenkins 运维
ElasticsearchElasticsearch是一个分布式搜索和分析引擎，具有高扩展性和高可用性。它由Elastic公司提供，是ElasticStack（ELKStack）的核心技术之一，ELKStack包括Elasticsearch、Kibana和Logstash等组件。本文将详细介绍Elasticsearch的安装使用、分片机制以及其它相关功能。一、Elasticsearch的安装Ela
ELK配置logstash的配置文件追梦少年888 数据库运维
input{file{path=>"/srv/web/a/logs/a.*"start_position=>"beginning"type=>"a"}file{path=>"/srv/web/b/logs/b.*"start_position=>"beginning"type=>"b"}file{path=>"/srv/web/c/logs/c.*"start_position=>"beginni
不得不学，从零到一搭建ELK日志，Docker环境下部署 logstash工具 Java佳佳程序员编程 java elk docker elasticsearch
前言大家好，我是佳佳，最近在玩ELK日志平台，它是Elastic公司推出的一整套日志收集、分析和展示的解决方案。只有学习了，操作了才能算真正的学会使用了，虽然看起来简单，但是里面的流程步骤还是很多的，将步骤和遇到的问题记录和总结下，今天主要分享下在Docker环境下部署logstash日志收集工具。#从零到一搭建ELK日志，在Docker环境下部署Elasticsearch数据库#从零到一搭建EL
使用容器部署ELK：适用于生产环境的架构 ExogFix elk 架构 jenkins
在当今的大数据时代，日志管理和实时监控对于企业的成功至关重要。Elasticsearch、Logstash和Kibana（通常被称为ELK堆栈）是一套流行的开源工具，用于实时日志聚合、分析和可视化。通过使用容器化技术，我们可以轻松地部署和管理ELK堆栈，并为生产环境提供可靠的日志分析解决方案。本文将详细介绍如何使用Docker容器部署ELK堆栈，并提供相应的源代码示例。架构概述我们的ELK堆栈部署
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n