将进酒杯莫停。

7、KSQL刨根问底和实战操作教程

7、KSQL教程

1、KsqlDB简介
2、KsqlDB的组成

Collections
Materialized Views
Queries

3、KSQL的安装

1、为ksqlDB应用程序定义服务
2、设置配置文件

（1）设置KsqlDB Server

KSQL_OPTS Environment Variable
模式解析（Schema resolution）

（2）配置KsqlDB CLI

3、创建ksqlDB流

从已存在的Kafka主题创建一个流
> 首先，构建Kafka相应主题

（1）使用Kafka CLI在Confluent Platform中创建Kafka主题。
（2）安装Kafka连接器并生成示例数据

> 然后，使用KSQL创建并写入流和表

（1）用选定的列创建一个流
（2）使用指定的密钥创建一个流
（3）创建一个有时间戳的流
（4）创建一个被新的Kafka主题支持的流
（5）从流中创建一个持久的流查询
（6）删除一个ksqlDB流

4、创建ksqlDB表

从现有的Kafka主题创建一张表

（1）创建包含选定列的表

创建一个新的Kafka主题支持的表
创建一个具有流查询结果的ksqlDB表
从ksqlDB流创建一个ksqlDB表
删除一张ksqlDB表

5、序列化
6、KSQL语法表

1、KsqlDB简介

ksqlDB是事件流数据库，旨在帮助开发人员在ApacheKafka®之上创建流处理应用程序。

在当今世界，利用流处理的应用程序需要一个重量级的体系结构，该体系结构需要将多个分布式系统集成在一起。这些体系结构通常包括用于从外部世界获取事件的连接器或代理、用于存放这些事件的持久存储、用于处理事件的流处理框架和用于向应用程序提供事件聚合的数据库。

不幸的是，这些部件并没有像你希望的那样组装在一起;所有这些系统都很复杂，每个集成都是一个需要解决的小项目。这就像试图用零部件制造一辆汽车，但这些零部件来自不同的制造商，彼此之间互不沟通。

构建流处理应用程序应该并不难。

ksqlDB大大降低了构建流处理应用程序所需的操作复杂性，这使您可以构建实时系统而无需花费大量时间和费用。通过熟悉的轻量级SQL语法，它将实时流处理的功能与数据库的便捷操作的感觉结合在一起。而且由于ksqlDB是由Apache Kafka®提供的本地支持，它无缝地利用了底层的、经过战斗测试的事件流平台。

2、KsqlDB的组成

这些是构建应用程序的基础核心类别：集合，实例化视图和查询。

Collections

集合为事件序列提供持久存储。ksqlDB提供两种集合：流和表。两者都在简单的键/值模型下运行。

Streams：不可变的，仅追加的集合。它们对于表示一系列历史事实很有用。使用相同的键添加多个事件意味着将它们简单地附加到流的末尾。
Tables：可变的集合。它们允许您表示每个键的每个值的最新版本。它们有助于对随时间变化的建模，而且它们通常用于表示聚合。因为ksqlDB将Kafka用作其存储层，所以创建新集合等同于在ApacheKafka®主题上定义流或表。您可以在现有主题上声明集合，或者ksqlDB可以在声明时为该集合创建一个新主题。有关更多信息，请参见Collections Overview

Materialized Views

物化视图是流或表的派生表示形式。它们使您可以在现有流或表上创建新集合。随着新事件的到来，实例化视图将永久保持最新。这意味着您可以将实例化视图链接在一起以创建同一数据的许多表示形式。物化视图对于维护汇总的数据表特别有用。有关更多信息，请参见Materialized Views

Queries

物化视图允许您维护状态，而查询使您能够从应用程序或微服务访问这些物化。应用程序可以使用拉式查询和推式查询来查询实例化视图。

Pull queries：使您能够获取实例化视图的当前状态。由于物化视图会随着新事件的到来而逐步更新，因此拉取查询的运行时延可预期地较低。它们非常适合请求/响应流。
Push queries：使您可以订阅实例化视图更新和流更改。当新事件到来时，推送查询会进行优化，因此事件流应用程序可以实时对新信息做出反应。它们非常适合异步应用程序流。

参考文章：KSQL Overview

Confluent——KSQL

3、KSQL的安装

参考文章：Confluent Platform安装配置和常用操作详细教程

1、为ksqlDB应用程序定义服务

ZooKeeper——用于集群元数据

Kafka——一个或多个

Schema Registry——可选，但如果想使用Avro，必须开启这个

ksqlDB Server——一个或多个

ksqlDB CLI——可选的

Other services——比如Elasticsearch，可选

注：运行模式注册表的堆栈可以处理avro编码的事件。没有模式注册中心，ksqlDB只处理JSON或分隔的事件模式。

2、设置配置文件

（1）设置KsqlDB Server

可以使用服务器配置文件(ksql-server.properties)或KSQL_OPTS环境变量来指定ksqlDB服务器配置参数。使用KSQL_OPTS设置的属性优先于ksqlDB配置文件中指定的属性。推荐的方法是使用ksqlDB配置文件配置一组公共属性，并根据需要使用KSQL_OPTS环境变量覆盖特定的属性。

默认情况下，ksqlDB服务器配置文件位于/etc/ksql/ksql-server.properties。该文件遵循Java属性文件的语法约定。

bootstrap.servers=localhost:9092
listeners=http://localhost:8088

开启Ksql Server的方法

<path-to-confluent>/bin/ksql-server-start <path-to-confluent>/etc/ksql/ksql-server.properties

KSQL_OPTS Environment Variable

您可以使用KSQL_OPTS环境变量来覆盖ksqlDB服务器配置参数。这些属性是标准的Java系统属性。例如：

KSQL_OPTS="-Dksql.streams.num.streams.threads=1" <path-to-confluent>/bin/ksql-server-start \
<path-to-confluent>/etc/ksql/ksql-server.properties

您可以同时指定多个参数，例如：
ksql.streams.auto.offset.reset和ksql.streams.num.stream.threads：

KSQL_OPTS="-Dksql.streams.auto.offset.reset=earliest -Dksql.streams.num.stream.threads=1" <path-to-confluent>/bin/ksql-server-start \
<path-to-confluent>/etc/ksql/ksql-server.properties

模式解析（Schema resolution）

当您运行一个使用Avro的ksqlDB应用程序时，ksqlDB会自动从模式注册表中推断模式，但是重新启动ksqlDB服务器后的行为在交互模式和非交互模式之间有所不同。

交互模式（Interactive mode）：在ksqlDB服务器重新启动后，它不会再次联系模式注册表来解析模式，因为它以前将信息持久化到命令主题。
非交互模式（Non-interactive mode）：在ksqlDB服务器重新启动后，它会再次联系模式注册表来解析模式。如果模式发生了变化，那么可能会出现ksqlDB应用程序中的意外行为。

如果您的ksqlDB应用程序使用Avro，并且您以非交互模式运行它们，那么请确保模式不会在ksqlDB服务器重新启动时发生变化，或者显式地提供模式。如果模式可能会发展，那么显式地提供模式会更安全。

（2）配置KsqlDB CLI

您可以将ksqlDB CLI连接到每个集群的一个ksqlDB服务器。

注：如果CLI所连接的原始服务器变成不可用的话，则不会将CLI会话自动转移到另一个ksqlDB服务器。您执行的任何持久性查询都将继续在ksqlDB集群中运行。

要将ksqlDB CLI连接到集群，请使用指定的ksqlDB服务器URL运行以下命令(默认为http://localhost:8088)：
/bin/ksql

这里有一些常见的ksqlDB CLI属性，你可以自定义：

ksql.streams.auto.offset.reset
确定当Apache Kafka®中没有初始偏移量或当前偏移量在服务器上不存在时该做什么。ksqlDB中的默认值是latest，这意味着所有Kafka主题都是从最新可用偏移量读取的。例如，使用ksqlDB CLI将其更改为earliest：
SET 'auto.offset.reset'='earliest';

ksql.streams.cache.max.bytes.buffering
用于跨所有线程缓冲的最大内存字节数。ksqlDB中的默认值是10000000 (~ 10mb)。下面是一个使用ksqlDB CLI将值更改为20000000的示例:
SET 'cache.max.bytes.buffering'='20000000';

ksql.streams.num.stream.threads
Kafka Streams应用程序实例中的流线程数。流处理代码在这些线程中运行。有关Kafka流线程模型的更多信息，请参见线程模型。

参考文章：Install ksqlDB

3、创建ksqlDB流

在ksqlDB中，您可以从现有的Apache Kafka®主题创建流，从已存在的Kafka主题创建流或者从其他流创建查询结果流。

使用CREATE STREAM语句从现有的Kafka主题或新的Kafka主题创建一个流。
使用CREATE STREAM AS SELECT语句从现有流创建查询流。

注：创建表类似于创建流。

从已存在的Kafka主题创建一个流

使用CREATE STREAM语句从现有的Kafka主题创建一个流。该Kafka主题必须已经存在于Kafka集群中。

下面的示例演示如何从名为pageviews的Kafka主题创建流。

> 首先，构建Kafka相应主题

（1）使用Kafka CLI在Confluent Platform中创建Kafka主题。

1、运行此命令以创建一个名为的主题users。

<path-to-confluent>/bin/kafka-topics --create --zookeeper localhost:2181 \
--replication-factor 1 --partitions 1 --topic users

输出应为：

Created topic "users".

2、运行此命令以创建一个名为的主题pageviews。

<path-to-confluent>/bin/kafka-topics --create --zookeeper localhost:2181   \
--replication-factor 1 --partitions 1 --topic pageviews

输出应为：

Created topic "pageviews".

（2）安装Kafka连接器并生成示例数据

在此步骤中，您将使用Kafka Connect运行名为的演示源连接器kafka-connect-datagen，该连接器将为Kafka主题pageviews和创建示例数据users。

1、运行Kafka Connect Datagen连接器的一个实例，pageviews以AVRO格式为主题生成Kafka数据。

wget https://github.com/confluentinc/kafka-connect-datagen/raw/master/config/connector_pageviews_cos.config
curl -X POST -H "Content-Type: application/json" --data @connector_pageviews_cos.config http://localhost:8083/connectors

2、运行Kafka Connect Datagen连接器的另一个实例， users以AVRO格式为主题生成Kafka数据。

wget https://github.com/confluentinc/kafka-connect-datagen/raw/master/config/connector_users_cos.config
curl -X POST -H "Content-Type: application/json" --data @connector_users_cos.config http://localhost:8083/connectors

> 然后，使用KSQL创建并写入流和表

（1）用选定的列创建一个流

下面的示例创建了一个流，该流包含来自pageviews主题的三个列：viewtime、userid和pageid。

ksqlDB无法推断主题值的数据格式，因此必须提供存储在主题中的值的格式。在本例中，数据格式是DELIMITED。其他选项有Avro、JSON和KAFKA。有关详细信息，请参阅序列化格式。

ksqlDB要求使用Kafka自己的序列化器或兼容的序列化器对密钥进行序列化。ksqlDB支持INT、BIGINT、DOUBLE和STRING键类型。

启动ksql

LOG_DIR=./ksql_logs <path-to-confluent>/bin/ksql

首先，创建一个流

CREATE STREAM pageviews
  (viewtime BIGINT,
   userid VARCHAR,
   pageid VARCHAR)
  WITH (KAFKA_TOPIC='pageviews',
        VALUE_FORMAT='DELIMITED')
  EMIT CHANGES;

 Message
----------------
 Stream created
----------------

查看已创建的流：

SHOW STREAMS;

 Stream Name | Kafka Topic | Format
---------------------------------------
 PAGEVIEWS   | pageviews   | DELIMITED
---------------------------------------

获取流的模式：

DESCRIBE PAGEVIEWS;

Name                 : PAGEVIEWS
 Field    | Type
--------------------------------------
 ROWTIME  | BIGINT           (system)
 ROWKEY   | VARCHAR(STRING)  (system)
 VIEWTIME | BIGINT
 USERID   | VARCHAR(STRING)
 PAGEID   | VARCHAR(STRING)
--------------------------------------
For runtime statistics and query details run: DESCRIBE EXTENDED ;

（2）使用指定的密钥创建一个流

前面的SQL语句没有对底层Kafka主题中的Kafka消息键做任何假设。如果主题中的消息键的值与流中定义的列之一相同，则可以在CREATE STREAM语句的WITH子句中指定该键。如果使用这个最新的列名来执行连接或重分区命令，ksqlDB知道不需要重分区。实际上，已命名列成为ROWKEY的别名。例如，如果Kafka消息键具有与pageid列相同的值，您可以像这样编写CREATE STREAM语句：

CREATE STREAM pageviews_withkey
  (viewtime BIGINT,
   userid VARCHAR,
   pageid VARCHAR)
 WITH (KAFKA_TOPIC='pageviews',
       VALUE_FORMAT='DELIMITED',
       KEY='pageid');

使用DESCRIBE EXTENDED 确认新流中的关键字段是pageid:

DESCRIBE EXTENDED pageviews_withkey;

Name                 : PAGEVIEWS_WITHKEY
Type                 : STREAM
Key field            : PAGEID
Key format           : STRING
Timestamp field      : Not set - using 
Value format         : DELIMITED
Kafka topic          : pageviews (partitions: 1, replication: 1)
[...]

（3）创建一个有时间戳的流

在ksqlDB中，消息时间戳用于基于窗口的操作，如窗口聚合，并支持事件时间处理。如果您想使用主题列之一的值作为Kafka消息时间戳，请在WITH子句中设置时间戳属性。

例如，如果您想使用viewtime列的值作为消息时间戳，您可以将前面的CREATE STREAM重写为SELECT语句，如下所示：

CREATE STREAM pageviews_timestamped
  (viewtime BIGINT,
   userid VARCHAR,
   pageid VARCHAR)
  WITH (KAFKA_TOPIC='pageviews',
        VALUE_FORMAT='DELIMITED',
        KEY='pageid',
        TIMESTAMP='viewtime')
  EMIT CHANGES;

使用DESCRIBE EXTENDED语句确认TIMESTAMP字段是viewtime：

DESCRIBE EXTENDED pageviews_timestamped;

Name                 : PAGEVIEWS_TIMESTAMPED
Type                 : STREAM
Key field            : PAGEID
Key format           : STRING
Timestamp field      : VIEWTIME
Value format         : DELIMITED
Kafka topic          : pageviews (partitions: 1, replication: 1)
[...]

（4）创建一个被新的Kafka主题支持的流

通过在WITH子句中提供分区（PARTITION）数和可选的副本（REPLICAS）数，使用CREATE STREAM语句创建不存在主题的流。

以上面的pageviews表为例，但是在Kafka主题不存在的地方，您可以通过将下面的create stream语句粘贴到CLI中来创建流：

CREATE STREAM pageviews
  (viewtime BIGINT,
   userid VARCHAR,
   pageid VARCHAR)
  WITH (KAFKA_TOPIC='pageviews',
        PARTITIONS=4,
        REPLICAS=3
        VALUE_FORMAT='DELIMITED')
  EMIT CHANGES;

这将使用你设置的分区数和副本数为你创建pageviews主题。

（5）从流中创建一个持久的流查询

使用CREATE STREAM AS SELECT语句使用现有的流来创建一个持久查询流。

创建一个包含SELECT查询结果的流。ksqlDB将SELECT查询结果保存到相应的新主题中。以这种方式创建的流表示的一个持久的、连续的流查询，这意味着它将一直运行，直到您输入命令停止它为止。

注：SELECT语句本身是一个非持久的连续查询。SELECT语句的结果不会持久保存在Kafka主题中，只会打印在ksqlDB控制台中。不要将CREATE STREAM AS SELECT创建的持久查询与SELECT语句的流查询结果混淆。

使用SHOW QUERIES语句来列出当前正在运行的持久查询。使用PRINT语句在ksqlDB CLI中查看持久查询的结果。按CTRL+C停止打印记录。当停止打印时，查询将继续运行。

使用TERMINATE语句来停止持久查询。退出ksqlDB CLI不会停止持久查询。您的ksqlDB服务器将继续处理查询，并且查询将持续运行，直到您显式地终止它们。

要将SELECT查询的结果流到现有流及其基础主题中，请使用INSERT INTO语句。

CREATE STREAM AS SELECT语句不支持键属性。要指定键字段，请使用PARTITION BY子句。有关更多信息，请参见启用连接的分区数据

下面的SQL语句创建了一个pageviews_intro流，它包含一个持久查询的结果，该查询与具有小于Page_20的pageid值的“介绍性”页面匹配:

CREATE STREAM pageviews_intro AS
      SELECT * FROM pageviews
      WHERE pageid < 'Page_20'
      EMIT CHANGES;

 Message
----------------------------
 Stream created and running
----------------------------

要确认pageviews_intro查询是作为一个流连续运行的，请运行PRINT语句:

PRINT pageviews_intro;

Key format: KAFKA_BIGINT or KAFKA_DOUBLE
Value format: KAFKA_STRING
rowtime: 10/30/18 10:15:51 PM GMT, key: 294851, value: 1540937751186,User_8,Page_12
rowtime: 10/30/18 10:15:55 PM GMT, key: 295051, value: 1540937755255,User_1,Page_15
rowtime: 10/30/18 10:15:57 PM GMT, key: 295111, value: 1540937757265,User_8,Page_10
rowtime: 10/30/18 10:15:59 PM GMT, key: 295221, value: 1540937759330,User_4,Page_15
rowtime: 10/30/18 10:15:59 PM GMT, key: 295231, value: 1540937759699,User_1,Page_12
rowtime: 10/30/18 10:15:59 PM GMT, key: 295241, value: 1540937759990,User_6,Page_15
^CTopic printing ceased

在停止打印流之后，查询将继续运行。

KsqlDB已经确定密钥格式是KAFKA_BIGINT或KAFKA_DOUBLE。KsqlDB没有进一步缩小范围，因为仅通过检查密钥的序列化字节不可能排除任何一种格式。在本例中，我们知道键是BIGINT。对于其他情况，您可能知道密钥类型，或者您可能需要与数据的作者交谈。

使用SHOW QUERIES语句查看ksqlDB为pageviews_intro流创建的查询:

SHOW QUERIES;

     Query ID               | Kafka Topic     | Query String

     CSAS_PAGEVIEWS_INTRO_0 | PAGEVIEWS_INTRO | CREATE STREAM pageviews_intro AS       SELECT * FROM pageviews       WHERE pageid < 'Page_20' EMIT CHANGES;

    For detailed information on a Query run: EXPLAIN ;

由CREATE STREAM AS SELECT语句创建的持久查询的ID中有字符串CSAS，例如CSAS_PAGEVIEWS_INTRO_0。

（6）删除一个ksqlDB流

使用DROP STREAM语句删除一个流。如果您使用CREATE STREAM AS SELECT来创建流，那么您必须首先终止相应的持久查询。

使用TERMINATE语句停止CSAS_PAGEVIEWS_INTRO_0查询：

TERMINATE CSAS_PAGEVIEWS_INTRO_0;

 Message
-------------------
 Query terminated.
-------------------

使用DROP STREAM语句删除持久查询流。在删除相应的流之前，必须终止查询。

DROP STREAM pageviews_intro;

 Message
-------------------
 Source PAGEVIEWS_INTRO was dropped.
-------------------

4、创建ksqlDB表

在ksqlDB中，您可以从现有的Apache Kafka®主题创建表，创建新Kafka主题的表或者从其他表或流的查询结果创建表。

使用CREATE TABLE语句从现有的Kafka主题或新的Kafka主题创建一个表。
使用CREATE TABLE AS SELECT语句创建一个表，其中包含来自现有表或流的查询结果。

从现有的Kafka主题创建一张表

使用CREATE TABLE语句从现有的Kafka主题创建一个表。Kafka主题必须已经存在于Kafka集群中。

下面的示例演示如何从Kafka主题(名为users)创建表。要查看这些示例的实际情况，请使用ksqlDB按照针对Apache Kafka®的写流查询中的过程创建用户主题。

（1）创建包含选定列的表

下面的示例创建了一个表，其中有来自用户主题的四列：registertime、userid、gender和regionid。另外，userid字段被指定为表的键属性。

键字段是可选的。有关更多信息，请参见Key Requirements。

ksqlDB无法推断主题值的数据格式，因此必须提供存储在主题中的值的格式。在本例中，数据格式是JSON。其他选项有Avro、DELIMITED和KAFKA。有关更多信息，请参见序列化格式。

ksqlDB要求使用Kafka自己的序列化器或兼容的序列化器对密钥进行序列化。ksqlDB支持INT、BIGINT、DOUBLE和STRING键类型。

首先，创建一张表

CREATE TABLE users
  (registertime BIGINT,
   userid VARCHAR,
   gender VARCHAR,
   regionid VARCHAR)
  WITH (KAFKA_TOPIC = 'users',
        VALUE_FORMAT='JSON',
        KEY = 'userid');

 Message
---------------
 Table created
---------------

查看表

SHOW TABLES;

 Table Name | Kafka Topic | Format | Windowed
----------------------------------------------
 USERS      | users       | JSON   | false
----------------------------------------------

获取表的模式

DESCRIBE users;

Name                 : USERS
 Field        | Type
------------------------------------------
 ROWTIME      | BIGINT           (system)
 ROWKEY       | VARCHAR(STRING)  (system)
 REGISTERTIME | BIGINT
 USERID       | VARCHAR(STRING)
 GENDER       | VARCHAR(STRING)
 REGIONID     | VARCHAR(STRING)
------------------------------------------
For runtime statistics and query details run: DESCRIBE EXTENDED ;

使用SELECT语句在users表上创建一个连续的流查询：

SELECT * FROM users EMIT CHANGES;

假设表中有内容，您的输出应该类似于：

+---------------+--------+---------------+--------+--------+----------+
| ROWTIME       | ROWKEY | REGISTERTIME  | USERID | GENDER | REGIONID |
+---------------+--------+---------------+--------+--------+----------+
| 1541439611069 | User_2 | 1498028899054 | User_2 | MALE   | Region_1 |
| 1541439611320 | User_6 | 1505677113995 | User_6 | FEMALE | Region_7 |
| 1541439611396 | User_5 | 1491338621627 | User_5 | OTHER  | Region_2 |
| 1541439611536 | User_9 | 1492621173463 | User_9 | FEMALE | Region_3 |
^CQuery terminated

按Ctrl+C停止打印查询结果。

表值使用最新的记录不断更新，因为底层用户主题不断接收新消息。

创建一个新的Kafka主题支持的表

通过在WITH子句中提供分区（PARTITIONS）数和可选的副本（REPLICA）数，使用CREATE TABLE语句创建一个不包含预先存在主题的表。

以上面的users表为例，但是其中的Kafka主题还不存在，您可以通过将以下create table语句粘贴到CLI中来创建该表：

CREATE TABLE users
  (registertime BIGINT,
   userid VARCHAR,
   gender VARCHAR,
   regionid VARCHAR)
  WITH (KAFKA_TOPIC = 'users',
        VALUE_FORMAT='JSON',
        PARTITIONS=4,
        REPLICAS=3
        KEY = 'userid');

这将使用提供的分区和副本计数为您创建用户主题。

创建一个具有流查询结果的ksqlDB表

使用CREATE TABLE AS SELECT语句创建一个ksqlDB表，其中包含来自另一个表或流的SELECT查询的结果。

CREATE TABLE AS SELECT使用相应的Kafka主题创建一个新的ksqlDB表，并将SELECT查询的结果作为一个更改日志流到主题中。ksqlDB创建一个持续运行的查询，直到通过命令终止它为止。

下面的SQL语句创建了一个users_female表，其中包含性别（gender）设置为FEMALE的用户的持久查询结果:

CREATE TABLE users_female AS
  SELECT userid, gender, regionid FROM users
  WHERE gender='FEMALE'
  EMIT CHANGES;

 Message
---------------------------
 Table created and running
---------------------------

使用SHOW TABLE和PRINT语句检查表：

SHOW TABLES;

 Table Name   | Kafka Topic  | Format | Windowed
-------------------------------------------------
 USERS        | users        | JSON   | false
 USERS_FEMALE | USERS_FEMALE | JSON   | false
-------------------------------------------------

打印表中的一些行：

PRINT users_female;

Key format: KAFKA_STRING
Value format: JSON
rowTime: 12/21/18 23:58:42 PM PSD, key: User_5, value: {"USERID":"User_5","GENDER":"FEMALE","REGIONID":"Region_4"}
rowTime: 12/21/18 23:58:42 PM PSD, key: User_2, value: {"USERID":"User_2","GENDER":"FEMALE","REGIONID":"Region_7"}
rowTime: 12/21/18 23:58:42 PM PSD, key: User_9, value: {"USERID":"User_9","GENDER":"FEMALE","REGIONID":"Region_4"}
^CTopic printing ceased

在停止打印表之后，查询将继续运行。

使用SHOW QUERIES语句查看ksqlDB为users_female表创建的查询：

SHOW QUERIES;

 Query ID            | Kafka Topic  | Query String

 CTAS_USERS_FEMALE_0 | USERS_FEMALE | CREATE TABLE users_female AS   SELECT userid, gender, regionid FROM users   WHERE gender='FEMALE' EMIT CHANGES;

For detailed information on a Query run: EXPLAIN ;

由CREATE TABLE AS SELECT语句创建的持久查询的ID中包含字符串CTAS，例如CTAS_USERS_FEMALE_0。

从ksqlDB流创建一个ksqlDB表

使用CREATE TABLE AS SELECT语句从流中创建表。从流创建表需要聚合，因此需要在SELECT子句中包含COUNT(*)这样的函数。

CREATE TABLE pageviews_table AS
  SELECT userid, pageid, COUNT(*) AS TOTAL
  FROM pageviews_original WINDOW TUMBLING (SIZE 1 MINUTES)
  GROUP BY userid, pageid
  EMIT CHANGES;

 Message
---------------------------
 Table created and running
---------------------------

通过使用SELECT流语句观察表发生的变化。

SELECT * FROM pageviews_table EMIT CHANGES;

+---------------+---------------+---------------+------------------+--------+---------+------+
| ROWTIME       | WINDOWSTART   | WINDOWEND     | ROWKEY           | USERID | PAGEID  | TOTAL|
+---------------+---------------+---------------+------------------+--------+---------+------+
| 1557183919786 | 1557183900000 | 1557183960000 | User_5|+|Page_12 | User_5 | Page_12 | 1    |
| 1557183929488 | 1557183900000 | 1557183960000 | User_9|+|Page_39 | User_9 | Page_39 | 1    |
| 1557183930211 | 1557183900000 | 1557183960000 | User_1|+|Page_79 | User_1 | Page_79 | 1    |
| 1557183930687 | 1557183900000 | 1557183960000 | User_9|+|Page_34 | User_9 | Page_34 | 1    |
| 1557183929786 | 1557183900000 | 1557183960000 | User_5|+|Page_12 | User_5 | Page_12 | 2    |
| 1557183931095 | 1557183900000 | 1557183960000 | User_3|+|Page_43 | User_3 | Page_43 | 1    |
| 1557183930184 | 1557183900000 | 1557183960000 | User_1|+|Page_29 | User_1 | Page_29 | 1    |
| 1557183930727 | 1557183900000 | 1557183960000 | User_6|+|Page_93 | User_6 | Page_93 | 3    |
^CQuery terminated

当向表发出更改时，可以多次输出相同的键。这是因为每次表中的行发生更改时，都会发出该行。

使用SELECT语句查找表中特定键的值。

SELECT * FROM pageviews_table WHERE ROWKEY='User_9|+|Page_39';

+------------------+---------------+---------------+---------------+--------+---------+-------+
| ROWKEY           | WINDOWSTART   | WINDOWEND     | ROWTIME       | USERID | PAGEID  | TOTAL |
+------------------+---------------+---------------+---------------+--------+---------+-------+
| User_9|+|Page_39 | 1557183900000 | 1557183960000 | 1557183929488 | User_9 | Page_39 | 1     |
Query terminated

删除一张ksqlDB表

使用DROP TABLE语句删除一张表。如果使用CREATE table作为SELECT来创建表，则必须首先终止相应的持久查询。

使用TERMINATE语句来停止CTAS_USERS_FEMALE_0查询：

TERMINATE CTAS_USERS_FEMALE_0;

 Message
-------------------
 Query terminated.
-------------------

使用DROP TABLE语句删除users_female表：

DROP TABLE users_female;

 Message
-----------------------------------
 Source USERS_FEMALE was dropped.
-----------------------------------

参考指南：
Develop ksqlDB Applications

5、序列化

Serialization

Quick Start using Community Components (Local)

6、KSQL语法表

KSQL语法表

你可能感兴趣的:(Kafka,大数据开发)

Kafka 消息丢失如何处理？架构文摘JGWZ 学习
今天给大家分享一个在面试中经常遇到的问题：Kafka消息丢失该如何处理？这个问题啊，看似简单，其实里面藏着很多“套路”。来，咱们先讲一个面试的“真实”案例。面试官问：“Kafka消息丢失如何处理？”小明一听，反问：“你是怎么发现消息丢失了？”面试官顿时一愣，沉默了片刻后，可能有点不耐烦，说道：“这个你不用管，反正现在发现消息丢失了，你就说如何处理。”小明一头雾水：“问题是都不知道怎么丢的，处理起来
【六】阿伟开始搭建Kafka学习环境能源恒观中间件学习 kafka spring
阿伟开始搭建Kafka学习环境概述上一篇文章阿伟学习了Kafka的核心概念，并且把市面上流行的消息中间件特性进行了梳理和对比，方便大家在学习过程中进行对比学习，最后梳理了一些Kafka使用中经常遇到的Kafka难题以及解决思路，经过上一篇的学习我相信大家对Kafka有了初步的认识，本篇将继续学习Kafka。一、安装和配置学习一项技术首先要搭建一套服务，而Kafka的运行主要需要部署jdk、zook
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
Kafka 基础与架构理解 StaticKing KAFKA kafka
目录前言Kafka基础概念消息队列简介：Kafka与传统消息队列（如RabbitMQ、ActiveMQ）的对比Kafka的组件Kafka的工作原理：消息的生产、分发、消费流程Kafka系统架构Kafka的分布式架构设计Leader-Follower机制与数据复制Log-basedStorage和持久化Broker间通信协议Zookeeper在Kafka中的角色总结前言Kafka是一个分布式的消息系
全面指南：用户行为从前端数据采集到实时处理的最佳实践数字沉思营销流量运营系统架构前端内容运营大数据
引言在当今的数据驱动世界，实时数据采集和处理已经成为企业做出及时决策的重要手段。本文将详细介绍如何通过前端JavaScript代码采集用户行为数据、利用API和Kafka进行数据传输、通过Flink实时处理数据的完整流程。无论你是想提升产品体验还是做用户行为分析，这篇文章都将为你提供全面的解决方案。设计一个通用的ClickHouse表来存储用户事件时，需要考虑多种因素，包括事件类型、时间戳、用户信
Docker安装Kafka和Kafka-Manager 阿靖哦
本文介绍如何通过Docker安装kafka与kafka界面管理界面一、拉取zookeeper由于kafka需要依赖于zookeeper，因此这里先运行zookeeper1、拉取镜像dockerpullwurstmeister/zookeeper2、启动dockerrun-d--namezookeeper-p2181:2181-eTZ="Asia/Shanghai"--restartalwayswu
主流行架构 rainbowcheng 架构架构
nexus，gitlab,svn,jenkins,sonar,docker，apollo，catteambition，axure，蓝湖，禅道,WCP；redis，kafka，es，zookeeper，dubbo，shardingjdbc，mysql，InfluxDB，Telegraf，Grafana，Nginx，xxl-job，Neo4j,NebulaGraph是一个高性能的,NOSQL图形数据库
月度总结 | 2022年03月 | 考研与就业的抉择 | 确定未来走大数据开发路线「已注销」个人总结 hadoop
一、时间线梳理3月3日，寻找到同专业的就业伙伴3月5日，着手准备Java八股文，决定先走Java后端路线3月8月，申请到了校图书馆的考研专座，决定暂时放弃就业，先准备考研，买了数学和408的资料书3月9日-3月13日，因疫情原因，宿舍区暂封，这段时间在准备考研，发现内容特别多3月13日-3月19日，大部分时间在刷Hadoop、Zookeeper、Kafka的视频，同时在准备实习的项目3月20日，退
分布式消息队列Kafka 叶域大数据分布式 kafka scala spark
分布式消息队列Kafka简介：Kafka是一个分布式消息队列系统，用于处理实时数据流。消息按照主题（Topic）进行分类存储，发送消息的实体称为Producer，接收消息的实体称为Consumer。Kafka集群由多个Kafka实例（Server）组成，每个实例称为Broker。主要用途：广泛应用于构建实时数据管道和流应用程序，适用于需要高吞吐量和低延迟的数据处理场景依赖：Kafka集群和消费者依
科锐国际（计算机类），汤臣倍健，中建三局，宁德时代，途游游戏，得物，顺丰，康冠科技24春招内推 weixin_53585422 c++算法 python java c语言
科锐国际（计算机类），汤臣倍健，中建三局，宁德时代，途游游戏，得物，顺丰，康冠科技24春招内推①汤臣倍健【内推岗位】：市场类、营销类、研发类、电商类、职能类、IT技术类、商业分析类、生产运营类【内推链接】https://sourl.cn/JSDhLU【推荐码】ES3W2T②科锐国际(OD项目组--计算机专场)【招聘岗位】软件开发工程师、软件测试工程师、大数据开发工程师、运维工程师等计算机类岗位，2
K8S学习之PV&&PVC david161
部署mysql之前我们需要先了解一个概念有状态服务。这是一种特殊的服务，简单的归纳下就是会产生需要持久化的数据，并且有很强的I/O需求，且重启需要依赖上次存储到磁盘的数据。如典型的mysql，kafka，zookeeper等等。在我们有比较优秀的商业存储的前提下，非常推荐使用有状态服务进行部署，计算和存储分离那是相当的爽的。在实际生产中如果没有这种存储，localPV也是不错的选择，当然local
Kafka系列之：kafka命令详细总结快乐骑行^_^ 日常分享专栏 Kafka Kafka系列 kafka命令详细总结
Kafka系列之：kafka命令详细总结一、添加和删除topic二、修改topic三、平衡领导者四、检查消费者位置五、管理消费者群体一、添加和删除topicbin/kafka-topics.sh--bootstrap-serverbroker_host:port--create--topicmy_topic_name\--partitions20--replication-factor3--con
搭建Kafka+zookeeper集群调度 krb___ kafka 分布式
前言硬件环境172.18.0.5kafkazk1Kafka+zookeeperKafkaBroker集群172.18.0.6kafkazk2Kafka+zookeeperKafkaBroker集群172.18.0.7kafkazk3Kafka+zookeeperKafkaBroker集群软件环境zookeeper3.5.9资源调度、写作Kafka2.8.0消息通信中间件安装JDK1.8安装搭建zo
Kafka和Pulsar深入解析 jasen91 大数据开发 kafka 分布式
Kafka多租户：单租户系统数据迁移：依赖MirrorMaker，需要额外维护。市场上也有ConfluentReplicator等供应商工具。分层存储：由供应商提供商业使用。组件依赖：KafkaRaft（KRaft）从Kafka2.8开始处于早期访问模式，允许Kafka在没有ZooKeeper的情况下工作。这对Kafka来说是一个显著的优势，因为它简化了Kafka的体系结构并降低了学习成本。云原生
Linux系统部署Kafka教学情书学长 linux 学习笔记 kafka
第一步：Zookeeper安装（准备工作）1、解压安装将安装包上传到/opt/software目录下，解压并修改名称tar-zxvfapache-zookeeper-3.5.7-bin.tar.gz-C/opt/module/mvapache-zookeeper-3.5.7-bin/zookeeper2、配置服务器编号1)在/opt/module/zookeeper-3.5.7/这个目录下创建zk
数仓开发之DWD层完整使用 (第五章) 小坏讲微服务数据仓库 hadoop scala kafka
数仓开发之DWD层完整使用一、流量域未精加工的事务事实表1、主要任务1）数据清洗（ETL）2）新老访客状态标记修复3）分流2、思路1）数据清洗（ETL）2）新老访客状态标记修复（1）前端埋点新老访客状态标记设置规则（2）新老访客状态标记修复思路3）利用侧输出流实现数据拆分（1）埋点日志结构分析（2）分流日志分类（3）分流思路3、图解4、代码1）在KafkaUtil工具类中补充getKafkaPro
Kafka 应用场景 zinuxer kafka 分布式
数据流处理：Kafka支持实时数据流处理，能够在数据流动时进行处理和分析，确保应用程序与最新信息保持同步！日志聚合：可以将来自不同来源的日志集中和聚合，简化应用程序的调试和监控！消息队列：Kafka充当高性能的消息队列，确保不同系统组件之间可靠且可扩展的通信！网络活动追踪：Kafka可以追踪网络活动，改进用户体验和推动业务增长！数据复制：Kafka允许在多个集群之间实现无缝数据复制，确保高可用性和
Kafka的ack机制香山上的麻雀
ack=0/1/-1的不同情况：0：producer不等待broker的ack，broker一接收到还没有写入磁盘就已经返回，当broker故障时有可能丢失数据；1：producer等待broker的ack，partition的leader落盘成功后返回ack，如果在follower同步成功之前leader故障，那么将会丢失数据；-1：producer等待broker的ack，partition的
Kafka 实战 - Kafka分区和副本机制理解用心去追梦 kafka 分布式
ApacheKafka的分区（Partition）和副本（Replica）机制是其核心架构和可靠性保证的关键组成部分。以下是对其理解的详细解释：分区（Partition）分区概念：在Kafka中，每个主题（Topic）可以被划分为多个分区。分区是一个有序的、不可变的消息序列。这意味着消息在分区中按生成顺序存储，每个消息都有一个唯一的偏移量（Offset）。目的：分区的主要目的是为了水平扩展和并行处
编程常用命令总结 Yellow0523 Linux BigData 大数据
编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
zookeeper+kafka消息队列部署 TBF610218 zookeeper kafka 分布式
消息队列的概念什么是消息队列消息是指在应用间传送的数据消息队列是一种应用间的通信方式解决方法，确保消息的可靠传递专门为消息做缓存的消息队列的特征存储将消息存储在某个类型的缓冲区中，指导目标进读取这些消息或者将其从消息队列中显示移除为止异步消息队列通过缓冲消息可以在应用程序当中公开一定程度的异步性，允许源进程发送消息并在队列当中累积消息，而且目标进程可以挑选消息并进行处理为什么需要消息队列解耦冗余扩
分布式中间件-几个常用的消息中间件问道飞鱼分布式技术分布式中间件
文章目录常见消息中间件1.RabbitMQ2.ApacheKafka3.RedisPub/Sub4.ActiveMQ5.AmazonSimpleNotificationService(SNS)和SimpleQueueService(SQS)6.RocketMQ差异总结消息协议1.AMQP(AdvancedMessageQueuingProtocol)2.STOMP(SimpleTextOrient
kafka php 教程,php 使用kafka weixin_39713841 kafka php 教程
准备工作gitclonehttps://github.com/edenhill/librdkafka.git./configuremakesudomakeinstall$gitclonehttps://github.com/arnaud-lb/php-rdkafka.git#生成configure文件$/Users/shiyibo/LNMP/php/bin/phpize#编译安装$./config
Kafka快速入门 G丶AEOM 速成学习区 kafka linq 分布式
讲一下什么是Kafka首先引入这样一个场景：A服务可以发送200qps（QueriesPerSecond，是指每秒查询率），而B服务可以处理100qps。很显然，B服务很可能会被A服务压垮掉。怎么为了保证B不被压垮的同时还能处理A消息，没有什么是不能通过一层中间件解决的，如果有，那就再加一层。开始很容易想到，可以在B服务中增加一个队列，其实就是个链表，B服务根据自己的消费能力，消费链表中的消息。每
【Python系列】异步任务的终止 Kwan的解忧杂货铺@新空间代码工作室 s2 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
老版本kafka查询topic消费情况(python查询) 代码是谁 kafka python 分布式
由于老版本的kafka缺少shell，导致无法通过命令直接进行查询，所以通过python代码，实现消费情况查询安装必须的包#pyhon2.5pipinstallkafka-python==1.4.7python脚本#!/usr/bin/envpythonimportsysfromkafkaimportKafkaConsumer,TopicPartitioniflen(sys.argv)!=2:pr
【Python系列】使用切片移动元素位置 Kwan的解忧杂货铺@新空间代码工作室 s2 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
字节架构师：来说说 Kafka 的消费者客户端详解，你都搞懂了吗？ 2401_84049200 程序员 kafka linq 分布式
点对点模式基于队列，类似于同一个消费者组中的数据，由生产者发送数据到分区，然后消费者拉取分区的消息进行消费，此时消息只能被同一个消费者组的消费者消费一次。发布订阅模式模式就是kafka中的分区消息可以被不同消费者组的消费者消费。这就是一对多的广播模式应用。当然，消费者组是一个逻辑的概念，通过客户端参数group.id来配置，默认值为空字符串。而消费者并不是逻辑的概念，它是真正消费数据的实体，可以是
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &