大大蚊子

Debezium发布历史02

原文地址： https://debezium.io/blog/2016/04/15/parsing-ddl/

解析DDL
2016 年 4 月 15 日，兰德尔·豪奇 (Randall Hauch)
mysql sql

欢迎关注留言，我是收集整理小能手，工具翻译，仅供参考，笔芯笔芯.

当我们的MySQL 连接器读取 MySQL 服务器或集群的 binlog 时，它会解析日志中的 DDL 语句，并随着时间的推移构建每个表架构的内存中模型。此过程很重要，因为连接器使用每个事件发生时的表定义为每个表生成事件。我们无法使用数据库的当前架构，因为自连接器读取的时间点（或日志中的位置）以来，它可能已发生更改。

解析 MySQL 或任何其他主要关系数据库的 DDL 似乎是一项艰巨的任务。通常每个 DBMS 都有高度定制的 SQL 语法，尽管数据操作语言(DML) 语句通常相当接近标准，但数据定义语言(DDL) 语句通常不太接近标准，并且涉及更多 DBMS 特定的功能。

既然如此，我们为什么要为 MySQL 编写自己的 DDL 解析器呢？我们首先看一下 Debezium 需要 DDL 解析器来做什么。

在 Debezium MySQL 连接器中解析 DDL
MySQL binlog 包含各种类型的事件。例如，当向表中插入一行时，binlog 事件包含对该表的间接引用以及表中每一列的值，但没有有关组成该表的列的信息。binlog 中唯一引用表结构的是 MySQL 在处理用户提供的 DDL 语句时生成的 SQL DDL 语句。

连接器还使用 Kafka Connect 模式生成消息，这些模式是简单的数据结构，定义每个字段的各种名称和类型以及字段的组织方式。因此，当我们为表插入生成事件消息时，我们首先必须有一个包含所有适当字段的 Kafka Connect对象，然后我们必须使用字段和Schema字段将列值的有序数组转换为 Kafka Connect对象。Struct表插入事件中的各个列值。

幸运的是，当我们遇到 DDL 语句时，我们可以更新内存中模型，然后使用它来生成对象Schema。同时，我们可以创建一个组件，该组件将使用该对象从事件中出现的列值的有序数组Schema创建一个对象。Struct所有这些都可以完成一次并用于该表上的所有行事件，直到我们遇到另一个更改表架构的 DDL 语句，此时我们再次更新了模型。

因此，所有这些都需要解析所有 DDL 语句，尽管出于我们的目的，我们只需要了解DDL 语法的一小部分。然后，我们必须使用该语句子集来更新表的内存模型。由于我们的内存表模型不是 MySQL 特有的，因此生成Schema对象和将值数组转换为Struct消息中使用的对象的组件的其余功能都是通用的。

现有的 DDL 库
不幸的是，实际上并没有那么多用于解析 MySQL、PostgreSQL 或其他流行 RDBMS 的 DDL 语句的第三方开源库。JSqlParser经常被引用，但它具有单一语法，是多个 DBMS 语法的组合，因此不是针对任何特定 DBMS 的严格解析器。通过更新复合语法来添加对其他 DBMS 的支持可能很困难。

其他库（例如PrestoDB ）定义了自己的 SQL 语法，无法处理 MySQL DDL 语法的复杂性和细微差别。Antlr 解析器生成器项目具有MySQL 5.6 的语法，但这仅限于 DML 的一小部分，并且不支持 DDL 或更新的 5.7 功能。Antlr 3有较旧的 SQL 相关语法，但这些语法通常很庞大、存在错误，并且仅限于特定的 DBMS。Teiid项目是一个数据虚拟化引擎，位于各种 DBMS 和数据源之上，它的工具具有一系列DDL 解析器，可以在特殊存储库中构建 AST（作者实际上帮助开发了这些）。还有 Ruby 库，例如Square 的 MySQL 解析器库。还有一种专有的商业产品。

我们的 DDL 解析器框架
由于我们找不到有用的第 3 方开源库，因此我们选择创建自己的 DDL 解析器框架来满足我们的需求：

解析 DDL 语句并更新我们的内存模型。

专注于使用那些基本语句（例如，创建、更改和删除表和视图），而完全忽略其他语句而不必解析它们。

与MySQL DDL 语法文档类似地构造解析器代码，并使用反映语法中规则的方法名称。随着时间的推移，这将使维护变得更容易。

允许根据需要为 PostgreSQL、Oracle、SQLServer 和其他 DBMS 创建解析器。

通过子类化支持自定义：能够轻松覆盖逻辑的狭窄部分，而无需复制大量代码。

使开发、调试和测试解析器变得容易。

由此产生的框架包括一个标记生成器，它将字符串中的一个或多个 DDL 语句转换为可回滚的标记序列，其中每个标记代表标点符号、带引号的字符串、不区分大小写的单词和符号、数字、关键字、注释和终止字符（例如对于;MySQL）。然后，DDL 解析器使用简单且易于阅读的流畅 API 遍历令牌流寻找模式，调用自身的方法来处理各种令牌集。解析器还使用内部数据类型解析器来处理 SQL 数据类型表达式，例如INT, VARCHAR(64), NUMERIC(32,3), TIMESTAMP(8) WITH TIME ZONE。

MySqlDdlParser类扩展了基类并提供所有特定于 MySQL 的解析逻辑。例如，DDL 语句：

Create and populate our products using a single insert with many rows

CREATE TABLE products (
id INTEGER NOT NULL AUTO_INCREMENT PRIMARY KEY,
name VARCHAR(255) NOT NULL,
description VARCHAR(512),
weight FLOAT
);
ALTER TABLE products AUTO_INCREMENT = 101;

Create and populate the products on hand using multiple inserts

CREATE TABLE products_on_hand (
product_id INTEGER NOT NULL PRIMARY KEY,
quantity INTEGER NOT NULL,
FOREIGN KEY (product_id) REFERENCES products(id)
);
可以很容易地解析为：

String ddlStatements = …
DdlParser parser = new MySqlDdlParser();
Tables tables = new Tables();
parser.parse(ddl, tables);
在这里，Tables对象是命名表定义的内存中表示。解析器处理 DDL 语句，将每个语句应用到Tables对象内适当的表定义。

怎么运行的
每个DdlParser实现都有以下公共方法，用于解析提供的字符串中的语句：

public final void parse(String ddlContent, Tables databaseTables) {
    Tokenizer tokenizer = new DdlTokenizer(!skipComments(), this::determineTokenType);
    TokenStream stream = new TokenStream(ddlContent, tokenizer, false);
    stream.start();
    parse(stream, databaseTables);
}

在这里，该方法使用知道如何将字符串中的字符分隔成各种类型的标记对象的TokenStreama 从内容创建一个新的。DdlTokenizer然后它调用另一个parse方法来完成大部分工作：

public final void parse(TokenStream ddlContent, Tables databaseTables)
                       throws ParsingException, IllegalStateException {
    this.tokens = ddlContent;
    this.databaseTables = databaseTables;
    Marker marker = ddlContent.mark();
    try {
        while (ddlContent.hasNext()) {
            parseNextStatement(ddlContent.mark());
            // Consume the statement terminator if it is still there ...
            tokens.canConsume(DdlTokenizer.STATEMENT_TERMINATOR);
        }
    } catch (ParsingException e) {
        ddlContent.rewind(marker);
        throw e;
    } catch (Throwable t) {
        parsingFailed(ddlContent.nextPosition(),
                      "Unexpected exception (" + t.getMessage() + ") parsing", t);
    }
}

这会设置一些本地状态，标记当前起点，并尝试解析 DDL 语句，直到找不到更多语句。如果解析逻辑无法找到匹配项，它会生成一个ParsingException包含有问题的行和列的消息，以及一条消息，表明已找到的内容和预期的内容。在这种情况下，此方法会倒回令牌流（如果调用者希望尝试替代的不同解析器）。

每次parseNextStatement调用该方法时，该语句的起始位置都会传递到该方法中，从而为其提供该语句的起始位置。我们的MySqlDdlParser子类重写该parseNextStatement方法以使用语句中的第一个标记来确定 MySQL DDL 语法中允许的语句类型：

@Override
protected void parseNextStatement(Marker marker) {
    if (tokens.matches(DdlTokenizer.COMMENT)) {
        parseComment(marker);
    } else if (tokens.matches("CREATE")) {
        parseCreate(marker);
    } else if (tokens.matches("ALTER")) {
        parseAlter(marker);
    } else if (tokens.matches("DROP")) {
        parseDrop(marker);
    } else if (tokens.matches("RENAME")) {
        parseRename(marker);
    } else {
        parseUnknownStatement(marker);
    }
}

当找到匹配的标记时，该方法将调用适当的方法。例如，如果语句以开头CREATE TABLE …，则parseCreate使用标识语句起始位置的相同标记来调用该方法：

@Override
protected void parseCreate(Marker marker) {
    tokens.consume("CREATE");
    if (tokens.matches("TABLE") || tokens.matches("TEMPORARY", "TABLE")) {
        parseCreateTable(marker);
    } else if (tokens.matches("VIEW")) {
        parseCreateView(marker);
    } else if (tokens.matchesAnyOf("DATABASE", "SCHEMA")) {
        parseCreateUnknown(marker);
    } else if (tokens.matchesAnyOf("EVENT")) {
        parseCreateUnknown(marker);
    } else if (tokens.matchesAnyOf("FUNCTION", "PROCEDURE")) {
        parseCreateUnknown(marker);
    } else if (tokens.matchesAnyOf("UNIQUE", "FULLTEXT", "SPATIAL", "INDEX")) {
        parseCreateIndex(marker);
    } else if (tokens.matchesAnyOf("SERVER")) {
        parseCreateUnknown(marker);
    } else if (tokens.matchesAnyOf("TABLESPACE")) {
        parseCreateUnknown(marker);
    } else if (tokens.matchesAnyOf("TRIGGER")) {
        parseCreateUnknown(marker);
    } else {
        // It could be several possible things (including more
        // elaborate forms of those matches tried above),
        sequentially(this::parseCreateView,
                     this::parseCreateUnknown);
    }
}

在这里，该方法首先使用文字来使用令牌CREATE，然后尝试将令牌与令牌文字的各种模式进行匹配。如果找到匹配项，此方法将委托给其他更具体的解析方法。请注意框架的流畅 API 如何使理解匹配模式变得非常容易。

让我们更进一步。假设我们的 DDL 语句以开头CREATE TABLE products (，那么解析器将调用该parseCreateTable方法，再次使用相同的标记来表示语句的开头：

protected void parseCreateTable(Marker start) {
    tokens.canConsume("TEMPORARY");
    tokens.consume("TABLE");
    boolean onlyIfNotExists = tokens.canConsume("IF", "NOT", "EXISTS");
    TableId tableId = parseQualifiedTableName(start);
    if ( tokens.canConsume("LIKE")) {
        TableId originalId = parseQualifiedTableName(start);
        Table original = databaseTables.forTable(originalId);
        if ( original != null ) {
            databaseTables.overwriteTable(tableId, original.columns(),
                                          original.primaryKeyColumnNames());
        }
        consumeRemainingStatement(start);
        debugParsed(start);
        return;
    }
    if (onlyIfNotExists && databaseTables.forTable(tableId) != null) {
        // The table does exist, so we should do nothing ...
        consumeRemainingStatement(start);
        debugParsed(start);
        return;
    }
    TableEditor table = databaseTables.editOrCreateTable(tableId);

    // create_definition ...
    if (tokens.matches('(')) parseCreateDefinitionList(start, table);
    // table_options ...
    parseTableOptions(start, table);
    // partition_options ...
    if (tokens.matches("PARTITION")) {
        parsePartitionOptions(start, table);
    }
    // select_statement
    if (tokens.canConsume("AS") || tokens.canConsume("IGNORE", "AS")
        || tokens.canConsume("REPLACE", "AS")) {
        parseAsSelectStatement(start, table);
    }

    // Update the table definition ...
    databaseTables.overwriteTable(table.create());
    debugParsed(start);
}

此方法尝试镜像MySQLCREATE TABLE语法规则，其开头为：

CREATE [TEMPORARY] TABLE [IF NOT EXISTS] tbl_name
(create_definition,…)
[table_options]
[partition_options]

CREATE [TEMPORARY] TABLE [IF NOT EXISTS] tbl_name
[(create_definition,…)]
[table_options]
[partition_options]
select_statement

CREATE [TEMPORARY] TABLE [IF NOT EXISTS] tbl_name
{ LIKE old_tbl_name | (LIKE old_tbl_name) }

create_definition:
…
在我们开始之前，文字CREATE已经被消耗了parseCreateTable，所以它首先尝试消耗TEMPORARY文字（如果可用）、TABLE文字、IF NOT EXISTS片段（如果可用），然后消耗并解析表的限定名称。如果语句包含LIKE otherTable，它将使用databaseTables（这是对我们对象的引用Tables）用引用表的定义覆盖指定表的定义。否则，它会获得新表的编辑器，然后（与语法规则一样）解析create_definition片段的列表，后跟table_options、partition_options，可能还有select_statement。

查看完整的MySqlDdlParser类以了解更多详细信息。

包起来
这篇文章详细介绍了为什么 MySQL 连接器在 binlog 中使用 DDL 语句，尽管我们只触及了连接器如何使用其框架进行 DDL 解析的表面，以及如何在未来的其他 DBMS 方言的解析器中重用它。

尝试我们的教程来查看 MySQL 连接器的运行情况，并继续关注更多连接器、版本和新闻。

前端 | 深入理解Promise 酒酿泡芙1217 前端 Promise async/await javascript
1.引言JavaScript是一种单线程语言，这意味着它一次仅能执行一个任务。为了处理异步操作，JavaScript提供了回调函数，但是随着项目处理并发任务的增加，回调地狱(CallbackHell)使异步代码很难维护。为此，ES6带来了Promise给了一种更清晰的异步操作模型。2.对Promise的理解Promise是异步编程的一种解决方案，它是一个对象，可以获取异步操作的消息，他的出现大大改
Java核心与应用：Java异常处理全解析星核日记《Java 核心与应用》java python 开发语言
Java核心与应用：Java异常处理全解析“程序的世界里，异常是不可避免的。但优秀的开发者，总能优雅地处理它们。”——凌云学习目标✅掌握Java异常分类体系与继承结构✅理解Checked/Unchecked异常的设计哲学✅熟练使用异常链进行根因分析✅掌握try-with-resources的底层原理✅设计符合规范的异常体系1.Java异常处理概述在Java开发中，异常处理是保证程序健壮性的重要手段
《大数据时代“快刀”：Flink实时数据处理框架优势全解析》程序猿阿伟大数据 flink
在数字化浪潮中，数据呈爆发式增长，实时数据处理的重要性愈发凸显。从金融交易的实时风险监控，到电商平台的用户行为分析，各行业都急需能快速处理海量数据的工具。Flink作为一款开源的分布式流处理框架，在这一领域崭露头角，备受瞩目。一、真正实时，毫秒级响应与部分将流处理模拟为微批处理的框架不同，Flink是专为实时流处理打造的“原生”引擎。它直接处理持续不断的事件流，无需将数据攒成批次再处理，这种设计赋
SpringBoot——》整合knife4j详细步骤小仙。 SpringBoot springboot knife4j swagger swagger2
推荐：总结——》【SpringBoot】SpringBoot——》整合knife4j详细步骤一、在maven项目的pom.xml中引入Knife4j的依赖包二、创建Swagger配置依赖三、启动SpringBoot工程四、新建TestController.java并测试一、在maven项目的pom.xml中引入Knife4j的依赖包1、Knife4j本身已经引入了springfox，不用再单独引入
springboot整合knife4j，从此告别手写接口文档棋了个怪啊_Rachel Java进阶学习汇总 java 开发语言 knife4j
关于knife4jKnife4j的前身是swagger-bootstrap-ui,前身swagger-bootstrap-ui是一个纯swagger-ui的ui皮肤项目一开始项目初衷是为了写一个增强版本的swagger的前端ui,但是随着项目的发展,面对越来越多的个性化需求,不得不编写后端Java代码以满足新的需求,在swagger-bootstrap-ui的1.8.5~1.9.6版本之间,采用的
第一篇：数据库基础与概念猿享天开数据库数据库
第一篇：数据库基础与概念目标读者：没有接触过数据库的初学者。内容概述：在本篇文章中，我们将从零开始，详细介绍数据库的基本概念、常见的数据库管理系统（DBMS）以及数据库设计的基础知识。无论你是完全没有接触过数据库，还是对其有些模糊的印象，这篇文章都将帮助你理解数据库的核心功能和工作原理，并为你进一步深入学习数据库打下坚实的基础。一、什么是数据库？我们生活中每时每刻都在接触数据，比如：你手机上的联系
大模型开发流程 HalukiSan 语言模型
大模型开发流程参考新想法（Halukisan(Xiaoliu)(github.com)）大模型一般开发流程设计：确定目标，设计功能。这一步需要认真考虑好，这个模型应用的目标群体是谁，需求方的具体应用场景是什么，不一定每次都要一个大模型为底座。架构搭建：搭建整体架构，搭建数据库，可以参考Halukisan/ModelDataBase:Es和向量数据库Milvus的构建与数据存储(github.com
深入解析内存管理与优化：让你的程序轻松应对高负载杨胜增 java 数据库开发语言
深入解析内存管理与优化：让你的程序轻松应对高负载随着技术的发展，现代应用程序越来越复杂，处理的数据量和请求量也越来越庞大。我们在追求更高效、快速的系统时，除了优化CPU和数据库，内存的管理与优化同样是提升性能的关键。如果内存管理不当，程序可能会出现内存泄漏、溢出，甚至导致系统崩溃。因此，了解内存的工作原理及优化技巧，成为了每个开发者的必修课。在本文中，我们将全面讲解如何高效地进行内存管理，探索常见
【华为OD-E卷 - 连续出牌数量 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享华为od python java c++javascript
【华为OD-E卷-连续出牌数量100分（python、java、c++、js、c）】题目有这么一款单人卡牌游戏，牌面由颜色和数字组成，颜色为红、黄、蓝、绿中的一种，数字为0-9中的一个。游戏开始时玩家从手牌中选取一张卡牌打出，接下来如果玩家手中有和他上一次打出的手牌颜色或者数字相同的手牌，他可以继续将该手牌打出，直至手牌打光或者没有符合条件可以继续打出的手牌。现给定一副手牌，请找到最优的出牌策略，
园区智能化系统实现管理与服务的智能化转型与创新进阶快鲸智慧楼宇管理系统其他
内容概要园区智能化系统的出现，标志着管理与服务向智能化转型的重要一步。这一系统不仅仅是一个技术解决方案，更是一个全面提升园区运营效率与安全性的独特工具。通过集成大数据分析、物联网和人工智能，园区智能化系统能够为各类园区如工业园、产业园、物流园、写字楼与公寓等提供切实可行的解决方案。“智能化管理不仅是未来的发展趋势，更是提升竞争力的必要手段。”在资产管理方面，智能化系统能够实时监控并优化资源的配置，
SSM 构建个性化商铺系统：功能亮点聚焦商业成功 2402_85758349 后端 java
第二章开发技术与环境配置以Java语言为开发工具，利用了当前先进的SSM框架技术，以MyEclipse10为系统开发工具，MySQL为后台数据库，开发的一个个性化商铺系统。2.1微信开发者工具在传统web浏览器中，在加载htm15页面时先加载视图层的html和css，后加载逻辑层的javascript，然后返回数据并在浏览器中展示页面。而微信开发者工具的系统层是基于NativeSystem的，视图
Learning Vue 读书笔记 Chapter 2 追光少年3322 vue.js javascript 前端 vue3
2.Vue基本工作原理2.1VirtualDOM概念：DOM:DOM以内存中树状数据结构的形式，代表了网页上的HTML（或XML）文档内容。它充当了一个编程接口，将网页与实际的编程代码（如JavaScript）连接起来。VirtualDOM是浏览器中实际DOM的内存虚拟副本，但它更轻量且具有额外的功能。VirtualDOM工作原理：通过用户界面交互，用户向Vue传达了他们希望元素达到的状态；随后，
数据如何查询 PangPiLoLo MySQL从入门到入土数据库 sql mysql
分组查询分组查询（GroupBy）是在关系型数据库中用来对数据进行分组并对每个组应用聚合函数的一种操作。这种查询通常结合聚合函数（如COUNT、SUM、AVG、MAX、MIN等）使用，用于在查询结果中生成汇总信息特点(聚合)：输入多行,最终输出一行，且分组函数(COUNT、SUM、AVG、MAX、MIN)需要分组了才能使用，如果不进行分组则将会聚合整张表的数据语法SELECT字段1,分组/聚合函数
postgres--目录System Catalogs IT艺术家-rookie 数据库技术数据库
pg_statistic关于数据库系统（特别是PostgreSQL数据库）中的统计信息目录pg_statistic的说明。统计数据存储：pg_statistic目录存储有关数据库内容的统计数据。这些数据是由ANALYZE命令创建的，并随后被查询优化器使用。需要注意的是，即使这些统计数据是最新的，它们本质上也是近似的。统计数据条目：通常情况下，对于每个已分析的表列，会有一个条目，其中stainher
Android 安卓kts 打包按照年月日生成apk build.gradle.kts 未来之窗软件服务 android
importjava.text.SimpleDateFormatimportjava.util.*plugins{alias(libs.plugins.android.application)}android{namespace="你的软件"compileSdk=34defaultConfig{applicationId="你的id"minSdk=24targetSdk=34versionCode
Spring Boot构建mvc项目贾斯汀玛尔斯 Java spring boot mvc 后端
好的，以下是一个简单的JavaMVC（Model-View-Controller）项目示例，使用SpringBoot框架和MySQL数据库。这个项目包括基本的CRUD操作。项目结构src/└──main/├──java/│└──com/│└──example/│└──demo/│├──DemoApplication.java│├──controller/││└──UserController.ja
Kafka的内部通信协议优人ovo kafka 分布式
引言kafka内部用到的常见协议和优缺点可以看看原文Kafka用到的协议本文奖详细探究kafka核心通信协议和高性能的关键网络层通信的实现基于JavaNIO：Kafka的网络通信层主要基于JavaNIO来实现，这使得它能够高效地处理大量的连接和数据传输。在KafkaChannel类中，通过Selector来管理多个连接的读写操作，实现了非阻塞的I/O模型，能同时处理多个客户端连接，提高了系统的并发
[3069]基于JAVA的连锁饭店智慧管理系统的设计与实现阿鑫学长【毕设工场】 java 大数据人工智能课程设计毕业设计
毕业设计（论文）开题报告表姓名学院专业班级题目基于JAVA的连锁饭店智慧管理系统的设计与实现指导老师（一）选题的背景和意义选题背景和意义：在信息化高速发展的今天，餐饮行业的管理模式也在不断发生变化。传统的手工管理方式已经无法满足现代餐饮业的高效运营需求，连锁饭店智慧管理系统应运而生。基于Java的连锁饭店智慧管理系统的设计与实现，不仅可以提高工作效率，降低运营成本，还可以为顾客提供更加便捷、舒适的
Flink CDC的安装配置我的K8409 Flink flink 大数据
FlinkCDC是基于ApacheFlink构建的，用于捕获数据库表中数据的变更情况，包括数据的插入、更新和删除操作，并能将这些变更数据以流的形式实时传输到其他系统中进行处理和分析。传统的数据同步工具往往是定时任务，存在时间延迟。而FlinkCDC能实时捕获数据库的变更数据，一旦有数据变化，立即将其同步到目标系统，让数据在各个系统之间保持高度一致，几乎不存在延迟。CDC含义：变更数据捕获（Chan
CDH_6.3.2的搭建我的K8409 Flink linux 大数据分布式
一站式搭建大数据的应用1、前提条件和准备工作hostnamectlset-hostnamecdh01hostnamectlset-hostnamecdh02hostnamectlset-hostnamecdh032、修改IP和Host映射关系（所有节点）在window中也配置一下vim/etc/hosts192.168.92.201cdh01192.168.92.202cdh02192.168.9
大数据笔记之 Flink1.17 算子凡许真大数据 flink1.17 算子
文章目录前言一、Partition分区（物理分区）1.1随机分区shuffle1.2轮询分区rebalance1.3重缩放分区rescale1.4广播分区broadcast1.5全局分区global1.6keyby1.7自定义分区Custom二、transform2.1flatMap2.2filter2.3RichFunction2.4map三、Aggregate聚合3.1keyBy()3.2ma
【数据仓库】三日看尽长安花系统架构师数据仓库
数据仓库：概念、架构与应用目录什么是数据仓库数据仓库的特点数据仓库的架构3.1数据源层3.2数据集成层（ETL）3.3数据存储层3.4数据展示与应用层数据仓库的建模方法4.1星型模型4.2雪花模型4.3星座模型数据仓库与数据库的区别数据仓库的应用场景数据仓库的优缺点分析数据仓库的未来趋势总结1.什么是数据仓库数据仓库（DataWarehouse,DW）是一种用于分析和报告的数据库系统，专门为大规模
mysqlclient MacOS 使用报错 NameError: name ‘_mysql’ is not defined 流浮生日常填坑 python django mysql
背景最近使用django作为一个服务的后台，在使用mysqlclient链接mysql数据库时发生一个奇怪的报错NameError:name‘_mysql’isnotdefined下面是具体报错信息INFO]2021-04-0702:27:57,613WatchingforfilechangeswithStatReloaderExceptioninthreaddjango-main-thread:
java扫雷 2401_86161528 minesweeper java
一个使用Java编写的扫雷程序：Minesweeper.javaimportjava.util.Random;importjava.util.Scanner;publicclassMinesweeper{//定义X和Y轴的大小privatestaticfinalintX=10;privatestaticfinalintY=10;//雷数privatestaticfinalintB=10;priva
JAVA 图形界面编程 AWT篇（1）禁默 JAVA图形界面编程 java 开发语言
前言为了应对JAVA课设，小编走上了java的图形界面编程的道路，通过博客分享自己的学习历程，并进行笔记的记录。AWT（AbstractWindowToolkit）介绍AWT（抽象窗口工具包）是Java最早的图形用户界面（GUI）框架之一，主要用于构建桌面应用程序的图形界面。最初在JDK1.0版本中作为JavaGUI的核心库引入，旨在提供一个跨平台的图形用户界面工具包。AWT的最大特点是平台依赖性
2024年Python最新下载安装教程，附详细图文，持续更新 Java徐师兄 Python 教程 python 开发语言 Python 下载安装 Python 安装 Python3 下载安装教程
大家好，我是Java徐师兄，今天为大家带来的是Python3的下载安装教程，适用于所有Python3版本，感兴趣的可以看一下文章目录简介一、Python的下载1网盘下载地址(下载速度比较快，推荐）2官网下载地址二、Python的安装三推荐阅读简介Python是一种高级、解释型、面向对象的编程语言，由GuidovanRossum于20世纪90年代初开发。Python语法简洁、易读、功能强大，被广泛应
XXL-CRAWLER v1.4.0 ｜ Java爬虫框架后端爬虫java
ReleaseNotes1、【提升】爬虫JS渲染能力强化：升级提供"Selenium+ChromeDriver"方案支持JS渲染，兼容性更高，废弃旧Phantomjs方案。非JS渲染场景仍然Jsoup，速度更快。同时支持自由扩展其他实现。2、【优化】进一步优化Selenium兼容问题，完善JS渲染场景下兼容性和性能。3、【重构】重构核心功能模块，提升扩展性；修复历史代码隐藏问题，提升系统稳定习惯。
kafka自定义分区器无法接收到数据一嗷 kafka
记录一下大无语事件，今天看尚硅谷的kafka自定义分区器，结果自己编写得分区器kafka一直接收不到数据，idea里也终端没有语句输出，找了好久才发现问题。自定义分区器代码：importorg.apache.kafka.clients.producer.Partitioner;importorg.apache.kafka.common.Cluster;importjava.util.Map;pub
innodb_file_per_table weixin_34203426 数据库
MySQLInnoDB引擎默认会将所有的数据库InnoDB引擎的表数据存储在一个共享空间中：ibdata1，当增删数据库的时候，ibdata1文件不会自动收缩，单个数据库的备份也将成为问题。通常只能将数据使用mysqldump导出，然后再导入解决这个问题。在MySQL的配置文件[mysqld]部分，增加innodb_file_per_table参数，可以修改InnoDB为独立表空间模式，每个数据库
MySQL 参数- Innodb_File_Per_Table（独立表空间） csdn_life18 数据库#mysql mysql oracle 数据库
Innodb存储引擎可将所有数据存放于ibdata*的共享表空间，也可将每张表存放于独立的.ibd文件的独立表空间。共享表空间以及独立表空间都是针对数据的存储方式而言的。共享表空间某一个数据库的所有的表数据，索引文件全部放在一个文件中，默认这个共享表空间的文件路径在data目录下。默认的文件名为:ibdata1初始化为10M。优点：可以将表空间分成多个文件存放到各个磁盘上（表空间文件大小不受表大小
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

Debezium发布历史02

Create and populate our products using a single insert with many rows

Create and populate the products on hand using multiple inserts

你可能感兴趣的:(debezium,CDC,FlinkCDC,大数据,java,数据库)