时空大数据小组

时序数据库系列10-SQL引擎

前言

SQL语言是一种申明式的语言，不要求用户具备大量的程序语言基础和编程逻辑思维，只需要使用SQL语言准确表达想获取的最终结果，因此使用门槛比较低。并且SQL语言的规范当前已经比较成熟，几乎很少会变化，带来了使用上的稳定性。因此，对于数据库而言，为了其易用性和用户的广泛性，大部分的数据库产品都会提供SQL语言的接口。

时序数据库作为数据库的一种特殊类型，也具有广大用户对SQL语言支持的强烈诉求。

时序数据库	是否支持SQL
TDEngine	支持
TimeScale	支持
GaussDB	支持
IOTDB	类SQL语言
influxDB	类SQL语言
DolphinDB	类SQL语言
openTSDB	不支持

上图是常见的几款时序数据库对SQL的支持度，可见，大部分的的时序数据库都支持或者部分支持SQL语言，SQL引擎作为数据库的关键必要模块，扮演非常重要的角色，对使用的友好性、代码可扩展性、执行的效率等方面都具有重大意义，一个好的SQL引擎不会受限于用户编写的SQL语句的形式，根据其SQL语句原始表达的结果，优化其执行过程，最终准确、高效、快速的返回。

下面简单介绍在时序数据库中设计和开发一个SQL引擎的相关技术。

时序数据库SQL引擎设计

时序数据库作为数据库的一种，其SQL引擎也是由解析器、逻辑计划、物理计划、优化器等关键组件组成。

SQL引擎负责将SQL语句转换成执行计划，输入到执行器中高效运行，获得返回结果。

SQL引擎的功能一般可以拆解成几个步骤：

解析器，负责将用户输入的SQL语句解析成AST抽象语法树
逻辑计划生成，通过语法分析，生成具有执行层次结构的逻辑计划树，描述了各个算子的依赖逻辑关系，并没有考虑实际执行
物理计划生成，在逻辑计划的基础上进行优化，生成考虑了底层实现和逻辑的物理计划
物理计划可以作为执行器的输入，执行后获取结果。

下面将分别解析SQL引擎中的各个核心组成。

解析器

SQL解析器（Parser）负责将SQL进行词法分析、语法分析，最终生成AST抽象语法树。

词法分析：用户输入的SQL语句为一个字符串，从中识别出系统支持的关键字、标识符、运算符、终结符等，确定每个词的固有词性。即，负责分词、识别。

语法分析：根据SQL的标准定义语法规则，使用词法分析中产生的词去匹配语法规则，如果一个 SQL 语句能够成功匹配一个语法规则，则生成对应的抽象语法树（Abstract Syntax Tree，AST）, AST用于在程序内部结构化的表达SQL的语义。

Parser的常用工具包括两种，分别为ANTLR和Calcite，可以根据需要将用户的SQL语句自动转换为AST，给开发提供了方便。简单介绍下两个工具：

ANTLR

可以根据输入自动生成语法树并可视化的显示出来的开源语法分析器，不仅局限于解析sql，也可以分析任意定义好的语法

如何使用ANTLR需要以下几步：
- 定义词法和语法的g4文件，g4文件描述输入的SQL按照什么规则进行解析，即解析的规则由用户制定。
- 编写SQL解析逻辑类，如何使用AST的结果需要用户编写
- 主服务调用SQL解析逻辑类，获取解析结果
Calcite

是一款开源SQL解析工具, 可以将各种SQL语句解析成抽象语法术AST(Abstract Syntax Tree), 之后通过操作AST就可以把SQL中所要表达的算法与关系体现在具体代码之中。Calcite已经封装好了很多功能，SQL解析、SQL校验、SQL优化等

Calcite解析SQL的流程相比较ANTLR是比较简单的，开发中无需关注词法和语法文件的定义和编写，只需关注具体的业务逻辑实现。

我们拿到sql时它只是一个字符串，java识别也是一个字符串，除了做一些字符串的操作外我们做不了其他事情。calcite在对这个字符串进行解析的时候将其封装到了自己定义的一个抽象语法树中，这个AST抽象语法树是由若干 Select、From、Where、Join等类递归构建的，其父类为SqlNode，即 calcite将String转换成了SqlNode组成的树结构中，原本仅仅是一个字符串的sql，calcite将其转化成了SqlNode，方便可以递归的去访问SqlNode拿到一些特定内容。

综上，ANTLR工具是一个词法语法的解析器，不专门针对SQL语言，具备较好的扩展性，自己实现会比较灵活，但是使用门槛会高一些，开发需要参与度比较高。Calcite是一个专门的开源SQL解析工具，并且已经在原始SQL输入上做了结构树的转换和优化，相当于在原始的语义树上做了一层Node的封装，方便直接集成和使用。因此，如果想自己去解析实现灵活的关系解析，则可能使用Antlr工具更加适合一些，可以将原始依赖关系解析为项目定义抽象语法树，为后面的分析优化工作做好准备。如果是考虑门槛和易用性，减小编码工作，推荐使用Calcite，利用其转换好的语法树，方便提取其结构关系，并且也省去了一些优化和封装的工作。

逻辑计划

解析器的生成的AST抽象语法树只有语法上的逻辑关系，对AST进行进一步分析，如对语法树进行有效性检查，检查语法树中对应的表、列、函数、表达式是否有对应的元数据，将抽象语法树转换为逻辑执行计划。

因此逻辑计划不再是单纯语法上的依赖关系，而是与项目系统结合的、能够获得准确结果的查询计划。但这只是能够正确性获得结果、对原始语义的初步整理，比如用户输入的一个冗余、性能低下的sql语句，逻辑计划会按照用户输入组织逻辑树的构建，并不会考虑底层是否需要分布式执行、是否删除一些冗余无用步骤、是否将用户用不到的数据提前去除，因此对逻辑计划后续的优化处理，就给交了物理计划生成步骤。

物理计划

物理计划是在逻辑计划的基础上进行的改进优化，很多系统中，逻辑计划树和物理计划树的节点对象类型都是相同的，在逻辑计划树的基础上，进行合并节点、替换节点、增加节点、删除节点，移动节点等操作，使得逻辑树的结构变得简洁，便于高效的执行，优化后的计划成为物理计划。

对逻辑树的节点变换，可以是基于原始逻辑树的等价转换，也可以考虑底层系统实现的物理特点，最终的目的是为了保证用户得到正确性的结果的前提下，让SQL执行变得简单、快速、高效，在磁盘IO、计算步骤顺序、排序规则、分布式系统的数据交换等方面做一些改进，让用户即使在编写了一个看似性能低下、不优雅的情况下，系统也能“智慧”的想出高效执行的方法，好的SQL引擎一定是不太受限于用户的SQL组织方式的。

计划优化器

计划优化器Optimizer，即对物理计划进行优化的组件，目的是为了更好的服务于SQL执行引擎。优化器在很大程度上决定了一个系统的性能。

要设计一个好的SQL引擎，最核心的问题之一是如何更好的优化这棵语义树。从字符输入的SQL语句，生成的AST抽象语法树，最终到执行的物理计划。要较好的实现这个系统，其一是如何优雅、可扩展的将AST转换为项目方便使用的语义树，即逻辑树，其二是如何优化这棵逻辑树，转换为物理计划树，便于给到执行器准确、高效的执行。

优化器的优化工作一般可分为两类，基于规则的RBO（Rule Based Optimization）和基于成本的CBO（cost Based Optimization），目的都是寻找执行的最优路径，使得消耗的资源、时间、代价较小，使得整个引擎的执行效率较高，直接影响整个数据库的执行效率，这里不再具体展开。

总之，时序数据库的SQL引擎，因为底层存储的时序特点，在SQL引擎侧会支持时序函数，比如聚合、降采样、其他时序相关的函数。因此在词法语法层需要添加对这些时序函数的支持，然后转换为相应的逻辑计划，按照底层时序模型的存储设计对逻辑计划进行优化，生成最终的物理计划。

举一个例子，我们在自研时序数据库中合入了时空特点，即支持时空的写入和查询，需要在ANTRL解析器层支持Point数据类型和BBOX的查询语义，首先先定义好词法和语法文件，然后使用对语法树进行解析生成特定的时空相关逻辑计划，然后对逻辑计划进行转换和优化，生成物理计划，根据计划的时空类型先查询时空索引，再查询时序文件。这个过程中，需要从词法语法到底层执行逻辑，需要进行良好的抽象和优化，这基于一个良好的可扩展的架构来统一管理时空相关计划。

下面以IOTDB时序数据库为例，介绍其SQL查询引擎的MPP框架。

IOTDB时序数据库SQL引擎

IOTDB是一款时序数据库，其在2022年发布了原生分布式版本，在此版本中，实现了全新的MPP查询框架，遵循了传统关系型数据库的规则，定义出基础的查询算子，每种查询由多个查询算子组合而成，具有框架统一、易扩展、较好抽象等优点。

下面对其MPP查询框架作一个概览介绍。

主要流程

IOTDB的SQL引擎可以分为三个模块，首先原始SQL经过Parser解析器转换为语义树，然后再经过Analyzer分析语义树，这里考虑了项目内的元数据等信息，经过校验、构造等转换为逻辑计划，最后通过Optimizer优化器，对逻辑计划进行优化，转换为分布式的物理计划DistributedQueryPlan,分布式物理计划进行SubPlan构建，发送到各个机器节点进行真正执行。

在理论概念中，计划优化可以分为对逻辑计划的优化和对物理计划的优化，而两者实际比较难进行概念上的完全切分，因此一些系统中，都是进行一轮优化，直接将逻辑计划进行统一优化转换，以尽可能快速和高效的完成转换，不过IOTDB也对物理计划的优化预留了一个接口。

SQL解析

IOTDB使用了ANTLR作为其解析SQL的工具，定义了内容丰富的g4文件，可以方便的获得原始抽象语法树AST，这个AST是工具的产物，代表原始语义的逻辑关系，不便于后续方便的获取结构内容，因此IOTDB对此进行了一次封装，通过ASTVisitor遍历AST,转换为项目可用的语法树，这个转换后的语法树的节点类型为StatementNode,是所有Statement、component、Expression的父类，至此，所有项目需要用到的对象都成功实例化，并且具有树形结构的逻辑关系。

逻辑计划

对SQL解析后的项目对象结构树进行分析和解析，使用AnalyzeVisitor对象遍历AST，将构建逻辑树需要的对象封装到Analysis对象中。然后使用LogicalPlanVisitor（analysis）遍历器遍历节点，根据Analysis对象生成逻辑计划，逻辑计划将原来的StatementNode转换为PlanNode，也使用树形结构的逻辑结构表示依赖关系，这里完成了LogicalPlan的转换。

物理计划

这里分析IOTDB的第一个分布式版本，即物理计划是分布式计划。

使用查询为例，其物理计划为DistributedQueryPlan。

首先对逻辑计划进行rewriteSource重写节点
通过addExchangeNode添加shuffle节点，构建了一棵经过调整的计划树
然后使用优化器对树进行优化，当前只实现了LimitOffsetPushDown这个优化器，对特定条件下的查询语句能够进行谓词下推计算。
进行计划切分，将计划树拆解成许多的子计划subPlan，以ExchangeNode为分界起始节点，创建一个新的SubPlan，以此实现子计划划分。SubPlan也是一个树形结构，维护着拆分PlanFragment信息，PlanFragment是原始树拆分后的部分结构。至此，完成对计划树的分块切分。示意图如下图。
将拆分后的PlanFragmentz转化为待执行的FragmentInstance,为了分布式的执行，这里会得到多个FragmentInstance。至此，成功构建了DistributedQueryPlan，维护了分布式执行需要的FragmentInstance，SubPlan等对象，给到集群调度，分配给各个子节点执行。

以上，对IOTDB的MPP分布式查询引擎做了简单介绍，其对各个语法和算子做了良好的封装和抽象，并且自始至终都维护着统一方式的树形结构，各个模块界限明确，在此架构上做的调整和修改都不会带来很大的架构调整，值得借鉴和学习。

小结

设计和开发时序数据库的SQL引擎，可以借鉴成熟的SQL引擎设计，选择合适的解析器工具，设计架构时，需要重点考虑函数的可扩展性，对功能的抽象，从一开始设计就应该考虑全面，不然增加一个新功能会需要大量的改动；另外，需要重点考虑和设计执行计划的优化，使用较少代价寻得最优查询路径，对原始树结构做较优的转换和裁剪；希望以上介绍对大家了解时序数据库SQL引擎的设计有所帮助。

参考资料：

1.https://www.jianshu.com/p/187c1ee85262

2.https://zhuanlan.zhihu.com/p/48735419

3.https://zhuanlan.zhihu.com/p/100949808

4.https://zhuanlan.zhihu.com/p/40478975

5.https://github.com/apache/iotdb

6.https://www.makeyourchoice.cn/archives/530/

更多内容，敬请关注同名微信公众号：时空大数据兴趣小组。

《炸裂！掌握这些 Spring Boot 干货，面试直接 “开挂”！》 @孤随 JAVA spring boot 面试后端
SpringBoot重点、面试题及答案详细整理一、SpringBoot重点知识（一）核心概念1.自动配置SpringBoot自动配置基于类路径中的依赖、配置文件以及应用上下文里的Bean情况，借助条件注解来自动设置Spring应用的配置。例如，当类路径中存在spring-data-jpa和数据库驱动时，会自动配置数据源、JPA实体管理器工厂和事务管理器。可通过@EnableAutoConfigur
加密通信实验遮天华月网络
加密通信实验作业罢了。实验内容学习理解网络通信学习数据加密和解密开发网络通信的客户端程序、服务器端程序，实现客户端将传输的网络数据进行加密、服务器端将收到的加密数据进行解密，在客户端和服务器端间传输加密数据。需要对比发送的数据、接受的数据是否一致，验证网络传输的正确性；需要对比两端的明文数据、密文数据是否一致，验证加密、解密的正确性。本文使用套接字+多线程的方式完成服务器通信，编程语言为Pytho
python+postgresql+psycopg2实现自动化数据库生成（数据库迁移） bao1771148504 数据库 postgresql 自动化 python
python+pgsql+psycopg2实现一键数据库生成1.tipsNavcat转储sql文件，存在主键自增，加入下面代码。CREATESEQUENCEIFNOTEXISTSt表名_id_seqSTART1000;手动导入表不全时，也请检查主键自增情况，加入上面代码。importpsycopg2frompsycopg2.extensionsimportISOLATION_LEVEL_AUTOC
Oracle Alert 日志频繁告警 12170 TNS-12535/TNS-00505，我看看怎么个事儿？ Lucifer三思而后行 DBA 实战系列 oracle 数据库
大家好，这里是公众号DBA学习之路，致力于分享数据库领域相关知识。目录前言问题描述问题重现解决方案调整防火墙调整Oracle参数治标不治本写在最后前言节后巡检一套Oracle11GR2的库，发现alert日志很大，于是看看alert日志里都记录了啥？好家伙，一打开日志发现全是告警TNS-12170/12535/12560/00505，一眼刷不到头：*************************
【Linux】 TCP短服务编写和守护进程杰瑞的猫^_^ Linux linux tcp/ip 守护进程进程组
文章目录TCP短服务编写流程进程组和会话和守护进程TCP短服务编写流程 TCP服务器是面向连接的，客户端在发送数据之前需要先与服务器建立连接。因此，TCP服务器需要能够监听客户端的连接请求。为了实现这一功能，需要将TCP服务器创建的套接字设置为监听状态，以便等待和处理客户端的连接请求。服务器在完成监听工作后，才算初始化完成。客户端在创建套接字后，使用connect函数向服务器发起连接请求，而
智能图像处理平台：技术融合与实践的结晶顾北辰20 智能图像处理平台图像处理人工智能
目录项目目标项目功能用户模块图像处理模块异步任务模块技术栈数据库设计核心功能实现方式图片上传图片处理异步任务项目扩展近日DeepSeek很火，我让他给我出了个小项目练练手，带大家一起做一下，可做为毕业设计参考。在当今数字化时代，图像处理技术广泛应用于各个领域，从医学影像到社交媒体，其重要性不言而喻。本文将介绍一个智能图像处理平台的练手项目，旨在巩固Java、MySQL、SpringBoot、Red
基于Knative的无服务器引擎重构：实现毫秒级冷启动的云原生应用浪潮桂月二二云原生 knative serverless
引言：从微服务到无状态的量子跃迁当容器启动时间仍困在900ms高位时，某视频直播平台采用Knative将突发流量处理时效提升40倍，弹性扩缩响应速度突破至120ms级。基于流量预测的预启动算法与内核级资源复用池两大技术创新，正在重新定义Serverless时代的性能边界。IDC最新报告指出，采用该架构的企业资源利用率平均提升至78%，年度计算成本直降320万美元。一、传统FaaS模型的性能桎梏1.
ubuntu下安装TFTP服务器 luoqice linux编程技巧 linux 服务器
在Ubuntu系统下安装和配置TFTP（TrivialFileTransferProtocol）服务器可以按照以下步骤进行：1.安装TFTP服务器软件包TFTP服务器通常使用tftpd-hpa软件包，你可以使用以下命令进行安装：sudoaptupdatesudoaptinstalltftpd-hpa2.配置TFTP服务器安装完成后，需要对TFTP服务器进行配置。配置文件位于/etc/default
Elasticsearch详解久梦歌行 elasticsearch jenkins 大数据
Elasticsearch是什么Elasticsearch是使用Lucene为基础建立的开源可用全文搜索引擎，它可以快速地储存、搜索和分析海量数据Elasticsearch的特点和传统的关系数据库对比关系型数据库查询性能，数据量超过百万级千万级之后下降厉害，本质是索引的算法效率不行，B+树算法不如倒排索引算法高效。关系型数据库索引最左原则限制，查询条件字段不能任意组合，否则索引失效，相反Elast
Windows环境下es8的集群部署想养一只萨摩耶～ Elasticsearch elasticsearch 大数据服务器
原创文章：Windows环境下es8的集群部署–编程屋目录1相关概念1.1单机集群1.2集群Cluster1.3节点Node2Windows下部署2.1节点node-10012.2节点node-10022.3节点node-10031相关概念1.1单机集群单台Elasticsearch服务器提供服务，往往都有最大的负载能力，超过这个阀值，服务器新能就会大大降低不可用，所以生产环境中，一般都是运行在指
List把特定元素排在第一位 inner_peace8 Java 总结集合 List把特定元素排在第一位
人工智能，零基础入门！http://www.captainbed.net/inner有的时候会有这样的需求，就是从数据库查出来的list要做一些处理，比如部门成员列表，产品要求你把部门经理排在第一位，这个时候就可以用集合工具类下的自带方法，做法：需要遍历集合，找到这个元素在集合中的位置，然后使用Collections.swap(list,o,i)（O：为元素目前所在位置，i：为要放置的位置）方法来
Java 集成MySQL+MyBatis实战（含代码） C_V_Better java mysql 架构设计 java mysql mybatis 后端数据库
在Java开发中，MyBatis是一个功能强大的持久层框架，它支持定制化SQL、存储过程以及高级映射。MyBatis避免了几乎所有的JDBC代码和手动设置参数以及获取结果集。MyBatis使用简单的XML或注解用于配置和原始映射，将接口和Java的POJOs映射成数据库中的记录。本文将通过实战案例，详细展示如何使用MyBatis集成MySQL，实现对数据库的增删改查操作。一、环境准备在开始编写代码
七.工控之工控机专题小何的Blog 工控工控工控机 C#上位机
1.防止工控机突然断电导致数据丢失防止工控机突然断电问题后，数据无法及时保存在磁盘问题，可以有如下2种举措：安装UPS电源。添加磁盘阵列功能。2.CPU选择Intel的E系列CPU是服务器专用，主打超长时间稳定运行，多线程任务处理，而Intel的I系列CPU是桌面级的，主打游戏娱乐、办公设计。这个是完全不同的两个产品线，没有好坏之分，服务器就E，普通电脑就I。因此在工业领域，尤其是一些对电脑、系统
多线程并发模拟实现与分析：基于Scapy的TCP SYN洪水攻击实验研究键盘侠伍十七 tcp/ip 网络协议网络网络安全 python syn flood
简介实现基于Python实现的多线程TCPSYN洪水攻击。该实例利用Scapy库构造并发送TCPSYN数据包，通过多线程技术模拟并发的网络攻击行为。实现原理SYNFlood攻击是一种经典的分布式拒绝服务（DDoS）攻击方式，利用了TCP协议握手过程中的弱点。TCP三次握手过程在正常情况下，TCP建立连接需要经过以下三个步骤的交互：客户端发送SYN：客户端向服务器发送一个同步（SYN）段，其中包含客
PHP 数据库操作：以 MySQL 为例来恩1003 PHP 从入门到精通数据库 php mysql
PHP学习资料PHP学习资料PHP学习资料在PHP应用开发中，与数据库进行交互是一项核心任务。MySQL作为一种广泛使用的关系型数据库管理系统，和PHP搭配默契，为开发者提供了强大的数据存储和管理能力。接下来，我们将详细讲解如何使用PHP进行MySQL数据库的连接、查询、插入、更新、删除等操作，以及数据库事务处理。一、数据库连接在PHP中，使用mysqli扩展（面向对象风格）或mysql扩展（过程
python3安装mysql连接_Python3使用PyMySQL连接MySQL weixin_39814925
前提介绍：【功能实现】：1.登录本地MySQLServer创建数据库和表，Python3使用PyMySQL连接本地MySQL服务器，实现对数据库的表进行简单Insert操作。【软件配置】：1.MySQL服务器：MySQL8.0.202.Pymsql版本：Pymsql0.9.33.Python版本：Python34.NavicatforMySQL版本:Navicat115.PyCharm版本:PyC
geojson 导入mysql_导入GeoJSON数据到SQL Server数据库中冠位咕哒子 geojson 导入mysql
导入GeoJSON数据到SQLServer数据库中GeoJSON是GIS行业里一种常见的数据交换格式，能够存储结构化的空间地理信息。因为SQLServer从2008版开始提供了空间数据类型geometry与geography的支持，所以我也试着将项目中用到的地图数据转换到数据库中，方便之后的调用。因为中途遇到了不少坑，所以写了这篇文章作为备忘。事前准备：了解GeoJSON与SQLServer的空间
C#、ASP、ASP.NET、.NET、ASP.NET CORE区别、ASP.NET Core其概念和特点、ASP.NET Core个人心得体会手中的风筝664 c#asp.net .net
C#是一种面向对象的编程语言，主要用于开发跨平台的应用程序。它是.NET框架的一部分，并且可以在.NET平台上运行。ASP（ActiveServerPages）是一种用于构建动态Web页面的技术，使用VBScript或JScript作为服务器端脚本语言。它是早期的Microsoft技术，现已逐渐过时。ASP.NET是微软推出的下一代Web应用程序开发技术，它提供了更强大、更高效的功能和工具。ASP
网络软件架构设计与架构风格深入解析.zip 满天乱走
本文还有配套的精品资源，点击获取简介：《架构风格与基于网络的软件架构设计》一书提供了关于如何构建高效、可扩展网络系统的重要见解。文档详细介绍了架构风格的核心概念及其在网络软件设计中的应用，包括分布式系统特性的考量、可扩展性策略、安全性、性能优化和维护性等方面。本书通过分析如客户端-服务器、SOA和微服务等架构风格，指导开发者理解并复用成功的设计模式，同时强调安全性和性能优化在架构设计中的重要性，最
python股票分析系统部署操作过程及代码实现大懒猫软件 python 开发语言 flask plotly api restful
部署一个股票分析系统涉及多个步骤，包括后端服务、前端界面和实时数据更新。以下是一个详细的部署过程，涵盖从代码编写到服务器部署的完整步骤。1.系统架构概述后端：使用Flask提供RESTfulAPI和数据处理服务。前端：使用PlotlyDash构建动态界面，实时显示股票价格走势。数据源：从金融数据API（如AlphaVantage、YahooFinance）获取实时数据。2.系统开发步骤2.1安装必
国内十大工业物联网平台分析报告(2025年) CServer_01 工业物联网工业物联网平台工业物联网平台选型物联网
目录1、工业物联网简介1.1、引言1.2、工业物联网平台架构1.3、工业物联网平台核心功能2、工业物联网发展趋势2.1、总体趋势2.2、技术趋势2.3、市场发展趋势2.4、应用趋势3、工业物联网平台市场预测3.1、工业物联网平台3.2、DCS3.3、实时数据库3.4、SCADA3.5、数字孪生3.6、设备全生命周期管理系统4、主要工业物联网平台供应商介绍4.1、蓝卓4.2、涂鸦智能4.3、中服云4
【SpringBoot4】如何理解SpringBoot的约定大于配置纵横千里，捭阖四方 spring家族一个项目征服Java spring java 后端
今天我们来谈谈SpringBoot到底给我们带来了什么以及如何做的。目录1.指导思想：约定大于配置2.SpringBoot的依赖管理3.小结1.指导思想：约定大于配置Spring的优势是帮助我们管理Bean类，并且集成大量的组件，例如连接数据库、网络通信、甚至Tomcat都可以，但是我们在使用Spring的时候还需要写大量的配置文件，例如定义谁依赖谁等等。当我们的业务代码比较多的时候，这个配置简直
Hbase深入浅出天才之上数据存储 Hbase 大数据存储
目录HBase在大数据生态圈中的位置HBase与传统关系数据库的区别HBase相关的模块以及HBase表格的特性HBase的使用建议Phoenix的使用总结HBase在大数据生态圈中的位置提到大数据的存储，大多数人首先联想到的是Hadoop和Hadoop中的HDFS模块。大家熟知的Spark、以及Hadoop的MapReduce，可以理解为一种计算框架。而HDFS，我们可以认为是为计算框架服务的存
深入浅出了解HBase及RDD编程山海王子大数据 hbase
深入浅出了解HBaseHBase简介架构HBase是什么样的数据库？关键是数据模型关键要素：什么是单元格时间戳的功能是什么？HBase为什么能存储海量数据创建一个HBase表配置Spark编写程序读取HBase数据编写程序向HBase写入数据关于搭建HBase高可用集群的图文教程，可参考我的另一篇博文——安装并配置HBase集群（5个节点）。HBase简介HBase是GoogleBigTable的
HBase简介：高效分布式数据存储和处理代码指四方分布式 hbase 数据库大数据
HBase简介：高效分布式数据存储和处理HBase是一个高效的、可扩展的分布式数据库，它是构建在ApacheHadoop之上的开源项目。HBase的设计目标是为大规模数据存储和处理提供高吞吐量和低延迟的解决方案。它可以在成百上千台服务器上运行，并能够处理海量的结构化和半结构化数据。HBase的核心特点包括：分布式存储：HBase使用Hadoop分布式文件系统（HDFS）作为底层存储，数据被分布在集
网络安全-攻击流程-应用层星河776(重名区分) 网络安全 web安全安全
应用层攻击针对OSI模型的第七层（应用层），主要利用协议漏洞、业务逻辑缺陷或用户交互弱点，直接威胁Web应用、API、数据库等服务。以下是常见应用层攻击类型及其流程，以及防御措施：1.SQL注入（SQLInjection）攻击流程：漏洞探测：攻击者向输入字段（如登录框、搜索栏）提交试探性SQL语句（如'OR1=1--）。语句构造：若应用未过滤输入，恶意SQL语句被拼接至数据库查询中。数据窃取/篡改
Amazon ec2 云服务免费一年无己心
国内的小伙伴用惯了阿里云的服务，但是国外的机房是不是没有机会体验一下。现在亚马逊有一年的免费体验，可以尝试一下，服务器在国外的好处就不多说了，运维国外应用服务，代理服务这些都可以玩起来了，下面简单介绍一下如果去把Amazon的ec2云服务给耍起来注册账户注册地址如下：点击这里然后按照流程一步一步填写用户信息填写信用卡信息，信用卡账单这个应该随便填都ok的不过要都是英文字母。visa/master的
基于AWS云平台的法律AI应用系统开发方案 weixin_30777913 aws 云计算人工智能 python
该方案可实现法律文档处理速度提升300%+，关键信息提取准确率可达92%以上（基于实际测试数据），适合构建企业级法律智能中台。建议采用分阶段实施策略，优先实现文档解析和智能问答模块。一、技术栈规划层级技术组件说明存储层AWSS3AmazonOpenSearch(向量数据库)存储原始PDF文件支持向量检索的法律知识库AI服务层OpenAIGPT-4APIAmazonSageMaker(LLM微调)A
MongoDB 云上数据迁移之纯手工操作实用教程 shijin23 文档型数据库服务华为云数据库免费迁移数据复制服务DRS 华为华为华为云数据库 MongoDB 数据库迁移
我们为用户提供MongoDB服务的过程中，发现很多用户都有在云服务商之间迁移数据的需求。在没有专业迁移工具的时候，如何实现数据库跨云迁移？今天我们就分享下利用开源工具进行纯手工操作MongoDB数据库迁移的方案。本方案基于MongoDB3.2.7版本进行讨论，迁移目标数据库为华为云DDS数据库，源库为自建或其他云服务商MongoDB数据库。注意：本篇文章涉及的迁移方案是特定场景下的一种方案，有其局
银河麒麟系统V10（arm版）离线安装postgresql说明爱T小毛驴 arm开发 postgresql 数据库
#银河麒麟系统#,#arm版操作系统）#随着2024年微软全球蓝屏丑闻的出现，系统安全越来越重要。目前很多企业开始尝试国产化操作系统上，本文介绍如何在国产化银河麒麟系统V10（arm）版上安装postgresql数据库，方便后续程序开发和环境部署。本资源使用的是arm版本的postgresql的docker镜像，能够在arm版国产化银河麒麟系统上进行安装。安装步骤如下：（1）导入镜像文件（找到po
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比