巨杉数据库SequoiaDB

最佳实践6|分布式数据库HTAP混合负载最佳实践

01 前言

近年来，在金融科技的推动下，互联网金融业务蓬勃发展，金融行业数据处理呈现出新的特征，如数据量大、并发量高、处理性能高、类型繁多等。这就对海量数据的存储、并发访问及实时分析能力提出了新的要求。

另一方面来讲，“事后”分析已经不能满足快速的市场需求和业务变化，需要对海量客户行为数据的实时洞察提高营销精准度，如实时推荐等，并持续监测交易行为提高风险预警能力，如实时风控、反欺诈等。传统技术架构下的数据分析业务，其数据时效性面临着前所未有的挑战。

HTAP（混合事务/分析处理），是Gartner提出的一种新兴的应用框架，旨在打破事务处理和分析之间“壁垒”，在同一个数据库中，提供更高效的“实时业务”决策。

本次最佳实践，我们将为您展开讲解，如何利用巨杉分布式数据库SequoiaDB，实现HTAP混合事务/分析处理，实现OLTP与OLAP及资源平衡。

02 背景

2.1 业务需求变革

Gartner最新研究报告显示，操作型数据库（ODBMS），需要同时支持传统事务处理、分布式数据处理、事件/动态数据处理、交易与分析混合处理（增强型事务处理）等多种用例场景。报告中特别提到，将原有的操作和分析融合处理（HTAP）用例更改为增强型事务处理及可编程的HTAP功能，即：在维持高服务等级（SLA)事务处理的同时，嵌入分析处理（包括AI/ML）能力。

为了支撑大规模实时分析应用（如风控，实时推荐，实时数据看板，报表等），需要数据库能够同时具备OLTP和OLAP的混合负载能力。其中OLTP负载能力承载在线业务，而OLAP负载能力则直接对数据进行实时分析，以期大幅缩短决策周期，甚至提供跨业务线的综合实时分析能力。

2.2 传统OLTP/OLAP的痛点

目前在业内，实现HTAP混合负载，主要有三种技术方案：

• 单一系统同时承载混合负载（如DB2、Oracle、MySQL等）

• 使用不同系统组合+数据同步技术（如ETL、GoldenGate、CDC等）

• 同一存储不同计算引擎（如HBase+Spark等）

这些技术实现HTAP混合负载，无论何种方案，均存在一定的缺陷和短板。

数据共享难题

传统技术使用Oracle、MySQL、DB2、Informix等数据库构建业务，分离部署，数据分散存储。要实现HTAP混合负载，需要构建多套数据库，并基于一系列的数据复制技术，或基于ETL进行数据加工、转换。这样一来，不但架构的复杂性大大增加，数据传输消耗了大量的网络带宽进行数据传输。即便如此，这种跨库实现的混合负载，数据的延迟得不到有效解决。

例如一个关联查询，往往需要在不同机构实现跨库数据查询。甚至，有些数据已经使用磁带落库的方式永久封存，数据远远没有发挥出其应有价值。如何能够打通各个业务系统，把数据盘活，解决复杂的数据复制，让数据能够给业务带来新的增长点，是现在面临比较棘手的问题。

图1 OGG+Kafka实现数据复制

性能不能兼顾

事实上，传统数据库也能够实现混合负载的需求，但往往要在功能或性能上做出牺牲。对于交易场景，关注低延迟、高并发的数据增删改查，同时对ACID功能有严格的要求。这种场景一般需要使用行式存储，牺牲了海量数据访问能力，如Oracle、MySQL等。对于分析场景，主要是是大量数据扫描，甚至做聚合，对并发和延迟要求并不高，但更加关注吞吐量、容量、弹性伸缩能力，更倾向于采用列式存储，因此不得不牺牲实时更新、关联查询能力，如HBase、Oracle In-Memory等。因此，以往的HTAP混合负载技术，很难做到对交易能力和分析能力的兼顾。

扩展性难题

核心系统普遍使用“传统数据库+小型机+集中式存储”架构，扩容难度大，扩容成本也很高。从运维来说，为了保证在线交易数据库的容量，只能不断把旧的生产数据卸载到历史库，甚至封存在磁带库中，日常的数据管理工作给运维人员带来不小负担。对于HTAP业务系统，一次扩容也必然要涉及到源端和目标端，工作量巨大。另一方面，分析业务往往需要横跨在线、历史数据，甚至多业务线的数据，更需要可扩展架构，来满足不断变化的业务迭代，以及不断提升的容量需求和性能要求。

开发接口单一

以往的混合负载技术，其提供的SQL接口比较单一，一般只能提供一种SQL语法。另外，随着业务量的爆发式增长及无纸化的推进，数据库不仅仅需要保存文本数据，更多需要保存音频、影像类大对象数据。目前的技术架构，无法适应目前互联网多样化的应用、开发需求。

综上所述，以往的HTAP混合负载技术，存在明显的短板和不足。在这种条件下，具有支持多节点部署、多引擎、高扩展、高冗余等特性的分布式数据库架构，逐渐成为了HTAP技术的首选。

2.3 巨杉分布式数据库SequoiaDB的HTAP技术优势

一个HTAP数据库要实现混合负载，既要能满足上述多种技术要求，也需要能够保证不同业务之间的负载隔离。

巨杉数据库SequoiaDB，采用存算分离架构，通过统一的分布式数据库底座，融合不同的计算引擎，很好地解决了传统技术实现HTAP混合负载的各种难题：

• 轻松地在一个数据库内，提供HTAP支持，无需分库及跨库复制；

• 支持多种计算引擎，如MySQL、PostgreSQL、SparkSQL等；

• 支持跨引擎ACID，兼容标准SQL；

• 支持多种形式的负载隔离；

• 支持弹性扩展、多活容灾。

在SequoiaDB数据库中，用户可以利用复制组的多副本特性，在节点和会话等多个级别设定读写分离策略，使得不同类型的应用（联机交易、联机分析、数据中台等），采用各自的开发接口（例如 MySQL、PostgreSQL、SparkSQL等），进行数据的实时访问，且之间不产生负载干扰。

图2 SequoiaDB三副本实现HTAP

03 分布式数据库HTAP技术特性

3.1 副本

图3 巨杉数据库分布式架构

多副本机制：

• 数据分散存储在不同的数据组中；

• 主副本提供读、写服务，备副本提供只读服务；

数据组内，有多个副本，由数据库内部的一致性算法实现数据同步。

图4 数据一致性同步

3.2 负载隔离

在数据组内，设置读写访问优先级策略：

• 将MySQL、PostgreSQL引擎指向读写副本，实现高并发的数据增删查改，来承载联机交易业务；

• 将Spark引擎指向只读副本，实现数据分析、高并发查询，来承载联机分析业务；

• 为了更细化地实现隔离，还可以使SQL引擎连接到具体的某个副本上；

• 各个副本之间，没有任何负载干扰，完全实现了HTAP混合负载下的负载隔离。

图5 HTAP负载隔离

3.3 多种SQL引擎

分布式数据库支持多种SQL引擎，常见的有：

1、MySQL引擎

2、PostgreSQL引擎

3、Spark引擎

图6 三种解析器使用特征

各类引擎的特点如下：

SQL引擎

描述

适用场景

MySQL

引擎

适合精准查询、业务数据写入、柜面查询等场景

增删查改操作和普通MySQL完全一致

和MySQL语法兼容度达到100%

OLTP

PostgreSQL

引擎

以复杂SQL语法和强大的SQL编程能力见长

支持增删查改等功能，和普通PostgreSQL使用完全一致

采用外部表的方式将数据存储在分布式数据库中

OLTP

OLAP

Spark

引擎

可扩展的数据分析组件，集成了原生的内存计算

适合报表分析、大表关联查询等

提供友好、高性能的关联查询

支持标准SQL、支持JDBC访问、支持Python等接口

通过使用 Spark连接组件，来访问分布式数据库存储引擎

OLAP

04 分布式数据库HTAP最佳实践

4.1 环境描述

本文的示例中，我们选择MySQL作为OLTP引擎，SparkSQL作为OLAP分析引擎。

计算引擎可实现集群部署。MySQL和SparkSQL实例均可部署在多台服务器，对连接请求实现均衡的同时，避免了单点故障隐患；
分布式存储引擎。SequoiaDB数据库分布式存储引擎中，数据节点分布在多台服务器上，这样能够充分利用服务器的数据存储和计算能力；
网络隔离。在Spark计算引擎读写繁忙的情况下，会产生较大的网络传输从而侵占MySQL实例在线事务处理的带宽资源，因此，生产环境下建议为Spark和MySQL实例配置独立的网卡。

本次最佳实践案例的实验环境规划如下：

服务器规划：

IP地址	主机名
192.168.100.201	sdb01
192.168.100.202	sdb02
192.168.100.203	sdb03

组件部署：

节点	sdb01	sdb02	sdb03
SQL引擎	MySQL实例	PostgreSQL实例	SparkSQL实例
协调节点	协调节点	协调节点	协调节点
编目节点	编目节点（主）	编目节点	编目节点
数据节点 (副本)	数据组1-主副本	数据组1-备副本	数据组1-备副本
	数据组2-主副本	数据组2-备副本	数据组2-备副本
	数据组3-主副本	数据组3-备副本	数据组3-备副本

注：为了第4章节演示方便，本次将数据的主副本均设置到sdb01服务器。

节点

sdb01

sdb02

sdb03

SQL引擎

MySQL实例

PG实例

Spark实例

数据节点

首选连接

首选主副本

首选备副本

服务器配置：

	规格
服务器数量	3台
CPU	8 核
内存	16GB
磁盘	100GB * 3
操作系统	Centos 7.4

软件版本：

软件	版本
SequoiaDB	3.4
MySQL	5.7.25
Spark	2.3.3

4.2 过程演示

演示场景：

1、 MySQL、PostgreSQL、SparkSQL跨引擎数据操作及查询

在MySQL中，创建bills.orders表并插入数据，进行数据的增删改查操作；
在PostgreSQL、SparkSQL中查询，并验证数据正确性；

2、跨引擎Join查询

在MySQL中再创建一张表bills.customers；
在SparkSQL中进行bills.orders、bills.customers的表关联查询；
查看各个数据副本的访问统计，来验证HTAP负载隔离。

4.2.1 创建测试orders表、进行HTAP配置

1、在MySQL实例中创建表的步骤如下：

登陆MySQL实例

mysql -h 127.0.0.1 -P 3306 -uroot -proot

创建bills数据库

create database bills;use bills;

创建 bills.orders表

create table bills.orders (order_id int,customer_id int,p_date date,location varchar(100) ,primary key (order_id)    );注：在SequoiaDB数据库中， 使用MySQL引擎建表，默认即使用SequoiaDB分布式存储引擎。

2、在PostgreSQL实例中创建表

在PostgreSQL客户端创建外部表bills.orders，并映射到数据库引擎中的orders表。

//登陆PostgreSQL客户端/opt/sequoiasql/postgresql/bin/psql -p 5432 bills
//加载SequoiaDB连接驱动create extension sdb_fdw;
//配置与SequoiaDB连接参数create server sdb_server foreign data wrapper sdb_fdw options(address '192.168.100.202', service '11810', user 'sdbUserName', password 'sdbPassword', preferedinstance '1,M', transaction 'off');
//创建orders表create foreign table orders (order_id int,customer_id int,p_date date,location varchar(100)) server sdb_server options ( collectionspace 'bills', collection 'orders', decimal 'on' );

3.SparkSQL实例中创建表

在SparkSQL客户端创建外部表bills.orders，并映射到数据库引擎中的orders表。

$ 登陆spark beeline客户端/opt/spark-2.3.3-bin-hadoop2.7/bin/beeline -u 'jdbc:hive2://192.168.100.203:10000'
//创建orders表create table bills.orders (order_id int,customer_id int,p_date date,location varchar(100)  )USING com.sequoiadb.spark OPTIONS ( host '192.168.100.203:11810', collectionspace 'bills', collection 'orders',preferredinstance '2,3,S') ;
select * from bills.orders;

说明Spark中orders表创建成功。

Note:

1、Preferedinstance选项：会话读操作优先选择的策略，取值列表："M"、"S"、"A"、1-255。可以使用数组指定多个取值。"M"：可读写实例（主实例） "S"：只读实例（备实例） "A"：任意实例 1-255：通过 instanceid 指定实例 ID 的实例。

2、Instanceid，是一个数据组内，各个副本的编号，默认是0。设置该参数后，可以SQL实例中建表时，指定其访问的首选副本。

在本文中，将SQL实例的访问策略设置为：MySQL、PostgreSQL优先连接主副本，SparkSQL优先连接备副本，从而实现HTAP负载隔离。因此，还需要对所有数据组的各个副本设置其instanceid。

//本例中将主副本的instanceid设置为1，两个备副本设置为2、3.//登陆SequoiaDB存储引擎$ sdb     db = new Sdb( "192.168.100.201", 11810 )db.updateConf( { instanceid:1 }, { GroupName:"group1", NodeName:"sdb01:11830" } );db.updateConf( { instanceid:2 }, { GroupName:"group1", NodeName:"sdb02:11830" } );db.updateConf( { instanceid:3 }, { GroupName:"group1", NodeName:"sdb03:11830" } );//以group1为例，其他数据组操作类似。

4.3.2 在MySQL中插入测试数据

登陆MySQL，向bills.orders表中插入4条测试数据：

insert into bills.orders values(10001,1,"2017-06-01","Beijing");insert into bills.orders values(10002,2,"2018-06-01","Shanghai");insert into bills.orders values(10003,3,"2019-06-01","Guangzhou");insert into bills.orders values(10004,4,"2020-06-01","Shenzhen");

查看数据：

select * from bills.orders;

4.3.3 在MySQL中操作数据

在MySQL中，更新bills.orders中一条记录，并查询：

update  bills.orders  set  location="Nanjing"  where  order_id=10001;                    select * from  bills.orders;

删除bills.orders表中一条记录(order_id=100002)，并查询：

delete from bills.orders where order_id=10002;

select * from bills.orders;

4.3.4 在PostgreSQL中查询数据

登陆PostgreSQL客户端，并查询orders表数据：

/opt/sequoiasql/postgresql/bin/psql -p 5432 bills
//查询orders表数据：select * from  orders;

这说明在MySQL中的数据，在PostgreSQL中是共享的。

4.3.5 在SparkSQL中查询数据

登陆SparkSQL客户端，并查询orders表数据：

/opt/spark-2.3.3-bin-hadoop2.7/bin/beeline -u 'jdbc:hive2://192.168.100.203:10000'
//查询orders表数据：select * from   bills.orders;

这说明，MySQL中所操作的数据，在Spark SQL中是共享的。

从数据的增、删、改、查操作可以看出，数据在MySQL和PostgreSQL、SparkSQL中是完全共享的。

4.3.6 跨引擎JOIN查询

1. 创建第二张表bills.customers

MySQL中创建customers表结构：

create table bills.customers (customer_id int,customer_name varchar(100) ,gender char(1),birth_date date,primary key (customer_id)    );

Spark中创建customers表结构

create table bills.customers (customer_id int,customer_name varchar(100) ,gender char(1),birth_date date  )USING com.sequoiadb.spark OPTIONS ( host '192.168.100.203:11810', collectionspace 'bills', collection 'customers',preferredinstance '2,3,S') ;

2. 向2个表分别插入测试数据

登陆MySQL实例，向orders、customers表各插入50000条数据

//为便于插入，创建存储过程proc_insertdrop procedure if exists proc_insert;delimiter ;;create procedure proc_insert()begindeclare i bigint default 1;while i<50001doinsert into bills.orders values (i*177,i,"2018-05-09",'Beijing');insert into bills.customers values (i,'Tom','F',"2018-05-09");set i=i+1;end while ;commit;select i as "Inserted Rows of orders: ", i as " Inserted Rows customers: ";end;;
//清空现有数据，调用存储过程，插入数据delete from bills.orders;call proc_insert();;

//数据查询select count(*) from bills.orders;select count(*) from bills.customers;

至此，数据库中已存在2张表，orders表、customer表，分别有50000条数据。

3. 在Spark中进行JOIN查询

select count(*)from bills.orders o inner join bills.customers con  o.customer_id=c.customer_id ;

4.3.7 HTAP负载隔离验证

将上章节的JOIN查询连续运行10次，使用SequoiaDB的节点监控工具sdbtop，来观察各个副本的读写次数统计。

（备注：1、以数据组group1:11830为例，其他数据组效果相同；2、为了便于展示，此时重启了数据节点，将统计清零。）

sdb01上的主副本：无任何数据读取。

sdb02上的备副本：产生150472次数据读取。

sdb03上的备副本：产生150569次数据读取。

从结果可以看出：SequoiaDB的HTAP混合负载，已经通过多副本策略，实现了负载隔离效果：

• MySQL对主副本进行写入；

• SparkSQL实例对备副本进行只读查询；

• OLTP、OLAP的负载运行在不同服务器上，互相不产生干扰。

05 总结

在本文中，我们介绍了巨杉数据库SequoiaDB的HTAP最佳实践，包括HTAP混合事务/分析处理的技术原理、负载隔离策略、操作步骤等。

HTAP混合负载，意味着数据库可以同时承载在线交易业务和统计分析业务。分布式数据库，利用计算-存储分离的架构特点和访问隔离功能，结合了MySQL、PostgreSQL引擎和Spark计算引擎，使复杂的联机分析处理（OLAP）与联机交易（OLTP）处理在一个数据库中得以实现。

分布式数据库提供了多种级别的隔离策略，来实现读写分离，使不同的业务场景访问不同类型的数据副本，使得业务访问性能得到了提升。

你可能感兴趣的:(SequoiaDB巨杉数据库,数据库,分布式,运维,大数据)

Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
php 高并发下日志量巨大，如何高效采集、存储、分析贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.问题背景高并发系统每秒产生大量日志（如访问日志、错误日志、业务日志等）。单机写入、存储、分析能力有限，容易成为瓶颈。需要支持实时采集、分布式存储、快速检索与分析。2.主流架构方案一、分布式日志采集架构[应用服务器(PHP等)]|v[日志采集Agent（如Filebeat、Fluentd、Logstash）]|v[消息队列/缓冲（如Kafka、Redis、RabbitMQ）]|v[日志存储（如E
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
[特殊字符] 实时数据洪流突围战：Flink+Paimon实现毫秒级分析的架构革命（附压测报告）——日均百亿级数据处理成本降低60%的工业级方案 Lucas55555555 flink 大数据
引言：流批一体的时代拐点据阿里云2025白皮书显示，实时数据处理需求年增速达240%，但传统Lambda架构资源消耗占比超运维成本的70%。某电商平台借助Flink+Paimon重构实时数仓后，端到端延迟从分钟级压缩至800ms，计算资源节省5.6万核/月。技术红利窗口期：2025年ApachePaimon1.0正式发布，支持秒级快照与湖仓一体，成为替代Iceberg的新范式一、痛点深挖：实时数仓
RocketMQ 之死信队列 firepation RocketMQ rocketmq
在分布式消息系统中，消息的可靠传递和处理至关重要。然而，由于各种原因（如消息处理失败、消费超时等），一些消息可能无法被正常消费。这些无法被消费的消息如果不加以处理，会影响系统的稳定性和数据一致性。为了解决这一问题，RocketMQ提供了死信队列（DeadLetterQueue，DLQ）机制。本文将深入探讨RocketMQ的死信队列，包括其实现原理、应用场景以及使用示例。什么是死信队列？死信队列是一
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
什么是OA系统？使用OA系统对企业有哪些好处？
OA系统（OfficeAutomationSystem），即办公自动化系统，是将现代化办公和计算机网络功能结合起来的一种新型的办公方式。是现代企业管理中一种重要的信息化工具，它通过计算机技术、网络技术和数据库技术等手段，实现企业内部办公流程的自动化和信息化管理。使企业的信息交流更加顺畅，办公流程更加高效，从而提高企业的运营效率和管理水平。一、主要功能1.文档管理文档存储与检索：OA系统可以集中存储
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Flutter——数据库Drift开发详细教程(七) 怀君 flutter flutter 数据库
目录入门设置漂移文件入门变量数组定义表支持的列类型漂移特有的功能导入嵌套结果LIST子查询Dart互操作SQL中的Dart组件类型转换器现有的行类Dart文档注释结果类名称支持的语句自定义SQL类型定义类型使用自定义类型在Dart中在SQL中方言意识支持的SQLite扩展json1fts5地缘垄断自定义查询带有生成的api的语句自定义选择语句自定义更新语句入门Drift提供了一个dart_api来
android中百度定位、城市选择列表，右侧字母展示
好久好久没光顾过自己空空的博客了，做项目的时候都是逛着别人的博客急着把功能实现，近来闲下来了总结总结。这个城市选择功能也是当时做项目急着实现从哪找来的框架不记得了，然后改改用到项目中来的。非常感谢提供最初源码的博主，主要的区别是添加了搜索功能、定位功能，把以前的操作本地数据库sqlite的部分，改为操作对assest文件的操作，封装的有百度地图定位方法、可删除的edittext。百度地图的key需
Flutter——数据库Drift开发详细教程之迁移(九) 怀君 flutter flutter 数据库
迁移入门引导式迁移配置用法例子切换到make-migrations开发过程中手动迁移迁移后回调导出模式导出架构下一步是什么？调试导出架构的问题修复这个问题架构迁移助手自定义分步迁移转向逐步迁移手动生成测试迁移编写测试验证数据完整性在运行时验证数据库模式迁移器API一般提示迁移视图、触发器和索引复杂的迁移更改列的类型更改列约束删除列重命名列合并列添加新列入门Drift通过严格的架构确保查询类型安全。
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
【运维实战】解决 K8s 节点无法拉取 pause:3.6 镜像导致 API Server 启动失败的问题 gs80140 各种问题运维 kubernetes 容器
目录【运维实战】解决K8s节点无法拉取pause:3.6镜像导致APIServer启动失败的问题问题分析✅解决方案：替代拉取方式导入pause镜像Step1.从私有仓库拉取pause镜像Step2.重新打tag为Kubernetes默认命名Step3.导出镜像为tar包Step4.拷贝镜像到目标节点Step5.在目标节点导入镜像到containerd的k8s.io命名空间Step6.验证镜像是否导
ZooKeeper架构及应用场景详解走过冬季学习笔记 zookeeper 架构分布式
ZooKeeper是一个开源的分布式协调服务，由Apache软件基金会维护。它旨在为分布式应用提供高性能、高可用、强一致性的基础服务，解决分布式系统中常见的协调难题（如配置管理、命名服务、分布式锁、服务发现、领导者选举等）。核心软件架构ZooKeeper的架构设计围绕其核心目标（协调）而优化，主要包含以下关键组件：集群模式(Ensemble):ZooKeeper通常部署为集群（称为ensemble
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
《Python星球日记》第35天：全栈开发（综合项目） Code_流苏 Python星球日记编程项目实战 Python全栈开发 Django Flask 后端开发博客系统
名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）专栏：《Python星球日记》，限时特价订阅中ing目录一、全栈开发概述1.全栈开发的优势2.全栈开发技能组合二、博客系统项目需求分析1.功能需求2.技术栈选择3.项目结构规划三、数据库设计1.实体关系分析2.Django模型设计四、后端开发1.Django项目创建2.视图
Spring 声明式事务：从原理到实现的完整解析 Code季风 Spring详解 spring 数据库后端开发语言 java spring boot
在后端开发中，事务管理是保证数据一致性的核心机制。尤其是在复杂业务场景下，一个操作可能涉及多步数据库操作，任何一步失败都需要回滚到初始状态。Spring的声明式事务通过AOP思想，将事务管理从业务逻辑中剥离，让开发者更专注于核心业务。本文将结合实际实现，详解声明式事务的核心机制和设计思路。一、为什么需要声明式事务？在讨论实现之前，我们先明确一个问题：为什么要用声明式事务，而不是手动编写事务代码？假
【Android】安卓四大组件之内容提供者（ContentProvider）：从基础到进阶 m0_59734531 Android android Java ContentProvider 安卓四大组件
你手机里的通讯录，存储了所有联系人的信息。如果你想把这些联系人信息分享给其他App，就可以通过ContentProvider来实现。。一、什么是ContentProvider‌ContentProvider‌是Android四大组件之一，负责实现‌跨应用程序的数据共享与访问‌，通过统一接口封装数据存储细节，提供标准化操作方式。其中主要功能包括：数据抽象层：将应用内部的数据（如SQLite数据库、文
400多个免费在线编程与计算机科学课程 zhufafa 基础理论课程理论计算机基础免费
来源：medium作者：DhawalShah五年前，麻省理工学院和斯坦福大学等学校首先向公众开放免费的在线课程。如今，全球有700多所学校创造了数以千计的免费在线课程。从入门到精通系列，是作者通过ClassCentral的课程数据库整理的400多个免费在线课程的简介和链接（来源于ClassCentral，一个在线课程搜索引擎），根据课程难度分为入门、进阶和高阶三大类，每门课程还有星级评分（统计自C
AnythingLLM教程系列之 12 AnythingLLM 上的 Ollama 与 MySQL+PostgreSQL 知识大胖 NVIDIA GPU和大语言模型开发教程 mysql postgresql 数据库 anythingllm ollama
简介一款全栈应用程序，可让您将任何文档、资源或内容转换为上下文，任何LLM都可以在聊天期间将其用作参考。此应用程序允许您选择要使用的LLM或矢量数据库，并支持多用户管理和权限。本文将介绍如何在AnythingLLM上将Ollama与MySQL+PostgreSQL连接起来。系列文章如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI应用程序，可以执行RAG、A
AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 anythingllm llm
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志，以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型（教程含安装步骤）知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 ai anythinllm llama
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
Java实习模拟面试之安徽九德 —— 面向对象编程、Spring框架与数据库技术详解培风图南以星河揽胜 java面试 java 面试 spring
关键词：Java实习生、模拟面试、安徽九德、SpringBoot、MySQL、Redis、面向对象编程、团队协作一、前言作为一名计算机相关专业的学生，想要顺利进入一家互联网公司或软件开发企业实习，技术面试是必须面对的一道门槛。本文将带你走进一场真实的Java实习生模拟面试场景，以“安徽九德”公司为背景，围绕其发布的招聘岗位要求，进行一次全方位的技术面试演练。本次模拟面试涵盖以下核心知识点：Java
为什么你的服务器总被攻击？运维老兵的深度分析
作为运维人员，最头疼的莫过于服务器在毫无征兆的情况下变得异常缓慢、服务中断，甚至数据泄露。事后查看日志，常常发现一些“莫名其妙”的攻击痕迹。为什么服务器会成为攻击者的目标？这些攻击又是如何悄无声息发生的？今天，我们就从实战角度分析几种常见且容易被忽视的攻击模式，并教你如何通过日志分析初步定位问题。一、服务器被攻击的常见“莫名其妙”原因“扫楼式”探测与弱口令爆破：现象：服务器CPU、内存无明显异常，
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name