z_stand

YugaByteDB -- 全新的 “PostgreSQL“ 存储层

文章目录

- 0 背景
- 1 架构
- - 1.1 Master
  - 1.2 TServer
  - 1.3 Tablet
- 2 读写链路
- - 2.1 DDL
  - 2.2 DML
  - 2.3 事务
- 3 KEY 的设计
- 4 Rocksdb 在 YB 中的一些实践
- 总结

0 背景

YugaByteDB 的诞生也是抓住了 spanner 推行的NewSQL 浪潮的尾巴，以 PG 生态为基础用C++实现的支持 SQL 以及 CQL 语法的数据库。
设计之初的目标如下：

提供一致性能力。通过分布式事务提供线性一致性写，在 SQL 场景，提供 Seriable, Repeatable Read, Read Committed。在 CQL 场景仅提供 Repeatable Read.
提供通用的查询接口。业界主流的是以RDBMS 为主的结构化数据的查询接口 SQL 以及非结构化数据的查询接口 CQL(nosql 体系, cassandra 的查询语言，redis协议等)。这两种接口 YugaByteDB都支持了。
提供高性能。
全球部署能力。提供跨 Zone 地域，跨 Region 大洲级别的部署以及对应的数据复制能力，还有多云部署。
云原生架构。可以在任何的公有云/私有云、物理机、容器、虚拟机或者其他商用硬件上部署。没有外部硬件的依赖，比如原子钟；Kubernetes 的容器化调度也已经完全支持；开源。

后续的介绍对 YugaByteDB 统一称为 YB。

YB 的查询层主要是 YSQL和YCQL 层，YCQL 没有专门的查询优化器和执行器，只有一个语法解析器。YSQL 则复用的 PG的查询引擎，包括 parser,optimizer 和 executor。

YB 架构的核心是在存储层，当然也在向提供AP服务的 mpp 的引擎发力，因为 PG 的执行引擎是火山模型，且是为行存设计，想要服务 AP 场景，性能远远不够。
本篇也主要是看看 YB 的存储层设计，站在 YSQL 角度，可以理解为是PG的存储层的重写。

1 架构

我们启动一个单机版本的 YB 集群，可以看看其都有哪些进程，以及数据目录的分布形态，这个过程从而帮助我们更好得理解其逻辑架构。

在 MAC 本地，通过 yugabyted 启动集群之后，集群状态如下:

可以看到其对外暴露的配置：

副本因子。单机启动，只指定了一个节点，默认就是1副本。
WebUI。每一个集群会提供一个管理当前集群状态的 web页面，可观测性这种产品能力也是很到位。
数据和日志目录。显然并没有暴露元数据管理的相关配置，这也非常合理，用户不需要关注这个。
连接YSQL 和 YCQL 的方式。当然，这两种是有不同的访问端口。

再看看进程组的情况：

yb-master 元数据管理的进程，后面会细说，不论有多少个 tserver节点， master最多只会有三个，只要能形成高可用的 raft-group就可以了。
yb-tserver 数据存储管理的进程，status展示的副本因子也是说的 tserver管理数据的副本情况。
postmaster 进程以及几个子进程，这个是一个提供psql连接的无状态 PG进程，兼容 PG SQL 语法，可以处理一些 commands(query)，调用对应 YB 处理接口将用户查询请求通过 RPC 发给 tserver 进行查询解析、优化、执行。
（可选）webserver进程，用于提供集群的可视化展示，就是前面提到的UI页面。

其中yb-master进程和yb-server进程都有各自的数据目录：

在 yb-data目录下的 master和tserver 数据目录结构都是一样的，在数据表目录之下拥有以 tablet 为子目录的 rocksdb实例以及 wals目录，保存对应tablet 的 raft-index 和 raft-log。

YB 的核心主要是在 Master 和 TServer 两个进程，接下来看一个官方提供的这两个进程的关系图：

最多三个节点的master进程之间形成了 raft group，通过raft算法的心跳、leader 选举、日志复制的功能来实现高可用；无限 scale out 的 tserver 节点之间也是 raft group，实现数据存储的高可用。

1.1 Master

Master 主要有如下功能：

调度集群的 DDL 或者说集群管理的操作
以tablet 为单位存储元数据
负责 tablet 的生成和分发到tserver
tsever集群数据的负载均衡、tserver leader 管理的tablet的负载均衡、tserver 节点失败时的数据复制。

前面介绍基本架构的时候会提到 Master 以及 TServer 存储数据的基本单位是 Tablet，Master这里存储 catalog的时候也是 Tablet，不同的 Tablet会在 Master内部形成 raft-group。同样的后续介绍的 TServer存储用户表数据的时候也是以 tablet 为单位，每一个tablet和其他 TServer的副本形成raft-group。

关于 Tablet 工作方式后续会再详细介绍，总之 Master 负责对所有 Tablet的管理，包括创建、分裂、迁移等。

1.2 TServer

TServer 包含查询层，即 YSQL 以及 YCQL 的功能以及数据存储的功能。

每一个 TServer 存储上可以管理多个 Tablet，不同的 Tablet 与其他 TServer 节点的 tablet 副本会形成 raft-group。一个TServer 节点上同一个表可能会有多个 tablet，且在同一个表目录下，不同的tablet 在不同的目录，数据是物理隔离，每一个tablet 目录可以理解为一是个 rocksdb实例。

除了查询层之外的所有存储层的功能实现可以理解为都在 docdb中, docdb是一个能够感知schema信息的支持事务的分布式kv存储引擎。

1.3 Tablet

Tablet 支持对表数据的 Hash 分片以及 Range 分片，Docdb 统一对这一些分片后的 tablet 进行管理。

Hash分片下 YB 会选择用户指定的hash-key，比如建表时指定了 id列为primary-key。会取这个列的前两个bytes(16bits)进行hash 映射到对应的tablet中，这样一个表总共会有 2^16 64k个 tablet。

优点： Hash 分片能够尽可能得保证数据跨节点的均匀分布，而且 hash 分片之后的 tablet的管理采用的是一致性hash，在有节点异常或者增加新的节点时能够利用一致性hash 完成高效的tablet 移动。

缺点： 这也是所有按 Hash 分片的无奈之初，即 range-scan，比如扫描某一列大于某一个值的所有行，这个成本就会非常高。
Range 分片下会将表的主键拆分为多个连续的range，每一个range 作为一个tablet，tablet内部基于主键排序。当然 Range分片下的 tablet 最开始只会有一个，随着数据的插入，每一个tablet的range范围会逐渐增加，到某一个阈值则会触发tablet的分裂。
优点： 当然是range-scan的效率极高，按照上下界扫描某一个表的数据效率是极高的，只需要确认 lower-bound和upper-bound所在的tablet之后只需要顺序扫描文件就可以了。

缺点： range分片的分裂是随着数据的插入进行的，即使用户有很多个可以服务的节点，在没有达到tablet分裂的阈值之前也只能由一个节点调度 query；range 分片下用户的访问热点概率较高，高频访问一段连续的range时负载会集中在很少的几个 tsever节点，这个时候就需要master的参与来为热点访问的节点提供更多的资源。

接下来从 IO 链路以及相关的数据存储编码设计来看看 YB 的存储层是如何实现最开始的目标的。

2 读写链路

数据的读写链路部分还是以 YSQL为主，YB本身兼容的是PG的协议，这里需要区分DDL 和 DML语句的读写链路。

2.1 DDL

YB 保留了PG 基本所有的的catalog 包括基本的 pg_class,pg_attribute,pg_type等，在initdb的时候写入到 master 集群中为catalog 创建的tablet中。这样对 catalog的管理就完全集中化了，而且 docdb 对 catalog的数据存储也都是转为了kv，访问也更加符合云上的按需访问的需求，和实际的用户表数据物理上分离存储又通过docdb统一进行逻辑管理，整体还是非常合理的。后续会详细介绍 YB 对表结构的编码方式。

DDL 主要是对 catalog的增删改查，也就是主要和master进行交互，但是细节上还是会有不少 TServer的参与。

YB实现DDL的数据流转过程如下图：

用户和无状态的 postgres进程建立连接之后，发送的 DDL请求会通过 postgres 进程转发给启动时bind的 tserver的 YQL 层进行 query的解析以及后续的操作。

后续整体的操作可以分为两个部分：

Master 进程组主要负责将建表生成的 catalog数据在自己 tablet(initdb时创建好的 PG系统表的存储，以tablet为单位) raft-group内持久化完成并根据用户的需求为 TServer 创建对应的 tablet。此时会先向用户返回建表成功，后续的 TServer上的tablet的创建会异步进行。
TServer进程组根据Master 分配的 tablet id 异步创建本地的tablet，并按照 master的要求构建一个跨节点的 tablet raft-group。

用户发送建表请求到收到返回，中间会需要 TServer 进行请求的解析并完成 schema信息的封装，将 schema 通过 rpc 发送到 Master。在 Master上的 DocDB中完成 schema到KV的封装，并通过 raft 完成数据的复制以及后续的 apply(将封装好的kv batch写入rocksdb的memtable，raft的复制过程会写raft-log以及raft-index，不需要写WAL；当然这个过程是满足事务语义的，即利用分布式事务完成的线性一致性写)。

后续的 TServer的各个peer上进行用户表数据的 tablet的创建则是异步进行，master还需要确保 TServer上的各个tablet 都形成了 raft-group，有对应的 leader-peer才算完成。

其他的DDL 也是类似的操作，比如 drop-table，可能由对 catalog的增加变为catalog的对应数据的删除以及 TServer上 tablet的清理。

2.2 DML

DML 是对用户表的增删改查，本身应只需要TSever的参与，但是在连接的 TServer 第一次访问某一个tablet时需要向 master索取该数据所处的 tablet的leader 信息才行,拿到之后才能到对应的tablet的leader进行数据读/写操作。

以 INSERT 为例，整体数据流如下：

Master 在这个过程仅负责提供要访问的tablet信息即可，其他操作均由 TServer内部完成，且 StateLess Postgres 是一个smart-client，会在自己的内存中缓存访问过的数据的tablet信息，后续对相同range/hash 分片的读写可以不用 t_peer0 以及master的参与，直接去到对应的tablet leader即可。

读请求比较简单，无需复制，从任意一个tablet的peer拿到数据之后会直接返回给客户端。

2.3 事务

事务体系是在 DocDB层实现的，不论是 Master 集群的catalog 持久化到tablet操作还是 TServer的用户表数据持久化到 tablet 操作都会由 DocDB 进行调度，对于每一个请求都会有事务的执行链路，像上面的读写链路因为是单行操作，会直接在tablet leader本地完成，并不需要分布式事务的参与，RPC 会少很多。
但是真实场景，一个事务往往涉及多行数据的操作，多行数据可能还会跨 tablet，这个时候一定是需要分布式事务来保证线性一致性的操作。

YB 在事务隔离级别上的支持，目前对 YSQL 支持 Repeatable Read,Serializable 以及正在进行中的 RC，因为期望和 PG支持的隔离级别对齐；YCQL 只需要利用 Snapshot支持 Repeatable Read就好了。

实现这几个隔离级别的技术也比较通用：hlc实现MVCC + 乐观锁。
当然，这样的实现目前肯定没有办法和 PG 的悲观事务体系保持一致，不过YB也在向PG的语义兼容，悲观事务也在实现过程中（主要是当前架构的性能问题，不过要支持AP的话悲观事务体系还是需要有的，AP场景的query执行时间过长，不可能等到提交的时候才发现有冲突而失败，这样的语义用户来说是不能接受的）。所以目前在 OCC的实现下，如果发现两个事务有冲突，则会直接报错，终止其中一个事务的执行链路，不像 PG实现的是 wait-on-conflict语义。当然这个 wait-on-conflict语义也是在实现中，会和悲观事务一起完成。fail-on-conflict 目前也是用 lock-table来实现，因为所有的写都会发送到对应的leader-tablet，这样对同一个tablet的同一行的修改的冲突检测就可以在一个 TServer的内存中构建 lock-table 并完成检测。

HLC (Hybrid logical clocks)混合逻辑时钟本质是为了提供请求的因果关系，兼容时钟漂移的同时，用较低的成本(TrueTime依赖硬件且成本太高)提供一个全局单调递增语义的序列且仍带有时钟属性。因为其本身就是由 physical-clock + logic seq 组成。
关于HLC的细节以及算法演进，可以参考之前写过的一篇计算机的时钟系统演进。

前面说的只是事务的隔离级别的实现，但是分布式事务的原子性比如一个事务修改了多个tablet，且这一些tablet分布在不同的peer，如何保证这样的事务的原子性，要么都提交，要么都abort。这个当然是业界通用的实现方案，2PC。

YB分布式事务的写链路如下：

Prepare阶段 主要做的事情有两件：

创建一个保存事务状态的额外的tablet：TxnStatus tablet，并向其中写入当前事务的状态信息为pending。事务状态主要服务于可见性，和PG的clog作用一样。
向存储数据的tablet 写入临时记录；这里其实还没有到apply，即写的是raft-log，临时记录主要包含当前事务的 txn-id,要修改的key以及value，不对其他事务可见的hlc 序列等。这个过程中也会做冲突检测，进行fail-on-conflict操作。

上图是向数据的 tablet中写入的当前事务的临时记录，–> 前后分别是 key和value。
其中 Primary provisiional records中的key格式如下：

比如 row1, WeakSIWrite, T130 --> TxnId1 表示 TxnId1 对于row1这一行加了 WeakSIWrite级别的行锁，且这个key的 hlc版本是 T130。
row1.col2, StrongSIWrite, SI,T150 --> TxnId2, value4,TxnId2 对row1 col2的修改加了 StrongSIWrite的冲突锁，且hlc版本是 T150。
还有事务的元数据，也是保存某一个事务ID以及其对应的 TxnStatus Tablet信息、隔离级别以及该事务的优先级等等。

Commit阶段：
Commit时会向 Txn Status tablet发送rpc, 当前事务没有冲突时commit才会成功。Commit成功，则所有的临时数据记录将立即对其他client可见 – 这块猜测是修改了当前事务的　hlc的可见性，比如将最新的hlc(YB里面有一个 safe-time)版本推进到当前事务提交的hlc，否则不太可能说立即可见，类似PG的 latestCompletedXid，这样的实现高效且简单。

Commit完成之后会异步进行数据的apply完成后会临时记录和当前事务在 Txn Status Tablet的事务状态的清理。

3 KEY 的设计

前面有简单提到过事务部分的临时记录的key的形态，接下来看看 YB 的DocDB如何将表结构转为kv的。
整体来看 YB 在未来会考虑支持两种形态：

将一个表的一行数据编码为多个k/v，这样主要对更新非常友好。但是缺点也很明显，空间放大比较严重，各种标识会被反复存储（hlc，行标识等）；且插入放大太严重，一个insert需要放大为多个kv的插入。
一个表的一行编码为一个k/v，这个对读以及 insert非常友好，且空间放大可控。尤其是大宽表，优点上会放大更多。缺点的话就是修改以及 compaction的成本很高。

当然这两种编码方式都有其适用的场景以及痛点的解决方案，目前 YB 还是只支持第一种编码方式，第二种还在测试中（Packed row format）。

第一种的 Rocksdb k/v 的编码方式实现如下：

DocKey 是用来标识行，即利用表的主键key的hash值+一个type 来标识SQL的行或者 CQL的行,type可以用来区分当前key是 hash分片还是 range 分片。

Subkeys 则进一步标识 YSQL 表的列id 或者 CQL的某一个数据结构(set/map/list等)。

DocHybridTime 则是一个 hlc时钟的标识。

Value 在 YSQL下存储的是列的值，YCQL value 存储的TTL，超过这个时间则需要被清理。

对于 YSQL 来说，我们的数据库表数据的存储会有不少冗余，对于一行来说每一个列都是一个独立的k/v，但是 docKey则需要存储多次（相同前缀的话在Rocksdb是连续存储，虽然对压缩比较友好，但是空间放大仍然是比较严重的），而且insert性能随着表的列宽的增加，性能会越来越差；当然 update/select 性能也还是能够接受的。

4 Rocksdb 在 YB 中的一些实践

在 YB 中，不论是 Master还是 TServer 上，每一个tablet 都是一个rocksdb实例，数据部分的存储都是放在Rocksdb 上，所以对 Rocksdb 也算是深度使用了。

Rocksdb 功能的选择上：

因为已经有 raft-log了，且本身是先写raft-log，所以会关闭 rocksdb的wal功能。这里会有一些工业实践的一些问题，如何确保raft-log的回收是正确的，不会被误删除。需要利用 rocksdb-flush时的一些 event-listener机制来去追踪 flush完成的最新的raft-log的序列（hlc序列），这个 hlc 之前的所有的raft-log是都可以被安全清理的。
YB 的DocDB的 MVCC实现是跨多Rocksdb实例的(分布式事务，且跨多tablet)，所以没有办法使用 Rocksdb本身自带的MVCC以及事务机制，实现过程中看代码是参考了不少 Rocksdb的实现，比如lock-table部分。YB 使用了 rocksdb 提供的 timestamp 功能，将hlc编码到了key里，作为internal-key的一部分，原本rocksdb自己实现的单db内递增的 sequence 是没有必要存在了，这块也被移除了，节省了空间。

使用 Rocksdb 加速YB性能：

为 range-scan 构造适配特定数据结构的bloom-filter。这里是可行的，rocksdb有提供 table-filter功能,可以在生成sst的过程中感知特定的数据类型，记录一些信息到 properties中，后续可以在scan的时候使用自己实现的table-filter来做一些数据结构的统计或者检测是否存在这样的类似bloom-filter的功能。
可以利用 rocksdb 提供的 table-collector功能，同样生成sst的时候记录一些统计信息到table-properties中，比如记录一些列的min/max/sum 这样的统计信息。后续scan tablet 读取数据的时候内存可以缓存大量的sst的 property-block，在有上下界这样的查询语句的时候就能实现 sst-skip，从而跳过大量的sst的访问。
内存利用率的提升。block-cache是可以进程内所有 rocksdb实例共享的，能够提升内存利用率，也可以实现自动的热点缓存（某一个tablet数据访问较为频繁，block-cache缓存其 block 可以更多一些）。 memtable的总大小也可以实现跨实例控制，比如可以利用rocksdb-options 搭配一些内存监控测策略来合理控制当前 TServer进程内所有的 tablet memtable(memstore)内存占用大小。

当然实际肯定还会有一些工业上的问题，比如 TP场景的延时问题，raft-log写盘和memtable-flush 可能会导致磁盘有大毛刺，这个时候有一些rokcsdb的配置以及内核配置能够比较好的解决这一些问题 (比如：ratelimiter + directio_in_compaction/flush–参数忘记了) 。
当然 ratekeeper这种因为有事务流的存在，肯定实在上层做更为合适，比如 YB 就在master实现了这一些功能。

总结

因为个人有一些 Rocksdb 的经验，看到 YB 在Rocksdb上的实践，其实还是有较为可控的研发成本。至少有一个极为稳定的单机k/v存储引擎，以及 TP场景稳定的PG高性能查询引擎，这样前期 YB 只需要将人力集中投入到存储部分且用一套较为统一的存储来调度数据以及元数据的读写，真的可以将存储部分做的非常精。

当然数据库的发展需要跟随时代，如今的云原生数据库以及 AP 数据库的需求，YB也想要加入，那么新的存储格式的设计(列存：目前这样的key的设计其实也能满足列存的需求了, rocksdb原生append-only 且有工业级的 compaction 以及压缩实现，每一行的多列在存储上其实也是集中在同一个sst文件内的data-block)，新的查询引擎也就需要更多的投入。

腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
3.增删改查--连接查询问女何所忆
关系型数据库的一个特点就是，多张表之间存在关系，以致于我们可以连接多张表进行查询操作，所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种，交叉连接、内连接和外连接，我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：如果你没学过数学中的笛卡尔积概念，你可以这样简单的理解这里的交叉连接：两张表的交叉连接就是一个连接合并的过程，T1表中
docker from指令的含义_多个FROM-含义 weixin_39722188 docker from指令的含义
小编典典什么是基本图片？一组文件，加上EXPOSE端口ENTRYPOINT和CMD。您可以添加文件并基于该基础图像构建新图像，Dockerfile并以FROM指令开头：后面提到的图像FROM是新图像的“基础图像”。这是否意味着如果我neo4j/neo4j在FROM指令中声明，则在运行映像时，neo数据库将自动运行并且可在端口7474的容器中使用？仅当您不覆盖CMD和时ENTRYPOINT。但是图像
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your †徐先森® Oracle数据库 Web相关错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
Redis 有哪些危险命令？如何防范？花小疯 redis 缓存数据库危险命令大数据
Redis有哪些危险命令？Redis的危险命令主要有以下几个：1.keys客户端可查询出所有存在的键。2.flushdb删除Redis中当前所在数据库中的所有记录，并且此命令从不会执行失败。3.flushall删除Redis中所有数据库中的所有记录，不止是当前所在数据库，并且此命令从不会执行失败。4.config客户端可修改Redis配置。怎么禁用和重命名危险命令？看下redis.conf默认配置
【Golang】 Golang 的 GORM 库中的 Rows 函数不爱洗脚的小滕 golang 开发语言后端
文章目录前言一、Rows函数解释二、代码实现三、总结前言在使用Go语言进行数据库操作时，GORM（GoObject-RelationalMapping）库是一个常用的工具。它提供了一种简洁和强大的方式来处理数据库操作。本文将介绍GORM库中的Rows函数，这是一个用于执行原生SQL查询并返回结果的函数。一、Rows函数解释在GORM库中，Rows函数用于执行原生SQL查询并返回*sql.Rows结
接口测试如何设计测试用例李蕴Ronnie
接口测试用例设计方式针对每个必填参数，都设计一条参数为空的测试用例必填参数不存在传的参数值在数据库中不存在添加数据接口，传入已有的数据重复添加编辑数据接口，各个字段分别编辑，合并编辑参数数据类型限制，针对每个参数设计一条参数值类型不符合的逆向用例参数自身取值范围，针对所有参数，设计一条每个参数值在取值范围内最大值的正向测试用例是否满足前提条件（token、headers），几个前提条件几条用例针对
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
非关系型数据库天秤-white nosql
一、为什么要用Nosql1.单机MySQL的时代。一个基本的网站访问量一般不会太大，单个数据库完全足够。那时候更多使用的静态网页html，服务器根本没有太大压力。这时候网站的瓶颈是什么？-数据量如果太大，一个机器放不下。-数据量太大需要建立数据的索引（B+Tree），一个服务器内存放不下。-访问量读写混合，一个服务器承受不了。2.memcached缓存+MySQL+垂直拆分（读写分离）。网站80%
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s