OceanBase数据库官方博客

OceanBase 4.1解读：我们支持MySQL 8.0哪些新增功能特性？

本文主要介绍 OceanBase 在 4.1 版本发布之际，对 MySQL 8.0 新增功能特性的支持情况。文章作者刘彬，OceanBase高级技术专家。曾参与 OceanBase RS、存储模块研发，目前是 SQL 执行组负责人。

MySQL 在业内是最受欢迎的关系数据库之一，不少用户将 MySQL 作为刚开始使用数据库的首选。 OceanBase 的一大重要特性即是与 MySQL 完全兼容，用户无需修改代码即可完成数据库的升级迁移，也大幅降低了开发者的学习成本。 作为完全自主研发的数据库，OceanBase 从 1.0 版本开始便在 MySQL 兼容能力研发上投入了大量工作，并实现了 SQL 语法、数据类型、系统函数等全面的 MySQL 兼容能力。

随着 MySQL 的发展和用户使用需求的变化，OceanBase 的 MySQL 兼容版本也从 5.6 发展到 5.7 再到 8.0。始终为用户带来简单友好的开发体验。尽管目前 5.7 版本依然是许多 MySQL 用户业务的主力版本，但随着官方对 5.7 版本的支持终止（MySQL 5.7 将于 2023 年 10 月结束官方支持，from: https://www.oracle.com/us/support/library/lifetime-support-technology-069183.pdf），也将会有更多 MySQL 用户将业务更换至 MySQL 8.0。

OceanBase 4.1 对 MySQL 的兼容策略是完全兼容 5.7，同时支持 8.0 功能。相较于 MySQL 5.7，8.0 版本在性能、安全性、可用性等方面都有显著提升，同时也新增了许多功能特性。 在笔者看来，MySQL 8.0 最重要的新增功能特性有如下几项，本文也将介绍 OceanBase 在 4.1 版本发布之际对这部分功能的支持情况：

窗口函数（Window Function）
公用表表达式（Common table expression）
Hash Join
索引管理
资源管理（Resource management）

窗口函数：更强的数据分析能力

窗口函数（Window Function）是 MySQL 8.0 的新增功能，它可以对某个窗口内的数据行执行聚合操作，而不是对整个结果集进行聚合，能更简单直观地进行时间序列分析、累积统计、排名等操作，帮助用户更深入地发现数据价值。与聚合函数不同的是，窗口函数主要通过窗口控制参与计算的行，它不会将多行查询结果合并为一行，而是将结果放回多行当中。而在窗口中的计算，既支持所有的聚合函数 (如：count, sum, min, max, avg, stddev …)，也支持部分窗口函数，包含：cume_dist, dense_rank, first_value, lag, last_value, lead, nth_value, ntile, percent_rank, rank, row_number。

窗口函数主要应用于数据分析，例如计算数据趋势变化、基于不同指标排序数据、复杂统计指标计算等。举例来说，假设某一场景中我们要按项目对运动员得分进行排名，我们可以创建一个名为 athlete_scores 的表，设定运动类别（sport_type），运动员名字（athlete_name），分数（score），并使用如下函数进行排名操作：

SELECT sport_type, athlete_name, score,
       RANK() OVER (PARTITION BY sport_type ORDER BY score DESC) as `rank`
FROM athlete_scores
ORDER BY sport_type, `rank`

由于窗口函数功能在 OLAP 使用场景广泛，OceanBase 从 1.x 版本开始就提供了窗口函数功能。相比使用子查询或连接操作，窗口函数往往能提供更好的性能。同时，数据库优化器可以有效地处理窗口函数，降低查询计算的成本。值得一提的是，即使用户在 SQL 编写中没有使用窗口函数，在部分场景中，OceanBase 也会将部分 SQL 自动改写为包含窗口函数的语句，以提高性能。

公共表表达式：增强 SQL 可维护性

公共表表达式（Common table expression，简称 CTE）是由 SQL1999 标准引入的 SQL 功能，后续在 2000 年初各数据库厂商陆续推出此功能，MySQL 在 8.0 推出了完备的 CTE 实现。CTE 通过 WITH 关键字，允许在 SQL 语句中定义一个/多个临时表（视图），并在查询中应用，通常应用在多个子查询、分层查询以及递归查询中。用户借助 CTE 可以将复杂的查询拆分为多个逻辑部分，使复杂查询的结构更清晰、SQL 代码的逻辑更直观，使得查询更容易理解和维护。

用户还可以通过递归 CTE 实现更复杂的功能。如在 MySQL 中，可以通过如下 SQL 语句生成一个带自增列（id）及一个随机数（rand_val）的 1000 行测试数：

WITH RECURSIVE test_data (id, rand_val) AS (
    SELECT 1, RAND()
    UNION ALL
    SELECT id + 1, RAND()
    FROM test_data
    WHERE id < 1000
)
SELECT *
FROM test_data;

OceanBase 可以自动识别公共子查询，并抽取为公共表表达式。 OceanBase 从 2.0 版本开始支持 CTE 功能，即使用户在 SQL 编写中未使用 CTE，OceanBase 也会在改写阶段进行识别并抽取，通过减少子查询执行次数以优化性能。举例来说，在如下 SQL 和计划中，SELECT c1, MIN(c2) c2, MAX(c3) c3 FROM t1 GROUP BY c1 子查询用了两次，便可抽取成为公共子查询。

SELECT *
FROM t2
WHERE EXISTS (
        SELECT *
        FROM (
            SELECT c1, MIN(c2) c2, MAX(c3) c3
            FROM t1
            GROUP BY c1
            ) a
        WHERE t2.c1 = a.c1 AND t2.c2 = a.c2
        )
    AND EXISTS (
        SELECT *
        FROM (
            SELECT c1, MIN(c2) c2, MAX(c3) c3
            FROM t1
            GROUP BY c1
            ) b
        WHERE t2.c3 = b.c1 AND t2.c4 = b.c3
        );

=================================================================
|ID|OPERATOR                 |NAME        |EST.ROWS|EST.TIME(us)|
-----------------------------------------------------------------
|0 |TEMP TABLE TRANSFORMATION|            |1       |5           |   
|1 | TEMP TABLE INSERT       |TEMP1       |1       |3           |   
|2 |  HASH GROUP BY          |            |1       |3           |   
|3 |   TABLE SCAN            |t1          |1       |2           |   
|4 | HASH JOIN               |            |1       |3           |   
|5 |  TEMP TABLE ACCESS      |VIEW2(TEMP1)|1       |1           |   
|6 |  HASH JOIN              |            |1       |3           |   
|7 |   TEMP TABLE ACCESS     |VIEW1(TEMP1)|1       |1           |   
|8 |   TABLE SCAN            |t2          |1       |2           |   
=================================================================

可以看到，OceanBase 在用户未使用 CTE 情况下给出的执行计划，与下方用户自己使用 CTE 编写 SQL 的执行计划一致。在这个示例中，OceanBase 的 TEMP TABLE TRANSFORMATION 算子会将子查询结果存起来（TEMP 1），并在后续多次读取，减少子查询执行次数。

WITH tmp AS (
    SELECT c1, MIN(c2) c2, MAX(c3) c3
    FROM t1
    GROUP BY c1
)
SELECT *
FROM t2
WHERE EXISTS (
        SELECT *
        FROM tmp a
        WHERE t2.c1 = a.c1 AND t2.c2 = a.c2
        )
    AND EXISTS (
        SELECT *
        FROM tmp b
        WHERE t2.c3 = b.c1 AND t2.c4 = b.c3
        );

===========================================================
|ID|OPERATOR                 |NAME  |EST.ROWS|EST.TIME(us)|
-----------------------------------------------------------
|0 |TEMP TABLE TRANSFORMATION|      |1       |5           |   
|1 | TEMP TABLE INSERT       |tmp   |1       |3           |   
|2 |  HASH GROUP BY          |      |1       |3           |   
|3 |   TABLE SCAN            |t1    |1       |2           |   
|4 | HASH JOIN               |      |1       |3           |   
|5 |  TEMP TABLE ACCESS      |b(tmp)|1       |1           |   
|6 |  HASH JOIN              |      |1       |3           |   
|7 |   TEMP TABLE ACCESS     |a(tmp)|1       |1           |   
|8 |   TABLE SCAN            |t2    |1       |2           |   
===========================================================

Hash Join 算法：提升大数据连接性能

Hash Join 是数据库中广泛实现的连接（JOIN）算法，用于处理两个或多个表之间的连接操作。在 Hash Join 算法中，首先基于其中一个表构建 Hash 表（一般选择数据量小的表构建），然后对另一张表每一行进行Hash表探测，找到与之匹配的行并生成结果集，在数据量较大时通常有性能优势。

MySQL 在 8.0 版本之前支持的连接算法只有 Nested Loop Join，这种连接算法在 Web 应用和 OLTP 场景中的性能已相对较好，因此未对 Hash Join 有很高的优先级。Nested Loop Join 尤其适用于索引可以有效使用的情况下，其做法是将其中一个表作为外表，另一个表作为内表，对外表中的每一行遍历内部所有行（如有合适索引，可利用索引）找到符合条件的行。然而，当内表数据量较大且没有适合索引时，Nested Loop Join 性能较差。 随着用户对大数据量连接需求的增加，MySQL 从 8.0 版本开始支持 Hash Join 算法。

OceanBase 一直以来都支持 Hash Join 算法。 与单机数据库不同，OceanBase 面向的应用场景很多都涉及海量数据处理。此外，分布式场景下索引（全局）往往需要跨机访问，而通过建索引优化 Nested Loop Join 较难达到预期效果。而 Hash Join 在分布式、大数据量场景通常性能表现更优，因此我们从研发初期就进行了支持。同时，我们也支持 Nested Loop Join 以及 Merge Join，这两个 Join 算法在能利用索引或利用序的场景有性能优势。 OceanBase 的查询优化器会根据代价模型判断，为用户自动选择最适合的算法。

索引管理：更高的索引管理效率

MySQL 8.0 引入了设置索引可见性（visiable/invisiable）的功能，这一功能允许用户在不删除索引的前提下，将索引设置为不可见。在不可见状态下，查询优化器会忽略该索引，不将其用于查询计划，但其索引数据仍将正常维护。这样做的好处是可以在保留索引结构的情况下，测试索引对查询性能的影响。如果之后需要重新启用索引，只需将其设置为可见即可。

例如当我们想删除一个索引时，可将其设置为 invisiable，等待业务运行一段时间确认该索引确实不被用到后再删除它。如果发现某个业务 SQL 依赖于该索引，便可将该索引改回 visiable。由于索引数据仍然被正常维护，设置索引可见性的速度非常快，避免了先前删除索引后发现业务依赖，又重新创建索引的开销。

MySQL 8.0 中设置索引可见性的语法如下：

-- 将索引设置为不可见
ALTER TABLE table_name ALTER INDEX index_name INVISIBLE;

-- 将索引设置为可见
ALTER TABLE table_name ALTER INDEX index_name VISIBLE;

OceanBase 从 1.x 版本开始支持索引可见性设置。 通过将索引设置为不可见，用户可以在现有数据库环境中测试调整索引策略对查询性能的影响，而无需删除或禁用索引。同时，索引本身也需要维护和消耗资源，遗留的冗余索引也可能会拖慢性能，通过设置索引可见性，用户可以安全地验证索引对查询性能的影响，从而避免资源浪费。此外，通过设置索引可见性，可以在不重建索引的情况下快速恢复索引，从而避免误删关键索引导造成性能下降的风险。 综合来看，索引可见性设置可以帮助用户更灵活地管理索引策略、优化查询性能并降低资源浪费，从而提升数据库管理效率。

此外，MySQL 8.0 还新增了对逆序索引的支持，逆序索引是指索引列可指定降序，这样一些按降序的排序可利用此索引。如下所示，ORDER BY c1 DESC, c2 的查询即可利用此索引。

CREATE TABLE t1 (c1 INT, c2 INT,INDEX i1 (c1 DESC, c2 ASC));

由于过去用户对逆序索引需求较少，OceanBase 目前暂不支持逆序索引功能。对于逆序排序的场景，OceanBase 优化器会利用正序索引（逆序扫描），并支持前缀排以及通过并行(PX)加速排序，我们也即将在后续版本中支持此特性。对单列的逆序排序，OceanBase 可以用逆序扫描索引的方式利用索引。对混合了正逆序的多列排序场景，OceanBase 会尽可能的利用索引，在排序时只对不能利用索引的列进行排序。如索引为 index1 (c1, c2, c3)，排序为 ORDER BY c1 desc, c2 asc, c3 asc，OceanBase 会选择对 index1 进行逆序扫描，然后利用前缀排序仅对 c2, c3排序。此外，如果建索引后此类排序性能仍不满足要求，可以尝试通过并行执行（PX）加速排序。

资源管理：提高资源利用率

MySQL 8.0 开始支持资源组（resource group）功能，此功能可以指定资源组所使用的 CPU 资源以及任务调度优先级，从而对数据库查询的执行进行管理和控制。同时，可以通过 SET RESOURCE GROUP 语法为线程指定资源组，或通过 /*+ RESOURCE_GROUP(xxx) */ hint 为某条语句指定资源组。通过上述方式，DBA 可控制不同任务的资源（CPU）使用、灵活地调整资源分配，从而提高资源的整体利用率。

OceanBase 支持更丰富的资源管理策略。 从 3.x 版本开始，OceanBase 在 Oracle 模式中支持了 Oracle 的资源管理（DBMS_RESOURCE_MANAGER 包），与 MySQL 的 resource management 主要针对 CPU 资源分配不同，OceanBase 提供了丰富、灵活的资源管理策略，可以设置多种不同的资源计划，根据消耗情况动态调整资源分配，具备更完备的功能和更多的定制可能性。

OceanBase 也在 3.2 和 4.1 版本中，将资源管理能力开放到了 OceanBase MySQL 模式。 用户可通过 DBMS_RESOURCE_MANAGER 包中的 CREATE_CONSUMER_GROUP, CREATE_PLAN, CREATE_PLAN_DIRECTIVE 过程创建资源组指定管理计划（CPU、IO资源），然后通过 SET_CONSUMER_GROUP_MAPPING 接口按用户或数据列访问规则为 SQL 指定资源组。

当前，OceanBase 资源管理与 MySQL 8.0 资源管理的异同如下：

	CPU 管理	IO 管理	Memory 管理	按 session 指定	按用户指定	按语句指定
MySQL 8.0	✅	❌	❌	✅	❌	✅ 通过 hint 指定
OceanBase	✅	✅	❌	❌	✅	✅ 通过列访问规则指定

写在最后

除了本文介绍到的特性外，MySQL 8.0 还带来了如 JSON 类型增强、支持 INTERSECT, EXPECT 等功能特性，也解决了如 Atomic DDL、自增值持久化等长期存在的不足，以及默认字符集由 latin1 变为 utf8mb4, group by 列不再支持 asc/desc 等行为变化。当用户考虑将业务从低版本迁到 MySQL 8.0 时，需要充分评估这些变化的影响。我认为，MySQL 8.0 是更好的 MySQL，而 OceanBase 则不仅仅是 MySQL，我们会不断优化对 MySQL 8.0 的兼容性，同时也欢迎大家体验 OceanBase 4.1，分享你的使用感受。

欢迎访问 OceanBase 官网获取更多信息：https://www.oceanbase.com/

基于虚拟化技术的网闸安全交换：物理隔离时代的智能数据流通引擎 109702008 #linux系统安全安全人工智能网络
摘要：在等保2.0和零信任架构背景下，传统网闸正从“物理断网”向“智能交换”演进。本文将深入解析如何通过硬件虚拟化+策略容器化在网闸内部实现安全数据交换，并提供工业级落地方案。一、痛点：隔离与效率的终极矛盾当企业面临以下场景时，传统网闸力不从心：生产网与办公网需实时同步数据库公有云与私有云间敏感文件传输多租户环境下跨安全域业务协同核心矛盾：物理隔离阻断攻击链的同时，也阻断了业务流！二、技术破局：虚
Python实例题：基于 Flask 的在线聊天系统
目录Python实例题题目要求：解题思路：代码实现：Python实例题题目基于Flask的在线聊天系统要求：使用Flask框架构建一个实时在线聊天系统，支持以下功能：用户注册、登录和个人资料管理一对一实时聊天功能群聊功能消息通知和未读消息提示在线用户状态显示使用Flask-SocketIO实现实时通信。使用SQLite数据库存储用户、聊天记录等信息。添加美观的前端界面，支持响应式设计。解题思路：使
xml文件笔记
今天学习了一下xml下面是总结的一些笔记Xml可以用来配置文件xml特点：Xml可以从HTYML中分离数据可以利用xml文件在不兼容的系统之间交换数据Xml数据以纯文本格式存储Xml与其他软硬件的耦合度更低，数据可以被更多的设备利用，还可以将XML文件当作数据源来处理，就像操作数据库一样Xml的格式在xml文件头部要有声明在XML中字母的大小写是敏感的Xml文件中有且只有一个根元素，所有的其他元素
oracle操作xml笔记 chushiyunen oracle xml 笔记
文章目录第一个例子EXTRACTVALUE()方法oracle这么成熟的数据库，肯定对xml有很好的支持了。第一个例子创建表：CREATETABLExml_table(idNUMBERPRIMARYKEY,xml_dataXMLType);插入数据：INSERTINTOxml_table(id,xml_data)VALUES(1,XMLType('Value'));查询：SELECTEXTRACT
在 Dify 平台中集成上下文工程技术由数入道人工智能数据库大数据人工智能软件工程 dify
1.提升LLM问答准确率的上下文构建与提示策略大语言模型在开放领域问答中常面临幻觉和知识过时等问题。为提高回答准确率，上下文工程的关键是在提示中注入相关背景知识与指导。具体策略包括：检索增强(RAG)：通过从知识库中检索相关内容并将其纳入提示，可以显著提升回答的准确性和可信度。Dify提供了知识检索节点，支持向量数据库存储外部知识，并将检索结果通过上下文变量注入LLM提示中。例如，在知识库问答应用
MySQL 八股文【持续更新ing】小明铭同学 MySQL mysql 数据库
MySQL八股文【持续更新ing】文章目录MySQL八股文【持续更新ing】前言一、MySQL的存储引擎有哪些？他们之间有什么区别？二、MySQL`InnoDB引擎中`的聚簇索引和非聚簇索引有什么区别？1.InnoDB中的聚簇索引2.InnoDB中的非聚簇索引三、MySQL的索引类型有哪些？四、为什么MySQL选择使用B+树作为索引结构？五、MySQL索引的最左匹配原则是什么？六、MySQL三层B
Entity Framework 实体数据模型入门：从创建到实战应用 Leon@Lee 数据库
EntityFramework（简称EF）作为.NET平台下的ORM（对象关系映射）框架，极大地简化了数据库操作。本文将由浅入深，带您一步步了解EF实体数据模型的创建、配置、开发与使用，即使是新手也能快速上手。一、EF与ADO.NET：为何选择EF？在介绍EF之前，我们先看看传统的数据访问方式与EF的区别：ADO.NET的局限：直接编写SQL语句操作数据库，需要手动处理类型转换、SQL拼接等问题，
请详细描述MySQL的B+树中查询数据的全过程 WhiskyMaster mysql b树数据库
在MySQL中，B+树是一种常用的索引结构，尤其是在InnoDB存储引擎中，B+树被广泛应用于聚集索引（ClusteredIndex）和非聚集索引（SecondaryIndex）。在B+树中，数据存储在叶子节点，非叶子节点用于路由和索引查找。查询过程是通过树结构逐步定位到正确的数据位置。以下是MySQLB+树中查询数据的详细过程：B+树的基本结构非叶子节点：非叶子节点存储的是指向子节点的指针（即键
数据库连接池的作用是什么？破碎的天堂鸟学习教程数据库 oracle sql
数据库连接池（DatabaseConnectionPool）是一种核心的数据库资源管理技术，通过预先创建、复用和管理数据库连接，显著提升应用程序的性能、稳定性和资源利用率。其作用可归纳为以下核心维度：一、核心作用：提升系统性能与效率减少连接创建/销毁开销数据库连接的建立涉及TCP三次握手、身份验证、内存分配等操作，耗时约数十至数百毫秒。连接池在初始化时创建固定数量的连接（如minIdle），后续请
【MySQL】索引(B+树详解) Brookty MySQL 数据结构 mysql 数据库后端学习 b树数据结构
MySQL(五)索引一、索引的减I/O设计1.读取量2.搜索树2.1方向2.2有序3.分多叉3.1B树弊端:3.2B+树3.2.1非叶子-搜索字段3.2.1.1海量分叉3.2.1.1.1最大式3.2.1.1.2最快式3.2.1.2缓存内存3.2.1.2.1字段总量小3.2.1.2.2时间复杂度3.2.1.3区间搜索向下保留3.2.1.3.1过程3.2.1.3.2模式3.2.1.3.3效果3.2.2
MySQL 的 B+ 树中查询数据的全过程 Chen-Edward mysql 数据库
是否是否是否接收SQL查询解析SQL,生成语法树优化器生成执行计划是否使用B+树索引?加载B+树根节点全表扫描遍历非叶子节点定位叶子节点查找目标键值找到目标键?获取数据返回空结果是否二级索引?通过主键回表直接获取整行数据组装结果集返回结果给客户端注意事项mysql中的叶子节点默认是16KB，存储的不只是一条数据，数据的多少是16kB/每条数据大约的大小从上图可以知晓，叶子节点有页目录结构（非叶子节
用mysql作excel数据分析_怎样用 Excel 做数据分析？一只帅鸟
基本Excel快捷键【最好用的复制命令】Ctrl+R向右复制Ctrl+D向下复制【选择格式粘贴】Ctrl+Alt+V【求和功能】Alt+=然后按回车键【格式调整】Ctrl+Shift+7加上外边框Ctrl+Shift+-去掉边框Ctrl+Shift+5改成%数值格式【视图调整及编辑】Ctrl+Shift+=插入行Ctrl+-删除【终极】开始工具栏所有的命令都可以通过Alt-H-调用(如下图键入相应
备份远程主机上mysql，mongodb上数据，在docker容器中导入酒千殇数据备份 docker mongodb mysql 数据备份 ubuntu
将远程机器中的mysql，mongodb数据备份到Ubuntu20.04中前提：一定要明确数据库的版本。已知：远程机器ip，mysql账号，密码。说明：以下命令均在Ubuntu20.04中执行查看远程mysql的版本：用mysqlworkbench连接上远程数据库。点击Query菜单，在空白框输入selectversion();在点击菜单栏中第二个闪电符号，执行这条命令。就可以在下面的输出中看到m
Java 工作中常用案例 qq_4240 java
1.LocalDateTime获取某月的第一天开始时间和最后一天的结束时间/***获取指定年和月的第一天和最后一天*应用：数据库同步，本地库和其他库按照月份分组统计后，两两比对后，得到不相同的月份，*根据月份的第一天和最后一天，查询两个库具体值，做交集或差集，然后得到未同步*的数据后同步数据*2022-12xx*2022-11xx*@parammonth2022-12*@return*/publi
深入理解数据库领域的 SQL 索引失效问题数据库管理艺术数据库 sql ai
深入理解数据库领域的SQL索引失效问题关键词：SQL索引、索引失效、查询优化、执行计划、数据库性能、B+树、索引选择性摘要：本文深入探讨SQL索引失效的核心问题，分析导致索引失效的8种典型场景及其背后的原理机制。通过B+树索引结构解析、执行计划解读和实际案例演示，帮助开发者全面理解索引失效的本质原因。文章提供详细的优化方案和最佳实践，包括索引设计原则、SQL编写规范以及性能调优技巧，并附有MySQ
掌握大数据领域数据湖的部署要点
掌握大数据领域数据湖的部署要点关键词：数据湖,大数据部署,数据治理,存储架构,元数据管理,数据质量,湖仓一体摘要：在数据爆炸的时代，企业面临着"数据多却用不好"的困境——结构化数据藏在数据库里，非结构化数据堆在服务器上，半结构化数据散落在日志文件中。数据湖就像一个"智能中央仓库"，能统一存储所有类型的数据，并通过灵活的管理让数据"活起来"。本文将用"图书馆管理员建仓库"的故事，从概念理解、架构设计
spring中@Transactional注解和事务的实战理解附代码 GJCTYU spring oracle 数据库 spring boot mybatis 后端
文章目录前言一、事务是什么？二、事务的特性2.1隔离性2.2事务的隔离级别三、@Transactional注解@Transactional注解简介基本用法常用属性配置事务传播行为事务隔离级别异常处理与回滚性能优化建议四、事务不生效的可能原因方法访问权限非public自调用问题异常被捕获未抛出数据库引擎不支持事务未启用事务管理特殊场景：final/static方法五、分布式事务考虑总结前言在开发过程
MySQL 使用order by limit 分页重复问题我爱双面奶 SQL sql 分页重复
一、问题描述执行以下sql，在数据没有插入删除的情况下，返回的数据可能不一致，导致线上出现重复数据selectxxxfromtablewherexxxorderbyxxxlimitoffset二、产生原因在mysql5.6版本，mysql对orderbylimit做了一个优化，使用了priorityqueue，priorityqueue使用的是堆排序策略，在排序过程中虽然还要对n个数据进行排序，但
使用LIMIT + OFFSET 分页时，数据重复的风险码傻啦弟软件开发 oracle 数据库服务器
在使用LIMIT+OFFSET分页时，数据重复的风险不仅与排序字段的唯一性有关，还与数据变动（插入、删除、更新）密切相关。以下是详细分析：一、数据变动如何导致分页异常1.插入新数据场景：用户在浏览第1页时，数据库插入了新记录。问题：新记录可能会"挤入"已浏览过的页面，导致后续页出现重复数据。示例：sql--初始数据（按ID排序）IDName1Alice2Bob3Charlie--第1页：LIMIT
手机评论管理系统中奖秀晒图源码本套晒图源码（源码下载）
手机评论管理系统中奖秀晒图源码本套晒图源码采用mysql+html使用说明：测试环境：Nginx+PHP7.0+MySQL5.6评论管理后台访问：http://你的域名/review-admin.html评论列表首页：http://你的域名/mskhj.html源码下载：https://download.csdn.net/download/m0_66047725/91273788更多资源下载：关注
对加密字段进行模糊查询：基于分词密文映射表的实现方案大三小小小白数据库
引言在当今数据安全日益重要的背景下，数据库字段加密已成为保护敏感信息的常见做法。然而，加密后的数据给模糊查询带来了巨大挑战。本文将介绍一种基于分词密文映射表的解决方案，实现对加密字段的高效模糊查询。一、问题背景考虑一个用户管理系统，其中包含手机号、身份证号、住址等敏感信息。这些字段需要加密存储以保证安全，但同时业务上又需要支持模糊查询（如根据手机号前几位查询用户）。传统加密方式直接阻碍了模糊查询功
Spring Boot Flyway：数据库迁移工具集成 Java技术栈实战 spring boot 数据库网络 ai
SpringBootFlyway：数据库迁移工具集成全解析关键词：SpringBoot、Flyway、数据库迁移、版本控制、自动化脚本摘要：在团队协作开发中，数据库结构的变更管理一直是个“老大难”问题——手动执行SQL脚本容易漏操作、不同环境版本不一致、历史变更无法追溯……Flyway作为一款轻量级数据库迁移工具，能帮我们自动化管理数据库版本，就像给数据库“拍电影”，每一帧（每个版本）都清晰可查。
支持向量机（SVM）在肝脏CT/MRI图像分类（肝癌检测）中的应用及实现猿享天开医学影像支持向量机机器学习人工智能算法
博主简介：CSDN博客专家、CSDN平台优质创作者，高级开发工程师，数学专业，10年以上C/C++,C#,Java等多种编程语言开发经验，拥有高级工程师证书；擅长C/C++、C#等开发语言，熟悉Java常用开发技术，能熟练应用常用数据库SQLserver,Oracle,mysql,postgresql等进行开发应用，熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,
aws 数据库迁移_AWS Loft的数据库周 dnc8371 数据库大数据 mysql java python
aws数据库迁移这是我的笔记：https://databaseweekoctober2019sf.splashthat.comAWS上的数据库：合适工作的合适工具在许多此类谈话中，我并没有做过深刻的记录。我正在关注重点。PostgreSQL排在MySQL之后。AWS上8种类型的数据库：关系型核心价值文件在记忆中图形搜索时间序列分类帐搜索：AWSDatabaseServices对于关系，他们有Ama
11.2.0.4 awr快照无法正常生成
某日检查数据库性能，发现数据库awr快照没有正常生成咨询supportsr执行如下脚本DearCustomer,1.Pleaseprovidethebelowscriptoutputoninstance3:conn/assysdbasetpages1000setnum20altersessionsetnls_date_format='yyyy-mm-ddhh24:mi:ss';altersessi
Log Miner 挖挖挖
|LogMiner简介LogMiner是Oracle自Oracle8i以后推出的一个可以分析数据库redolog和archivelog内容的工具，可以通过日志分析所有对数据库的DDL和DML操作，也可以分析出操作的时间与操作时的SCN和进行操作的机器，对于DML操作还可以查询出还原操作的sql。|LogMiner组成源数据库产生LogMiner分析的所有重做日志文件的数据库挖掘数据库是执行LogM
Oracle Data Guard之Snapshot Standby（快照备库）学无止境的小一 oracle 数据库
前言在日常工作中，有时会有一些需求，那就是需要用到生产环境的数据进行测试，如果按照常规方法，通过备份恢复到测试库进行测试的话，数据库体积越大恢复的速度越慢。在这种情况下我们可以使用SnapshotStandby（快照备库）来进行一些测试操作。SnapshotStandby的介绍Oracle11g中的DataGuard不仅引入了ActiveDataGuard实时查询特性，还提供了snapshotst
ORA-27301错误分析和处理方法
ORA-27301错误分析和处理方法发生时现象应用不能连接数据库.alert日志告警ORA-27301.网络通信有问题,内存耗用高.发生时,有的系统连接数较高,有的不高.所以跟连接数没有必然联系.错误严重程度不能连接数据库.影响业务.预防/解决方法如果alert日志已经有ORA-27301错误,需要尽快修改.即使alert日志没有报错,也建议部署.部署步骤有2步.部署不需要重启数据库或者集群(如果
修复oracle中的awr出现多个实例记录和不能自动生成awr快照问题
文章目录1、ORACLEAWR报告生成过程出现多个实例记录修复获取awr报告报错查看host存放记录根据时间删除过期记录2、调整awr产生快照的频率及保留策略3、解决awr不自动生成4、附加原来rac数据库所在服务器主机名：lxsu1、lxsu2；现在数据库所在服务器主机名xmsu1、xmsu21、ORACLEAWR报告生成过程出现多个实例记录修复获取awr报告报错SQL>@$ORACLE_HOM
oracle控制文件快照,Oracle快照控制文件理解
##Oracle快照控制文件??快照控制文件(snapshotcontrolfile)，顾名思义就是Oracle控制文件的一个副本或者备份。快照控制文件并不多见，在使用RMAN的时候这个快照控制文件才会被使用。控制文件简单介绍控制文件是Oracle的重要组成部分，记录了当前数据库的结构信息，同时也包含数据文件，日志文件，归档的信息。记录数据库当前的SCN。1.什么是快照控制文件1)为什么要有快照控
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =