程序员 jet_qi

MySQL第七讲：MySQL分库分表详解

MySQL分库分表详解

摘要：本文是MySQL第七讲：MySQL分库分表详解流程，非常全面的总结，强烈建议保存下来，在需要时看看

文章目录

MySQL分库分表详解
- - 1、什么是分库分表，何时要分库分表
  - - 背景知识：
    - 1.1、数据库分片
    - 1.2、为什么需要分库分表
    - 1.3、拆分方式
    - 1.4、何时分库分表
    - 1.5、如何选择分库分表
  - 2、十亿级商品数据，分库分表核心流程详解
  - - 2.1、完整流程如下所述
    - 2.2、使用到的分库分表工具
  - 3、分库分表带来的问题及如何解决(重点)
  - - 问题1：分布式id：分库分表后，保证id的唯一性(要保证单调递增)
    - 问题2、分布式事务问题
    - 问题3、跨库join / 分页查询问题
    - 问题4、成本问题
  - 4、日千万级的订单系统分库分表核心内容简要分享
  - 5、阿里云drds方案处理分库分表
  - 6、MySql分库分表与读写分离
  - - 6.1、什么是MyCat？
    - 6.2、中间件操作数据库的步骤
    - 6.3、MyCat使用案例
    - 6.4、MyCat关联查询的问题
    - 6.5、Mycat的分布式事务？XA ？20181222

1、什么是分库分表，何时要分库分表

背景知识：

1、海量数据的存储问题

传统的关系性数据库已经无法满足快速查询与插入数据的需求。这个时候NoSQL的出现暂时解决了这一危机。它通过降低数据的安全性，减少对事务的支持，减少对复杂查询的支持，来获取性能上的提升。有些场合NoSQL是无法满足使用场景的，比如有事务与安全指标的。从单机mysql --》memcached+mysql+垂直拆分 --》mysql主从复制 --》分库分表+水平拆分+mysql集群

2、如果使用关系型数据库解决海量存储的问题呢？

此时就需要做数据库集群，为了提高查询性能将一个数据库的数据分散到不同的数据库中存储。

3、mysql性能瓶颈分析

数据库连接数，默认是100个连接数
单表数据量大，阿里规定单表数据量500万条 数据量大，IO操作就多
硬件资源（QPS/TPS 每秒查询数/每秒事务量）

4、大数据量数据库性能的解决方案？

分库分表
索引优化（数据量1个亿且查询不太复杂时，没什么问题）
读写分离

1.1、数据库分片

1、什么是数据库分片
指通过某种特定的条件，将我们存放在同一个数据库中的数据分散存放到多个数据库上面，以达到分散单台设备负载的效果

概念：

分库，就是把数据拆分到不同的 MySQL 库中去
- 如下图所示，库里面放了两张表：SPU和SKU表，我们将这两张表拆分到两个不同的库里面
分表：在数据量不变的情况下，把数据拆分到同一个库的多张表里面
- 如下图所示，将SPU表由一张拆分为四张
分库分表：数据库数量和表数量都发生变更
- 如下图所示，库里面放了一张SPU表，我们将这张表拆分到两个不同的库里面，每个库拆分成两张表
使用场景
- 绝大部分的电商大厂，只有 MySQL 这类关系型数据库，才能提供金融级的事务保证

1.2、为什么需要分库分表

为什么进行分库分表？

MySQL 支持不了这么大的数据量，这么高的并发，但还必须要用它

分库分表的目的

①数据量太大查询慢（事务中的查询和更新操作）
- 只读的查询可以通过缓存和主从分离来解决
- 解决查询慢，只要减少每次查询的数据总量就可以了，也就是说，分表就可以解决问题
②应对高并发的问题
- 一个数据库实例撑不住，就把并发请求分散到多个实例中去
数据量大，就分表；并发高，就分库
这时候分多少个库，多少张表，分别用预估的并发量和数据量来计算就可以
越简单的设计可靠性越高

1.3、拆分方式

分库分表有垂直切分和水平切分

①垂直切分(复杂度低)：即将表按照功能模块、关系密切程度划分出来，部署到不同的库上。我们会建立定义数据库 workDB、商品数据库 payDB、用户数据库 userDB、日志数据库 logDB 等，分别用于存储项目数据定义表、商品定义表、用户数据表、日志数据表等
垂直拆分带来的问题？
分布式事务（通过模块调用接口来解决）
–》从连接数和硬件资源两方面进行了解决
②水平切分(复杂度高)：当一个表中的数据量过大(超过1000万，就要警觉起来)时，我们可以把该表的数据按照某种规则，例如userID散列，进行划分，然后存储到多个结构相同的表，和不同的库上。

如下图所示

垂直拆分如图所示：

水平拆分如图所示：

总体原则：那就是能不拆就不拆，能少拆不多拆，先才用加索引、读写分离解决性能问题，实在不行后，才考虑使用分库分表
读写分离（主从模式）
- 1、什么是读写分离
  - 在实际的应用中，绝大部分情况都是读远大于写，Mysql提供了读写分离的机制，所有的写操作都必须对应到Master，读操作可以在Master和Slave机器上进行，Slave与Master的结构完全一样，甚至Slave下还可以挂Slave,通过此方式可以有效的提高DB集群的每秒查询率。一个写节点Master后面跟着多个读节点，所有的写操作都是先在Master上操作，然后同步更新到Slave上
- 2、MySql基于binlog的主从复制原理（通过数据库厂商提供的bin log机制）
  - master–》binary log《-》io Thread–write–》relay log（中继日志）《–》sql Thread
  - 复制的基本原理？
    - 1、binlog事件 //master将改变记录到二进制文件binary log；
    - 2、relay log //slave将master的binlog事件拷贝到他的中继日志
    - 3、slave重做中继日志中的事件，将改变应用到自己的数据库中，Mysql复制是异步的且串行化
- 3、主从复制带来的问题？
  - 可能出现时延，使用级联主从来解决，或是代码判断，要是真的出现时延，再进行解决；
  - 判断主从是否出现延时seconds-behind-master：0；
  - 若是超过5秒，则强制去主库读取数据
    - =>一般的业务不可能把主从搞出延时，老师只遇见过一次：到同行数据时，600万用户数据同时加载
    - =》因为数据库之间是在内网传输，延时一般很小
- 4、总结：
  - 1、当读压力很大的时候，可以考虑添加Slave机器的分式解决，但是当Slave机器达到一定的数量就得考虑分库了；
  - 2、当写压力很大的时候，就必须得进行分库操作；
  - 3、全局的ID(不能使用mysql的自增id，要使用全局的id)

1.4、何时分库分表

总体来说：性能出现瓶颈，并且其他优化手段无法很好的解决问题

单表出现瓶颈：
- 单表数据量较大，导致读写性能较慢
单库出现瓶颈
- CPU压力过大(busy，load过高)，导致读写性能较慢
- 内存不足(缓存池命中率较低、磁盘读写IOPS过高)，导致读写性能较慢
- 磁盘空间不足，导致无法正常写入数据
- 网络带宽不足，导致读写性能较慢

Action : 数据量超过多少应该分库分表：看对应业务复杂情况，如果是表字段较为简单，即使数据量超过亿级，整体读写性能也较好，不用分表；如果表比较复杂，可能即使数据量超过百万，读写性能就达到瓶颈。

1.5、如何选择分库分表

只分表：
- 单表数据量较大，单表读写性能出现瓶颈
- 经过评估单库的容量和性能可以支撑未来几年的增长
只分库：
- 数据库(读)写压力较大，数据库出现存储性能瓶颈
分库分表
- 单表数据量较大，单表读写性能出现瓶颈；
- 数据库(读）写压力较大，数据库出现存储性能瓶颈

2、十亿级商品数据，分库分表核心流程详解

2.1、完整流程如下所述

评估是否需要拆分
- 是否有其他更轻量的优化手段可以解决问题
拆分详细技术方案
- 流程梳理及影响评估
- 方案选型
- 拆分SOP(标准操作程序，重要)
  - 1、目标评估
    - 评估：拆成几个库、几个表
    - 目标：读写能力提升X倍、负载降低Y%，容量要支持未来Z年的发展
    - 举例：当前2亿，5年后评估为10亿。分几个表？分几个库？
    - 解答：一个合理的答案，128个表，16个库。按128个表算，拆分完单表156万，5年后为781万
  - 2、切分策略–范围切分
    - 优点：天然水平扩展；单表大小可控
    - 缺点：热点数据一般为新增数据，存在明显的写偏移
    - 适用场景：数据归档
    - 切分策略–中间表映射
      - 优点：灵活；
      - 缺点：引入了额外的单点，增加了流程复杂度。
    - 切分策略–hash切分
      - 优点：数据分片比较均匀，不容易出现热点和并发访问的瓶颈；
      - 缺点：后续扩容需要迁移数据、存在跨节点查询等问题；
      - 适用场景：大部分场景下都能适用。
  - 3、分表字段(sharding key)
    - 核心思路：合理选择，尽量减少出现跨库、跨表查询
    - 例子：10个库，1000张表：0 ~ 99、100 ~ 199、200~999、…
    - 分表字段：shopId，值为1234
    - 数据表编号：shopId% 1000 =1234 % 1000 =234
    - 数据库编号：shopId% 1000 =1234 % 1000 / 10 = 2
    - 思考：订单应该如何选择分表字段？见下文
  - 4、资源准备、代码改造
    - 核心流程：
      - 数据库资源准备
      - 分库分表规则配置等
      - 代码改造：
        
        写入：单写老库、双写、单写新库
        
        读取：读老、读新、部分读老部分读新
        
        灰度：指定门店灰度、比例灰度
      - 所需资源尽早跟dba申请
        
        1、将新集群的数据源引入到我们的服务中；
        
        2、支持灵活的灰度读写切换；
        
        3、数据全量迁移和一致性校验等任务；
        
        4、增量数据同步：双写
  - 5、常见的双写方案
    - 作用：保证增量数据在新库和老库都存在
    - 方案：
      - 1、同步双写：同步写新库和老库
      - 2、异步双写：写老库，监听binlog 异步同步到新表
      - 3、中间件同步工具：通过一定的规则将数据同步到目标库表
    - 我们公司使用的是阿里云DTS
    - 注意点：
      - 写新库异常不能影响流程
    - 实现方案：
      - 底层通过AOP方式实现，不会修改全部写逻辑
  - 6、全量数据迁移
    - 作用：迁移老库历史数据，保证新库有全量数据
    - 方案：
      - 1、开发Job：查询老库数据，写入新表；
      - 2、中间件同步工具：通过一定的规则将数据同步到目标库表(建议)
    - 注意点：
      - 控制好同步速率
      - 和增量数据的并发问题
  - 7、数据一致性校验、优化、补偿 (最重要)
    - 作用：确保新库数据正确，达到切读标准、检查是否存在改造遗漏点
    - 方案：增量数据校验、全量数据校验、人工抽检
    - 核心流程：
      - 读取老库数据
      - 读取新库数据
      - 比较新老库数据，一致则继续比较下一条数据
      - 不一致则进行补偿：
        
        新库存在，老库不存在：新库删除数据
        
        新库不存在，老库存在：新库增加数据
        
        新库存在，老库不存在：比较所有字段，不一致则将新库更新为老库数据
  - 8、灰度切读
    - 作用：开始将读流量切到新库
    - 原则：
      - 有问题及时切回老库
      - 灰度放量先慢后快，每次放量观察一段时间
      - 支持灵活的规则：门店维度灰度、百分比灰度
  - 9、databus 切新库
    - 作用：使用新库的databus、canal
    - 核心流程：
      - 启动新库databus、canal，此时下游会同时收到新老库的binlog
      - 观察一段时间是否正常
      - 有问题及时关闭
      - 没问题后，关闭老库databus、canal
  - 10、下游切换数据源
    - 作用：确保下游迁移到新数据源，主要是数仓
    - 数仓一般是每天同步一次数据，因此在指定时间内切换即可。
  - 11、停写老库
    - 原则：确认老库数据源全部迁移后，停写老库
    - 至此，核心拆分流程结束，后续逐步将老数据库资源逐渐下线。
    - 整体流程图汇总如下：
- 稳定性保障
技术方案内部评审及优化
同步相关影响方
进行拆分

2.2、使用到的分库分表工具

binlog监听工具
- Databus
- Canal
分库分表工具
- 1、增强版的JDBC驱动
  - 以客户端 jar包形式提供了对JDBC的封装，客户端直连数据库
  - 开源：Sharding-JDBC、TDDL、Zebra
- 2、数据库代理
  - 需要单独部署，客户端连接代理服务，代理服务负责跟数据库打交道
  - 开源：Sharding-Proxy、MyCat
  - 收费：阿里云DRDS

3、分库分表带来的问题及如何解决(重点)

问题1：分布式id：分库分表后，保证id的唯一性(要保证单调递增)

解决方案1：UUID
- 优点：
  - 本地生成，性能高
- 缺点：
  - 更占用存储空间，一般为长度36的字符串
  - 不适合作为MySQL主键
    - 无序性会导致磁盘随机IO、叶分裂等问题
    - 普通索引需要存储主键值，导致B+树“变高”，IO次数变多
  - 基于MAC地址生成的算法可能导致MAC地址泄漏
方案2：雪花算法
- 41 bit时间戳：可用69年
- 10bit工作机器：可部署1024台服务器
- 12bit序列号：每毫秒可生成4096个ID，每秒也就是409万
方案3：号段模式
- 原来：是按数据表自增得到唯一id，现在：批量生成1000条数据，拿到其ids

以美团外卖为例，商品的分表

用户视角：查询商品时，会展示shopId
商家视角：查询商品时，也会展示shopId
shopId覆盖了最高频的几个使用场景

订单的分表

用户视角：查询到自己的所有订单，用户id
商家视角：商品查询自己的所有订单，商家id
运营视角：订单id字段
- 为了支持按订单号查询，可以把用户id的后几位放到订单号中

如何选择 Sharding Key？

选择一个合适的列或者说是属性，作为分表的依据，这个属性一般称为 Sharding Key

问题2、分布式事务问题

原本在同一个数据库中不同的表可以在同一个事务中修改，业务分库后，表分散到不同的数据库中，无法通过事务统一修改。虽然数据库厂商提供了一些分布式事务的解决方案（例如，MySQL 的 XA），但性能实在太低，与高性能存储的目标是相违背的。
解决方案
- 1、2PC(Two Phase Commitment)
  - 如下图所示，核心思想是将事务操作分为两个阶段，第一阶段是协调者首先询问所有事务参与者是否可以执行事务的提交操作；第二阶段是协调者根据所有参与者返回结果决定是否提交操作，如果全部的参与者都返回成功，则协调者向所有参与者发送事务提交请求；否则协调者向所有参与者发送事务中断回滚请求
  - 优点：流程简单
  - 缺点：存在同步阻塞、协调者单点等问题
  - 数据库层面的处理
- 方案2：TCC （try confirm cancel）
  - 核心思想：针对每个操作都有一个对应的确定和取消操作，TCC中有主服务(可以理解为交易)和从服务(可以理解为订单和库存)两个角色。首先主服务会调用所有从服务的try接口进行业务检查和资源预留，然后主服务会根据所有从服务返回结果决定是否提交事务；如果从服务确认成功，则调用所有从服务的confirm接口进行事务确认提交操作，否则会调用所有从服务的cancel接口执行事务的取消，并释放预留资源；
  - 应用层面的处理
  - 实际业务中的使用方式（保证最终一致即可，金融场景是个特例）
  - 回滚
  - 重试
  - 监控
  - 告警
  - 幂等
  - 对账
  - 人工补偿(终极手段)

问题3、跨库join / 分页查询问题

业务分库后，原本在同一个数据库中的表分散到不同数据库中，导致无法使用 SQL 的 join
查询。

拆分后：影响了哪些操作

join操作
水平分表后，数据分散在多个表中，如果需要与其他表进行 join 查询，需要在业务代码或
者数据库中间件中进行多次 join 查询，然后将结果合并。
count操作
水平分表后，虽然物理上数据分散到多个表中，但某些业务逻辑上还是会将这些表当作一个表来处理。例如，获取记录总数用于分页或者展示，水平分表前用一个 count() 就能完成的操作，在分表后就没那么简单了。常见的处理方式有下面两种：
- ①count() 相加：具体做法是在业务代码或者数据库中间件中对每个表进行 count() 操作，然后将结果相加。这种方式实现简单，缺点就是性能比较低。例如，水平分表后切分为 20 张表，则要进行 20 次 count(*) 操作，如果串行的话，可能需要几秒钟才能得到结果。
- ②记录数表：具体做法是新建一张表，假如表名为“记录数表”，包含 table_name、row_count 两个字段，每次插入或者删除子表数据成功后，都更新“记录数表”。
order by 操作
水平分表后，数据分散到多个子表中，排序操作无法在数据库中完成，只能由业务代码或者数据库中间件分别查询每个子表中的数据，然后汇总进行排序。

业界主流解决方案：

方案1：选择合适的分表字段(sharding key)
- 合理选择，避免过多的跨库查询，保证绝大多数高频查询场景
方案2：使用搜索引擎支持ES
- 数据冗余到ES，使用ES支持复杂查询
- 核心流程：
  - 使用ES查询出关键字段，例如：店铺id和商品id
  - 再使用关键字段去数据库查询完整数据
- 注意点
  - ES只存储需要搜索的字段
方案3：分开查询，内存中聚合
- 先查询出A表数据，然后根据A表的结果查询B表
- 注意点：
  - 查询出来的数据量
  - 占用内存情况
方案4：冗余字段
- A表查询需要B表的field1字段，则将B表的field存储一份到A表上
- 适用场景：
  - 只需要少量字段，则可以直接冗余

问题4、成本问题

业务分库同时也带来了成本的代价，本来 1 台服务器搞定的事情，现在要 3 台，如果考虑
备份，那就是 2 台变成了 6 台。

4、日千万级的订单系统分库分表核心内容简要分享

todo

5、阿里云drds方案处理分库分表

商品中心的方案
- 背景：商品主表共1亿6千多万条数据(截止20210810，有效数据共1亿1千万条数据)
- 架构：使用阿里云提供的drds，分为三层，第一层是drds代理层(读写库sg85 只读库wr20),第二层是主rds数据库，共4个实例（16台机器），从rds数据库，共8个实例(32台机器)
  项目的读操作，只会读取从rds数据库中的部分实例
用户中心的方案
- todo

6、MySql分库分表与读写分离

6.1、什么是MyCat？

面向企业应用开发的“大数据集群”，支持事务、ACID、一个数据库中间件产品（作为后面MySql集群的proxy使用，默认端口：8066）
作用：提高可用数据分片集群，支持读写分离，支持MySql双主多从，一主（写数据库）多从（读数据库）
当添加一条记录时要向哪个数据库中插入呢？这些问题处理起来都是非常的麻烦。这种情况下可以使用一个数据库中间件mycat来解决相关的问题
用法：现在把数据库中所有的item一千五百万本（图书表）分片存储到三个数据节点中。可以是三台mysql数据库。
- 节点一：db1存储500万条数据节点二：db2 500万；节点三：db3 500万；
- 如何分配：1、根据主键id按段切分 2、根据id取模运算
  - 配置schema。xml文件，管理mycat的逻辑库，表，分片规则，数据节点，数据源 rule= auto-sharding-long mycat会根据此规则自动分片
- 读写分离：一个写节点master后面跟着多个读节点。读节点的数量取决于系统的压力。写数据库和读数据库建立主从复制，使用mysql厂商自带的binlog，然后建立mycat和mysql的心跳检查。
- 使用：mysql主数据库修改my.conf文件，musqld下面添加数据库及IP的配置信息状态：File/position/binlog_Do_DB/binlog_ignore-DB。从数据库修改my.conf文件 change master to master_host=‘’,master_post=‘’,master_user=‘’,master_password=‘‘master_log_file=’’,master_log_pos=‘’
  当slave_io_Running:YES且slave_SQL_Running:YES,说明配置成功
  mycat配置支持mysql主从复制状态绑定的读写分离机制 balance writeType switchType

6.2、中间件操作数据库的步骤

1、解析sql语句
2、数据源管理
3、数据源分配
4、请求/响应
5、结果整合

6.3、MyCat使用案例

1、概念：逻辑库（使用mycat来管理）db_user,db_store 逻辑表：分片表user，全局表（数据字典冗余），ER表（user地址只能存放在单一的数据库中，跟着主表一起走），非分片表（门店表，店员表）
应用程序分为db_user(用户表、数据字典，用户地址表)和db_store(订单表，店员表)
经常使用的数据不变性，在后台的每个mysql中都保存一份（如数据字典最好冗余查询**）
用户表进行模2运算，store表进行主从复制

2、conf目录下，有三个关键的配置文件

scheme.xml管理mycqt实例中的逻辑库，表，分片规则，DataNode，DataSource
server.xml
rule.xml 定义了我们队表进行拆分所设计到的规则定义
有连续分片和离散分片两种
连续分片扩容无需迁移数据，范围查询资源消耗小但是存在热点数据问题
离散分片：分片均匀，并发强缺点：移植性差

3、现有系统如何使用MyCat？

当当、美团正在做这方面的工作
mysql Dump命令生成backup.sql文件，控制台：mysql -f backup.sql或Source backup.sql

6.4、MyCat关联查询的问题

解决方案：
1、用好ER表，子表跟随父表
2、善用全局表冗余数据
3、注解方式

6.5、Mycat的分布式事务？XA ？20181222

如何保证强一致性
两阶段提交弱XA的两阶段提交
TCC补偿机制

当你的才华还撑不起你的野心时，就应该静下心来学习

Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
3.增删改查--连接查询问女何所忆
关系型数据库的一个特点就是，多张表之间存在关系，以致于我们可以连接多张表进行查询操作，所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种，交叉连接、内连接和外连接，我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：如果你没学过数学中的笛卡尔积概念，你可以这样简单的理解这里的交叉连接：两张表的交叉连接就是一个连接合并的过程，T1表中
程序员架构师主要是做什么_程序员架构师：职责、技能与挑战绿色小猪
免费备考资料（2024年11月软考）：历年试题+视频课合集+电子讲义点击领取>>>免费刷题：2024年11月软考备考刷题点此进入>>>程序员架构师的角色定位在软件开发领域，程序员架构师是一个至关重要的角色。他们不仅需要深入理解业务需求，还要将其转化为技术上的解决方案。程序员架构师是项目中的技术领航者，负责制定和维护软件系统的整体架构，确保系统的可扩展性、可维护性和性能。他们的工作涉及从概念化到实现
docker from指令的含义_多个FROM-含义 weixin_39722188 docker from指令的含义
小编典典什么是基本图片？一组文件，加上EXPOSE端口ENTRYPOINT和CMD。您可以添加文件并基于该基础图像构建新图像，Dockerfile并以FROM指令开头：后面提到的图像FROM是新图像的“基础图像”。这是否意味着如果我neo4j/neo4j在FROM指令中声明，则在运行映像时，neo数据库将自动运行并且可在端口7474的容器中使用？仅当您不覆盖CMD和时ENTRYPOINT。但是图像
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your †徐先森® Oracle数据库 Web相关错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
Redis 有哪些危险命令？如何防范？花小疯 redis 缓存数据库危险命令大数据
Redis有哪些危险命令？Redis的危险命令主要有以下几个：1.keys客户端可查询出所有存在的键。2.flushdb删除Redis中当前所在数据库中的所有记录，并且此命令从不会执行失败。3.flushall删除Redis中所有数据库中的所有记录，不止是当前所在数据库，并且此命令从不会执行失败。4.config客户端可修改Redis配置。怎么禁用和重命名危险命令？看下redis.conf默认配置
【Golang】 Golang 的 GORM 库中的 Rows 函数不爱洗脚的小滕 golang 开发语言后端
文章目录前言一、Rows函数解释二、代码实现三、总结前言在使用Go语言进行数据库操作时，GORM（GoObject-RelationalMapping）库是一个常用的工具。它提供了一种简洁和强大的方式来处理数据库操作。本文将介绍GORM库中的Rows函数，这是一个用于执行原生SQL查询并返回结果的函数。一、Rows函数解释在GORM库中，Rows函数用于执行原生SQL查询并返回*sql.Rows结
深入理解Python中的“_,”：一个实用的语法特性小桥流水---人工智能 Python程序代码 Python常见bug 深度学习 python 开发语言
在Python编程中，你可能经常会看到一个特殊的标识符“_”。这个符号在Python中有多种用途，其具体含义依上下文而定。本文将探讨其中一种常见用法——作为一个临时性的占位符——并解释它在实际编程中的实用性和应用场景。1.“_”作为占位符在Python中，下划线（_）经常被用作一个临时或不重要的变量。当你在解包（unpacking）一个表达式但又不想使用其中某些值时，下划线可用作占位符。这样做的好
接口测试如何设计测试用例李蕴Ronnie
接口测试用例设计方式针对每个必填参数，都设计一条参数为空的测试用例必填参数不存在传的参数值在数据库中不存在添加数据接口，传入已有的数据重复添加编辑数据接口，各个字段分别编辑，合并编辑参数数据类型限制，针对每个参数设计一条参数值类型不符合的逆向用例参数自身取值范围，针对所有参数，设计一条每个参数值在取值范围内最大值的正向测试用例是否满足前提条件（token、headers），几个前提条件几条用例针对
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?