皆是梦

mysql（九）mysql主从复制

前言
概述
- 提出问题
- 主从复制的用途
- 工作流程
主从复制的配置
- 创建复制账号
- 配置主库和从库
- 启动主从复制
- 从另一个服务器开始主从复制
- 主从复制时推荐的配置
- - sync_binlog
  - innodb_flush_logs_at_trx_commit
  - innodb_support_xa=1
  - innodb_safe_binlog
主从复制的原理
- 基于语句复制
- - 优点：
  - 缺点：
- 基于行复制
- - 优点：
  - 缺点：
- 主从复制用到的文件
- - mysql-bin.index
  - mysql-relay-bin-index
  - master.info
  - relay-log.info
- 发送复制事件到其他的从库
主从复制拓扑
- 一主库多从库
- - 用途
- 主动-主动模式下的主-主复制
- 主动-被动模式下的主-主复制
- 拥有从库的主-主结构
- 主库，分发主库以及从库
- 树或金字塔型
- 定制的复制方案
- - 选择性复制
  - 分离功能
  - 数据归档
  - 只读从库
复制和容量规划
如何测量从库延迟
检查主从是否一致
从主库重新同步从库

前言

MySQL的内建功能是构建基于MySQL的大规模，高性能应用的基础，这类应用使用所谓的“水平扩展”的架构。我们可以通过为服务器配置一个或多个从库的方式来进行数据同步，复制功能不仅有利于构建高性能的应用，同时也是高可用，可扩展性，灾难恢复，备份以及数据仓库等工作的基础。

概述

复制解决的基本问题是让一台服务器的数据与其他服务器保持同步。一台主库的数据可以同步到多台设备上，从库本身也可以被配置到另外一台服务器的书库。主库和从库可以有多种不同的组合方式。

MySQL支持两种复制方式

基于行的复制
基于语句的复制

这两种方式都是通过在主库上记录二进制日志,在从库重放日志的方式来实现异步的数据复制。这意味着，在同一时间点从库上的数据可能与主库存在不一致，并且无法保证主从之间的延迟。一些大的语句可能导致从库产生几秒，几分钟甚至几个小时的延迟。

MySQL通常是向后兼容的，新版本的服务器可以作为老版本服务器的从库，但反过来，将老版本作为新版本服务器的从库通常是不行的，因为它可能无法解析新版本所采用的的新的特性或语法，另外所使用的的二进制文件的格式也可能不太相同。

主从复制通常不会增加主库的开销，主要是启用二进制日志带来的开销，但是出于备份或及时从崩溃中恢复的目的，这点开销也是必要的。除此之外，每个从库也会对主库增加一些负载（例如I/O开销），尤其当从库请求从主库读取旧的二进制日志文件时，可能会造成更高的I/O开销。另外锁竞争也可能阻碍事务的提交。最后，如果是从一个高吞吐量（例如5000或者更高的TPS）的主库上复制到多个从库，唤醒多个线程发送事件的开销将会累加。

通过主从复制可以将读操作指向从库来获得更好的读扩展，但是对于写操作，除非设计得当，否则并不适合通过主从复制来扩展写操作。在一主库多从库的架构中，写操作会被执行多次，这个时候整个系统的性能取决于写入最慢的那部分

提出问题

此时我们想一想，当使用一主库多从库的时候，可能会造成一些浪费，因为本质上它会复制大量不必要的重复数据。例如，对于一台主库和十台从库的时候，会有十一份数据拷贝，并且这十一台服务器的缓存中储存了大部分相同的数据。这和服务器上有十一路RAID 1类似。这不是一种经济的硬件使用方式。但这种复制架构却很常见，稍后我们会讨论解决这个问题的方法。

主从复制的用途

数据分布
MySQL主从复制通常不会对贷款造成很大压力，但是在5.1版本引入的基于行的复制会比传统的基于语句的复制模式带来的贷款压力更大。你可以随意的停止或者开始复制，并在不同的地理位置来分布数据备份。但如果为了保持很低的复制延迟，最好有一个稳定的，低延迟的连接
负载均衡
通过主从复制可以将读操作分布到多个服务器上，实现对密集型应用的优化，并且实现很方便，通过简单的代码修改就能实现基本的负载均衡。对于小规模的应用，可以简单的对机器名做硬编码或使用DNS轮询（将一个机器名指向多个IP地址）。当然也可以使用更复杂的方法，例如网络负载均衡这一类的标准负载均衡解决方案，能够很好的将负载分配到不同的MySQL服务器上。
备份
对于备份来说，复制是一项很有意义的技术补充，但复制既不是备份也不能够取代备份
高可用和故障切换
复制能够帮助应用避免MySQL单点失败，一个包含复制的设计良好的故障切换系统能够明显得缩短宕机时间
MySQL升级测试
这种做法比较普遍，使用一个更高版本的MySQL作为从库，保证在升级全部实例前，查询能够在从库按照预期执行。

工作流程

MySQL实际上是如何复制数据的。总的来说，分为如下三个步骤：

在主库上记录二进制日志（Binary Log）。在每次准备提交事务完成数据更新前，主库将数据更新的事件记录到二进制日志（Binary Log）中，MySQL会按照事务提交的顺序而非每条语句的执行顺序来记录二进制日志。在记录二进制日志后，主库会告诉存储引擎可以提交事务了。
从库将主库的二进制日志（Binary Log）复制到其本地的中继日志（Relay Log）当中。首先，从库会启动一个工作线程，成为I/O线程，I/O线程跟主库建立一个普通的客服端连接，然后在主库上启动一个特殊的二进制转储（binlog dump）线程（该线程没有对应的SQL命令），这个二进制转储线程会读取主库上二进制日志（Binary Log）中的事件。他不会对事件进行轮询。如果该线程追赶上了主库，它将进入睡眠状态，直到主库发送信号量通知其有的新的事件产生时才会被唤醒，备库I/O线程会将接收到的事件记录到中继日志中。
从库的SQL线程会执行最后一步。该线程从中继日志（Relay Log）中读取事件并在从库中执行，从而实现从库的数据更新。当SQL线程追赶上I/O线程时，中继日志（Relay Log）通常已经在系统缓存中，所以中继日志（Relay Log）的开销很低。SQL线程执行的事件也可以通过配置选项来决定是否写入其自己的二进制日志（Binary Log）中，它对我们稍后提到的场景非常有用

上图中显示了在从库中有两个运行的线程，在主库中也有一个运行的线程，这种复制架构实现了获取事件和重放时间的解耦，允许这两个过程异步进行。也是就说I/O线程能工独立于SQL线程之外工作。这种架构也限制了复制的过程，其中很重要的一点是在主库上并发运行的查询在从库只能串行化执行，因为只有一个SQL线程来重放中继日志中的事件，这个会是很多工作负载的性能瓶颈所在。

主从复制的配置

为MySQL服务器配置非常简单。但由于场景不同。基本的步骤有所差异。最基本的场景是新安装的主库和从库，总的来说分为以下几步：

在每台服务器上注册新的账号
配置主库和从库
通知从库连接到主库并从主库上复制数据

这里我们假定大部分配置采用默认值即可，在主库和从库都是全新安装并且拥有同样的数据时这样的假设是合理的。

创建复制账号

MySQL会赋予一些特殊的权限给复制线程。在从库运行的I/O线程会建立一个到主库的TCP/IP连接，这意味着必须在主库创建一个用户，并赋予权限。从库I/O线程以该用户名连接到主库并读取其二进制日志

mysql> CREATE USER 'repl'@'%' IDENTIFIED BY 'Dxl199522@';
mysql> GRANT REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'repl'@'%';
mysql> flush privileges;

REPLICATION SLAVE: 这是一个权限选项，表示授予用户主从复制的权限。主从复制是 MySQL 数据库中的一种特性，它允许一个 MySQL 服务器（从服务器）从另一个 MySQL 服务器（主服务器）复制数据。
REPLICATION CLIENT: 这是另一个权限选项，表示授予用户复制客户端的权限。复制客户端权限允许用户查看复制相关的状态和信息。

我们在主库和从库都创建该账号

复制账户事实上只需要有主库上的REPLICATION SLAVE权限，并不一定需要每一端服务器都有REPLICATION CLIENT权限，那为什么我们要把这两种权限给主/从库都赋予呢?这有两个原因:
1.用来监控和管理复制的账号需要 REPLICATION CLIENT权限，并且针对这两种目的使用同一个账号更加容易 (而不是为某个目的单独创建一个账号)。
2.如果在主库上建立了账号，然后从主库将数据克隆到备库上时，备库也就设置好了一一变成主库所需要的配置。这样后续有需要可以方便地交换主备库的角色。

配置主库和从库

首先在主库上开启一些设置，需要打开二进制日志并指定一个独一无二服务器ID，在主库的my.cnf文件中增加或者修改如下内容并重启：

log_bin=mysql-bin
server_id=10

必须明确的指定一个唯一的服务器ID，默认服务器ID通常为1。使用默认值可能会导致和其他服务器的ID冲突，因此这里我们选择10来作为服务器ID。一种通用的做法是使用服务器IP地址的末8位，但要保证它是唯一不变的。最好选择一些有意义的约定并遵循。

此时使用命令

mysql> show master status;

从库上也需要在my.cnf中增加类似的配置，并且同样需要重启服务器

log_bin=mysql-bin
server_id=2
relay_log=/var/lib/mysql/mysql-relay-bin
log_slave_updates=1
read_only=1

从技术上，这些选项只有server_id是必须的。这里我们也使用了log_bin,并赋予了一个明确的名字。默认情况下，它是根据机器名来命名的，但如果机器名变化了可能会导致问题。为了简便起见，我们将主库和从库上的log_bin设置为相同的值。

除此之外我们还增加了两个配置选项：

relay_log:指定中继日志的位置和命名
log_updates:允许从库将其重放的事件也记录到自身的二进制日志中，此选项会给从库增加额外的工作，但是在文章会提到为什么要添加改配置

启动主从复制

告诉从库如何连接到主库并重放进其二进制日志。

mysql> CHANGE MASTER TO MASTER_HOST='192.168.99.145',
MASTER_USER='repl',
MASTER_PASSWORD='Dxl199522@',
MASTER_LOG_FILE='mysql-bin.000001',
MASTER_LOG_POS=0;

MASTER_LOG_POS参数被设置成0，因为要从日志的开头读起。当在从库中执行完这条语句之后，可以通过

mysql> show slave status\G

图中参数显示当前从库复制尚未运行

运行命令开始复制

mysql> start slave;

执行该命令后没有显示错误，然后使用show slave status查看状态显示

从输出上看出I/O和SQL线程都开始运行,此时已经完成最基本场景的主从复制了。

从另一个服务器开始主从复制

上述的设置主库和从库都是刚刚安装切都是默认的数据，也就是说两台服务器上的数据已经相同，并且知道当前主库的二进制文件。但是现实的场景往往是已经运行了一段时间的主库，然后用一台新安装的从库与之同步，此时这台设备还没有数据。那么如何初始化从库呢

需要有三个条件来让主库和从库保持数据同步：

在某个时间点的主库的数据快照
主库当前的二进制日志文件，和获得数据快照时在该二进制日志文件中的偏移量，我们把这两个值称为日志文件坐标（log file coordinates）。通过这两个值可以确定二进制日志的位置。可以通过show master status命令来获得
从快照时间到现在的二进制日志

例举初始化从库的方法

使用冷备份
最基本的方式就是关闭主库，把数据复制到主库。重启主库后，会使用一个新的二进制日志文件，我们在从库通过执行CHANGE MASTER TO指向这个文件的起始处。但这个方式缺点很明显，在复制数据的时候，需要关闭主库。
使用mysqldump
如果只包含InnoDB表，那么可以使用以下命令来转储主数据库数据并将其加载到从库，然后设置相应的二进制日志坐标

mysqldump --single-transaction --all-databases --master-data=1 --host=server1 | mysql --host=server2

- single-transaction：这个选项告诉 mysqldump 使用单个事务来获取数据，以确保备份的数据是一致的。这对于生产环境中的备份非常有用，因为它避免了对数据库的读锁，使得数据库在备份期间可以正常提供读取服务。

- all-databases：这个选项指示 mysqldump 备份所有数据库，而不仅仅是一个单独的数据库。

- master-data=1：这个选项告诉 mysqldump 在备份文件中添加二进制日志文件和位置的信息，这将用于初始化从库。

使用快照或备份
只要知道对应的二进制日志标,就可以使用主库的快照或者备份来初始化从库 (如果使用备份，需要确保从备份的时间点开始的主库二进制日志都要存在)。只需要把备份或快照恢复到从库，然后使用CHANGE MASTER TO指定二进制日志的坐标
使用另外的从库
可以使用任何一种提及的克隆或者拷贝技术来从任意一台从库上将数据克隆到另外一台服务器。但是如果使用的是 mysgldump，–master-data 选项就会不起作用。此外，不能使用SHOW MASTER STATUS来获得主库的二进制日志标，而是在获取快照时使用SHOW SLAVE STATUS来获取从库在主库上的执行位置。使用另外的从库进行数据克隆最大的缺点是，如果这台从库的数据已经和主库不同步，克隆得到的就是脏数据。

主从复制时推荐的配置

sync_binlog

该配置是主库上二进制日志最重要的选项

sync_binlog=0：表示不同步写入二进制日志文件。这意味着 MySQL 不会等待操作在二进制日志文件中写入磁盘后才返回，而是立即返回。这样可能会提高性能，但也会增加风险，因为未同步的数据可能在宕机等情况下丢失。
sync_binlog=1：表示每次写入二进制日志都会等待操作在日志文件中同步到磁盘后才返回。这样可以确保数据的持久性，但也会对性能产生一些影响。
sync_binlog=N：表示每 N 次写入操作后才进行同步。这可以在一定程度上权衡性能和数据持久性。

需要注意的是，选择适当的 sync_binlog 设置取决于你的应用需求以及对性能和数据安全性的权衡考虑。如果应用对数据的持久性要求较高，可以选择较小的值，甚至是 sync_binlog=1。如果对性能要求较高，可以选择较大的值或者关闭同步。

如果使用InnoDB,强烈推荐设置如下选项:

innodb_flush_logs_at_trx_commit

这个参数用于控制事务的日志刷新行为。它有三个可能的值：

0：表示事务提交时不会将日志刷新到磁盘，而是定期刷新。这可能会在故障时丢失一些事务。
1：表示事务提交时会立即将日志刷新到磁盘。这可以保证事务的持久性，但会对性能产生一定影响。
2：表示事务提交时将日志写入操作系统的缓存，但不会立即刷新到磁盘。这在某些情况下可以提高性能，但在操作系统崩溃的情况下可能会丢失一些事务。

innodb_support_xa=1

这个参数用于控制是否支持分布式事务（XA 事务）。如果设置为 1，表示 InnoDB 存储引擎支持 XA 事务，可以与其他数据库或应用协调执行分布式事务。

innodb_safe_binlog

这个参数用于控制是否在事务提交时将日志写入二进制日志。如果设置为 1，表示在每个事务提交时将操作写入二进制日志，以确保日志和数据的一致性。如果设置为 0，表示只有在事务完成时才将操作写入二进制日志

我们推荐明确指定二进制日志的名字，以保证二进制日志名在所有服务器上是一致的，避免因为服务器名的变化导致的日志文件名变化。你可能认为以服务器名来命名二进制日志无关紧要，但经验表明，当在服务器间转移文件、克隆新的从库、转储备份或者其他一些你想象不到的场景下，可能会导致很多问题。为了避免这些问题，需要给 log_bin 选项指定一个参数。可以随意地给一个绝对路径，但必须明确地指定基本的命名(正如之前讨论的)。

log_bin=/var/lib/mysq1/mysql-bin

在从库上，我们同样推荐开启如下配置选项，为中继日志指定绝对路径

relay_log=/path/to/logs/relay-bin
skip_slave_start
read_only

通过设置 relay_log 可以避免中继日志文件基于机器名来命名，防止之前提到的可能在主库发生的问题。指定绝对路径可以避免多个 MySQL版本中存在的 Bug，这些 Bug可能会导致中继日志在一个意料外的位置创建。skip _slave_start 选项能够阻止从库在崩溃后自动启动复制。这可以给你一些机会来修复可能发生的问题。如果从库在崩溃后自动启动并且处于不一致的状态，就可能会导致更多的损坏，最后将不得不把所有数据丢弃，并重新开始配置从库
read_only 选项可以阻止大部分用户更改非临时表，除了复制SOL 线程和其他拥有超级权限的用户之外，这也是要尽量避免给正常账号授予超级权限的原因之一。

主从复制的原理

主从复制有两种方式：

基于语句复制
基于行复制

基于语句复制

在基于语句复制中，主库执行的每个 SQL 语句都会被记录到二进制日志，并且从库会解析并在从库上执行相同的 SQL 语句来复制数据。这意味着从库上的数据会与主库上的数据在逻辑上保持一致。

优点：

简单明了：复制的是 SQL 语句，不需要复制整个行的数据。
节省网络带宽：当一条 SQL 修改多行数据时，只需要复制一条语句，节省了网络传输的带宽。

缺点：

不适用于非确定性函数：如果主库上使用了随机函数或时间函数，从库上的执行结果可能与主库不一致。
不适用于不可重复读问题：在从库上执行与主库不同的查询顺序时，可能导致结果不一致。
主库版本限制：一些特定版本的 MySQL 主库可能不支持基于语句的复制。

基于行复制

在基于行复制中，主库上每次修改数据的操作都会被记录为修改行的详细信息，包括修改前和修改后的数据。从库会接收这些行级别的变更并在从库上应用相同的修改操作。

优点：

更准确的复制：避免了基于语句复制的一些问题，如非确定性函数和不可重复读问题。
可用于更广泛的情况：适用于所有 SQL 语句，包括复杂的更新操作。

缺点：

增加了网络传输和存储开销：需要传输和存储更多的数据，可能增加网络带宽和磁盘空间的占用。

主从复制用到的文件

mysql-bin.index

当在服务器上开启二进制日志时，同时会生成一个和二进制日志同名的但以index作为后缀的文件，该文件用于记录磁盘上的二进制日志文件。这里的“index”并不是指表的索引，而是说这个文件的每一行包含了二进制文件的文件名。你可能认为这个文件是多余的，可以被删除 (毕竟 MySQL可以在磁盘上找到它要的文件)。事实上并非如此，MySQL 依赖于这个文件，除非在这个文件里有记录，否则MySOL识别不了二进制日志文件。

mysql-relay-bin-index

这个文件是中继日志的索引文件，和 mysgl-bin.index 的作用类似

master.info

这个文件用于保存从库连接到主库所需要的信息，格式为纯文本(每行一个值)，不同的 MySQL 版本，其记录的信息也可能不同。此文件不能删除，否则从库在重启后无法连接到主库。这个文件以文本的方式记录了复制用户的密码，所以要注意此文件的权限控制。

relay-log.info

这个文件包含了当前从库复制的二进制日志和中继日志坐标(例如，从库复制在主库上的位置)，同样也不要删除这个文件，否则在从库重启后将无法获知从哪个位置开始复制，可能会导致重放已经执行过的语句。

发送复制事件到其他的从库

log_slave_updates 选项可以让从库变成其他服务器的主库。在设置该选项后，MySQL会将其执行过的事件记录到它自己的二进制日志中。这样它的从库就可以从其日志中检索并执行事件。

在这种场景下，主库将数据更新事件写入二进制日志，第一个从库提取并执行这个事件这时候一个事件的生命周期应该已经结束了，但由于设置了 log_slave_updates，从库会将这个事件写到它自己的二进制日志中。这样第二个从库就可以将事件提取到它的中继日志中并执行。这意味着作为源服务器的主库可以将其数据变化传递给没有与其直接相连的从库上。默认情况下这个选项是被打开的，这样在连接到从库时就不需要重启服务器。

当第一个从库将从主库获得的事件写入到其二进制日志中时，这个事件在从库二进制日志中的位置与其在主库二进制日志中的位置肯定是不相同的，可能在不同的日志文件或文件内不同的位置。这意味着你不能假定所有拥有同一逻辑复制点的服务器拥有相同的日志坐标。稍后我们会提到，这种情况会使某些任务更加复杂，例如，修改一个从库的主库或将从库提升为主库。

除非你已经注意到要给每个服务器分配一个唯一的服务器 ID，否则按照这种方式配置从库会导致一些奇怪的错误，甚至还会导致复制停止。一个更常见的问题是 :为什么要指定服务器ID，难道MySQL 在不知道复制命来源的情况下不能执行吗?为什么MySQL 要在意服务器ID是全局唯一的。问题的答案在于 MySOL 在复制过中如何防止无限循环。当复制SQL 线程读中继日志时，会丢弃事件中记录的服务器ID 和该服务器本身ID相同的事件，从而打破了复制过程中的无限循环。在某些复制拓扑结构下打破无限循环非常重要，例如主 -主复制结构

主从复制拓扑

可以在任意个主库和从库之间建立复制，只有一个限制：每一个从库只能有一个主库。有很多复杂的拓扑结构，但即使是最简单的也可能会非常灵活。一种拓扑可以有多种用途。

我们已经讨论了如何为主库设置一个从库，接下来讨论其他比较普遍的拓扑结构以及它们的优缺点。记住下面的基本原则:

一个MySQL从库实例只能有一个主库
每个从库必须有一个唯一的服务器 ID
一个主库可以有多个从库 (或者相应的，一个从库可以有多个兄弟从库)。
如果打开了 log_slave_updates 选项，一个从库可以把其主库上的数据变化传播到其他从库。

一主库多从库

这是最简单的拓扑结构。在有少量写和大量读时，这种配置是非常有用的。可以把读分摊到多个从库上，直到从库给主库造成了太大的负担，或者主从之间的带宽成为瓶颈为止。你可以按照之前介绍的方法一次性设置多个从库，或者根据需要增加从库

用途

为不同的角色使用不同的从库 (例如添加不同的索或使用不同的存储)
把一台从库当作待用的主库，除了复制没有其他数据传输。
将一台从库放到远程数据中心，用作灾难恢复。
延迟一个或多个从库，以备灾难恢复。
使用其中一个从库，作为备份、培训、开发或者测试使用服务器

主动-主动模式下的主-主复制

主-主复制（也叫双主复制或者双向复制）包含两台服务器，每一个都被配置成对方的主库和从库，换句话说，他们是一对主库

主动-主动模式下主- 主复制有一些应用场景，但通常用于特殊的目的。一个可能的应用场景是两个处于不同地理位置的办公室，并且都需要一份可写的数据拷贝。

这种配置最大的问题是如何解决冲突，两个可写的互主服务器导致的问题非常多。这通常发生在两台服务器同时修改一行记录，或同时在两台服务器上向一个包含 AUTO_INCREMENT列的表里插入数据

主动-被动模式下的主-主复制

这是前面描述的主-主结构的变体，它能够避免我们之前讨论的问题。这也是构建容错性和高可用性系统的非常强大的方式，主要区别在于其中的一台服务器是只读的被动服务器

这种方式使得反复切换主动和被动服务器非常方便，因为服务器的配置是对称的。这使得故障转移和故障恢复很容易。它也可以让你在不关闭服务器的情况下执行维护、优化表、升级操作系统(或者应用程序、硬等) 或其他任务。

例如，执行 ALTER TABLE操作可能会锁住整个表，阻塞对表的读和写，这可能会花费很长时间并导致服务中断。然而在主-主配置下，可以先停止主动服务器上的从库复制线程(这样就不会在被动服务器上执行任何更新)，然后在被动服务器上执行ALTER操作交换角色，最后在先前的主动服务器上启动复制线程。这个服务器将会读取中继日志并执行相同的 ALTER语句。这可能花费很长时间，但不要紧，因为该服务器没有为任何活跃查询提供服务。

主动-被动模式的主-主结构能够帮助回避许多 MySOL的问题和限制

让我们看看如何配置主-主服务器对，在两台服务器上执行如下设置后，会使其拥有对称的设置:

确保两台服务器上有相同的数据
启用二进制日志，选择唯一的服务器 ID，并创建复制账号
启用从库更新的日志记录，后面将会看到，这是故障转移和故障恢复的关键把被动服务器配置成只读，防止可能与主动服务器上的更新产生冲突，这一点是可选的。
启动每个服务器的MySQL实例
将每个主库设置为对方的从库，使用新创建的二进制日志开始工作

设置主动- 被动的主-主拓扑结构在某种意义上类似于创建一个热备份，但是可以使用这个“备份”来提高性能，例如，用它来执行读操作、备份、“离线”维护以及升级等。真正的热备份做不了这些事情。然而,你不会获得比单台服务器更好的写性能。

拥有从库的主-主结构

另外一种相关的配置是为每个主库增加一个从库

这种配置的优点是增加了冗余，对于不同地理位置的复制拓扑，能够消除站点单点失效的问题。你也可以像平常一样，将读查询分配到从库上。
如果在本地为了故障转移使用主 - 主结构，这种配置同样有用。当主库失效时，用从库来代替主库还是可行的，虽然这有点复杂。同样也可以把从库指向一个不同的主库，但需要考虑增加的复杂度

主库，分发主库以及从库

我们之前提到当从库足够多时，会对主库造成很大的负载。每个从库会在主库上创建一个线程，并执行 binlog dump 命令。该命令会读取二进制日志文件中的数据并将其发送给从库。每个从库都会重复这样的工作，它们不会共享 binlog dump 的资源

如果有很多从库，并且有大的事件时，例如一次很大的 LOAD DATA INFILE操作，主库上的负载会显著上升，甚至可能由于从库同时请求同样的事件而耗尽内存并崩溃。另一方面，如果从库请求的数据不在文件系统的缓存中，可能会导致大量的磁盘检索，这同样会影响主库的性能并增加锁的竞争。

因此，如果需要多个从库，一个好办法是从主库移除负载并使用分发主库。分发主库事实上也是一个从库，它的唯一目的就是提取和提供主库的二进制日志。多个从库连接到分发主库，这使原来的主库摆脱了负担。为了避免在分发主库上做实际的查询，可以将它的表修改为 blackhole 存储引擎

很难说当从库数据达到多少时需要一个分发主库。按照通用准则，如果主库接近满负载不应该为其建立 10 个以上的从库。如果有少量的写操作，或者只复制其中一部分表，主库就可以提供更多的复制。另外，也不一定只使用一个分发主库。如果需要的话，可以使用多个分发主库向大量的从库进行复制，或者使用金字塔状的分发主库。在某些情况下，可以通过设置slave_compressed_protocol来节约一些主库带宽。这对跨数据中心复制很有好处。

还可以通过分发主库实现其他目的，例如，对二进制日志事件执行过滤和重写规则。这比在每个从库上重复进行日志记录、重写和过滤要高效得多。

如果在分发主库上使用 blackhole 表,可以支持更多的从库。虽然会在分发主库执行查询但其代价非常小，因为 blackhole 表中没有任何数据。blockhole 表的缺点是其存在 Bug，例如在某些情况下会忘记将自增ID 写入到二进制日志中。所以要小心使用 blackhole表

一个比较常见的问题是如何确保分发服务器上的每个表都是 blackhole 存储引警。如果有人在主库创建了一个表并指定了不同的存储引擎呢?确实，不管什么时候，在从库上使用不同的存储引擎总会导致同样的问题。常见的解决方案是设置服务器的 storage_engine选项:

storage_engine = blackhole

这只会影响那些没有指定存储引警的CREATE TABLE的语句如果有一个无法控制的应用这种拓扑结构可能会非常脆弱。可以通过 skip_innodb 选项禁止InnoDB，将表退化为MyISAM。但你无法禁止 MyISAM 或者Memory 引擎。

使用分发主库另外一个主要的缺点是无法使用一个从库来代替主库。因为由于分发主库的存在，导致各个从库与原始主库的二进制日志坐标已经不相同

树或金字塔型

如果正在将主库复制到大量的从库中。不管是把数据分发到不同的地方，还是提供更高的读性能，使用金字塔结构都能够更好地管理

这种设计的好处是减轻了主库的负担，就像前一节提到的分发主库一样。它的缺点是中间层出现的任何错误都会影响到多个服务器。如果每个从库和主库直接相连就不会存在这样的问题。同样，中间层次越多，处理故障会更困难、更复杂。

定制的复制方案

MySQL的复制非常灵活，可以根据需要定制解决方案。典型的定制方案包括组合，过滤，分发和向不同的存储引擎复制。也可以使用“黑客手段”，例如，从一个使用 blackhole存储引擎的服务器上复制或复制到这样的服务器上。可以根据需要任意设计。这其中最大的限制是合理的监控和管理，以及所拥有资源约束（网络带宽，CPU能力等）

选择性复制

为了利用访问局部性原理 (locality of reference)，并将需要读的工作集驻留在内存中可以复制少量数据到从库中。如果每个从库只拥有主库的一部分数据，并且将读分配给从库，就可以更好地利用从库的内存。并且每个从库也只有主库一部分的写入负载，这样主库的能力更强并能保证从库延迟

它的优势在于主库包含了所有的数据集，这意味着无须为了一条写入查询去访问多个服务器。如果读操作无法在从库上找到数据，还可以通过主库来查询。即使不能从从库上读取所有数据，可以移除大量的主库读负担。

最简单的方法是在主库上将数据划分到不同的数据库里。然后将每个数据库复制到不同的从库上。例如，若需要将公司的每一个部门的数据复制到不同的从库，可以创建名为sales、marketing、procurement 等的数据库，每个从库通过选项 replicate_wild_dotable选项来限制给定数据库的数据。下面是 sales 数据库的配置:

replicate_wild_do_table = sales.%
#replicate_wild_do_table 是 MySQL 复制中的一个配置选项，
#用于指定要复制的表。sales.% 表示要复制 sales 数据库下的所有表（以 % 通配符表示）到从库。

也可以通过一台分发主库进行分发。举个例子，如果想通过一个很慢或者非常昂贵的网络，从一台负载很高的数据库上复制一部分数据，就可以使用一个包含 blackhole 表和过滤规则的本地分发主库，分发主库可以通过复制过滤移除不需要的日志。这可以避免在主库上进行不安全的日志选项设定，并且无须传输所有的数据到远程从库

分离功能

许多应用都混合了在线事务处理 (OLTP)和在线数据分析(OLAP)的查询。OLTP查询比较短并且是事务型的，OLAP 查询则通常很大，也很慢，并且不要求绝对最新的数据这两种查询给服务器带来的负担完全不同，因此它们需要不同的配置，其至可能使用不同的存储引擎或者硬件。

一个常见的办法是将 OLTP 服务器的数据复制到专门为 OLAP 工作负载准备的备库上这些备库可以有不同的硬件、配置、索引或者不同的存储引擎。如果决定在备库上执行OLAP 查询，就可能需要忍受更大的复制延迟或降低备库的服务质量。这意味着在一个非专用的备库上执行一些任务时，可能会导致不可接受的性能，例如执行一条长时间运行的查询。

数据归档

可以在从库上实现数据归档，也就是说可以在从库上保留主库上删除过的数据，在主库上通过 delete 语句删除数据是确保 delete 语句不传递到从库就可以实现。有两种通常的办法:一种是在主库上选择性地禁止二进制日志，另一种是在备库上使用 replicate_ignore_db规则(是的，两种方法都很危险)。

第一种方法需要先将SQL_LOG_BIN设置为0，然后再进行数据清理。这种方法的好处是不需要在从库进行任何配置，由于SQL语根本没有记录到二进制日志中，效率会稍微有所提升。最大缺点也正因为没有将在主库的修改记录下来，因此无法使用二进制日志来进行审计或者做按时间点的数据恢复。另外还需要 SUPER 权限

第二种方法是在清理数据之前对主库上特定的数据库使用USE语句。例如，可以创建一个名为 purge的数据库，然后在从库的 my.cnf文件里设置 replicate_ignore_db=purge并重启服务器。从库将会忽略使用了 USE语句指定的数据库。这种方法没有第一种方法的缺点，但有另一个小小的缺点:从库需要去读取它不需要的事件。另外，也可能有人在 purge数据库上执行非清理查询，从而导致从库无法重放该事件。

只读从库

将从库设置为只读，以防止在从库进行的无意识修改导致复制中断。可以通过设置 read_only 选项来实现。它会禁止大部分写操作，除了复制线程和拥有超级权限的用户以及临时表操作。只要不给也不应该给普通用户超级权限，这应该就是很完美的方法

复制和容量规划

写操作通常是复制的瓶颈，并且很难使用复制来扩展写操作。当计划为系统增加复制容量时，需要确保进行了正确的计算，否则很容易犯一些复制相关的错误。

例如，假设工作负载为 20% 的写以及80% 的读。为了计算简单，假设有以下前提 :

读和写查询包含同样的工作量。
所有的服务器是等同的，每秒能进行 1000次查询。
从库和主库有同样的性能特征。
可以把所有的读操作转移到从库。

如果当前有一个服务器能支持每秒 1 000 次查询，那么应该增加多少从库才能处理当前两倍的负载，并将所有的读查询分配给从库?

看上去应该增加两个从库并将1600的读操作平分给他们。但是不要忘记，写入负载同样增加到了400次每秒，并且无法在主从服务器之间进行分摊。每个从库每秒必须处理400次写入，这意味着每个从库写入占了40%，只能每秒为600次查询提供服务。因此，需要三台而不是两台从库来处理双倍负载。

如何测量从库延迟

主从同步一个普遍的问题是如何监控从库落后主库的延迟有多大，虽然SHOW_SLAVE _STATUS输出的Seconds_behind _master列理论上显示了从库的延时，但是由于各种原因，并不是精确的：

从库Seconds_behind_master值是通过将服务器当前的时间戳与二进制日志中的事件的时间戳相对比得到的，所以只有在执行事件时才能报告延迟。
如果从库复制线程没有运行，就会报延迟为 NULL。
一些错误(例如主从的 max_allowed_packet 不匹配，或者网络不稳定)可能中断复制并且/或者停止复制线程,但 Seconds_behind_master将显示为0而不是显示错误
即使从库线程正在运行，从库有时候可能无法计算延时。如果发生这种情况，从库会报0或者NULL。
一个大事务可能会导致延迟波动，例如，有一个事务更新数据长达一个小时，最后提交。这条更新将比它实际发生时间要晚一个小时才记录到二进制日志中。当从库执行这条语句时，会临时地报告从库延迟为一个小时，然后又很快变成0。
如果分发主库落后了，并且其本身也有已经追赶上它的从库，从库的延迟将显示为 0,而事实上和源主库之间是有延迟的

解决这些问题的办法是忽略 Seconds_behind_master的值，并使用一些可以直接观察和衡量的方式来监控从库延迟。最好的解决办法是使用heartbeat record ，这是一个在主库上会每秒更新一次的时间戳。为了计算延时，可以直接用从库当前的时间戳减去心跳记录的值。这个方法能够解决刚刚我们提到的所有问题，另外一个额外的好处是我们还可以通过时间戳知道从库当前的复制状况。包含在 Percona Toolkit 里的 pt-heartbeat 脚本是“复制心跳”最流行的一种实现
心跳还有其他好处，记录在二进制日志中的心跳记录拥有许多用途，例如在一些很难解决的场景下可以用于灾难恢复。

检查主从是否一致

使用Percona Toolkit 里的 pt-table-checksum能够验证主从数据是否一致。其主要特性是用于确认从库与主库的数据是否一致。工作方式是通过在主库上执行 INSERT…SELECT查询

这些查询对数据进行校验并将结果插入到一个表中。这些语句通过复制传递到从库，并在从库执行一遍，然后可以比较主从上的结果是否一样。由于该方法是通过复制工作的它能够给出一致的结果而　无须同时把主从上的表都锁上。

通常情况下可以在主库上运行该工具，参数如下 :

$ pt-table-checksum --replicate=test.checksum

该命令将检查所有的表，并将结果插入到 test.checksum 表中。当查询在从库执行完后就可以简单地比较主从之间的不同了。pt-table-checksum 能够发现服务器所有的从库在每台从库上运行查询，并自动地输出结果

从主库重新同步从库

当使用校验工具发现了数据不一致，或者是因为已经知道是从库忽略了某条查询或者有人在从库上修改了数据，此时就需要出路未被同步的从库。

关闭从库，重新从主库上复制一份数据。该方式缺点是不太方便，特别是数据量很大的时候。
使用mysqldump转储受影响的数据并重新导入。可以在主库上简单的锁住表然后进行转储，再等待从库赶上主库。然后将数据导入到从库中。（需要等待从库赶上主库，这样就不会为其他的表引入新的不一致）。此种方式在表很大或者网络带宽受限的情况下，转储和重载数据的代价依然很高
pt-table-sync 是 Percona Toolkit 中的另外一个工具，可以解决该问题。该工具能够高效地查找并解决表之间的不同。它同样通过复制工作，在主库上执行查询，在从库上重新同步，这样就没有竞争条件。它是结合 pt-table-checksum 生成的 checksum 表来工作的所以只能操作那些已知不同步的表的数据块。但该工具不是在所有场景下都有效。为了正确地同步主库和从库，该工具要求复制是正常的，否则就无法工作。pt-table-sync设计得很高效，但当数据量非常大时效率还是会很低。比较主库和从库上 1TB 的数据不可避免地会带来额外的工作。尽管如此，在那些合适的场景中，该工具依然能节约大量的时间和工作。

你可能感兴趣的:(数据库,mysql,数据库)

mysql创建集合collection_MongoDB创建集合命令db.createCollection详解 kokosK
MongoDB创建集合命令db.createCollection详解完整的命令如下：db.createCollection(name,{capped:,autoIndexId:,size:,max})name:集合的名字capped:是否启用集合限制，如果开启需要制定一个限制条件，默认为不启用，这个参数没有实际意义size:限制集合使用空间的大小，默认为没有限制max:集合中最大条数限制，默认为没
mysql.createPool(db)_nodejs解决mysql和连接池(pool)自动断开问题会咕咕咕的小夫爷
最近在做一个个人项目，数据库尝试使用了mongodb、sqlite和mysql。分享一下关于mysql的连接池用法。项目部署于appfog，项目中我使用连接池链接数据库，本地测试一切正常。上线以后，经过几次请求两个数据接口总是报503。一直不明就里，今天经过一番排查终于顺利解决了。1.mysql链接普通模式varmysql=require('mysql'),env={host:'localhost
揭开SQL Server和PostgreSQL填充因子的神秘面纱 Alex-Hua postgresql oracle 数据库
揭开SQLServer和PostgreSQL填充因子的神秘面纱理解SQLServer和PostgreSQL中的填充因子在调优数据库性能时，一些小设置往往能带来显著的差异。填充因子就是其中一个经常讨论的设置。SQLServer和PostgreSQL都支持这一概念，但它们的处理方式有所不同。如果你在管理这两种系统中的数据库，了解填充因子的工作原理可以帮助你避免因索引页拆分、索引碎片以及不必要的磁盘I/
python连接数据库的方法,Python 连接数据库的多种方法 AI MIU python连接数据库的方法
JZGKCHINAPython是一种计算机程序设计语言，它是一种动态的、面向对象的脚本语言。它是一种跨平台的，可以运行在Windows，Mac和Linux/Unix系统上。在日常使用中需要对大量数据进行数据分析，那么就必然用到数据库，我们常用的数据库有SQLServer,MySQL,Oracle,DB2,SQLite，Hive，PostgreSQL,MongoDB还有其他常用的MicrosoftA
25数据库三级备考自整理笔记
备考策略：博主是边做题边学习知识点的，从每个章节->每套真题的流程，知识点清晰详细，喜欢的请点个关注和收藏，祝大家考试顺利，必过必过必过！一、数据库应用系统开发方法1.数据库的三级模式：外模式、模式、内模式。外->是数据库用户（包括应用程序员和最终用户看见和使用的局部数据的逻辑结构和特征的描述，是数据库用户的视图，是某一应用有关的数据的逻辑表示；外模式是模式的子集，一个数据库可以有多个外模式）；（
python 连接数据库小鱼拉灯 mysql 数据库 python
一.连接MYSQL1.下载PyMySql模块2.在MYSQL中创建数据库并连接importpymysqlconn=pymysql.connect(host='localhost',user='root',password='123456',database='ikun',charset='utf8',port=3306)3.创建表importpymysqlconn=pymysql.connect(
Prometheus监控-第1天我为你走过-YOYO prometheus
7.1基于Prometheus的全方位监控平台一、打造基于Prometheus的全方位监控平台1.1、前言官网地址：https://prometheus.io/docs/prometheus/latest/getting_started/灵活的时间序列数据库；定制各式各样的监控规则；Prometheus的开发人员和用户社区非常活跃；独立的开源项目，不依赖于任何公司；继Kurberntes之后第二个
【开源项目】实测 Google 开源的 AI MCP 数据库网关：10行代码隔离风险，连接池自动复用
1.引言这两天试了谷歌新开的MCPToolboxforDatabases，它用不到10行代码就能让AI助手（比如LangChain智能体）安全地操作数据库。作为一个常年和数据库连接池、凭证泄露搏斗的开发者，这东西确实解决了我的痛点——把数据库访问抽象成“工具”，通过集中管控的MCPServer隔离风险，还自带性能优化。下面分享实测体验和避坑指南。2.正文2.1核心逻辑：为什么需要MCP？传统AI代
jxORM--整体说明 jxandrew jxWebUI 数据库 python ORM
系列文章目录：jxORMI–编程指南jxORM是配套jxWebUI使用的数据库操作库。使用说明jxORM的使用非常简单，主要包括几个步骤：1、导入依赖fromjxORMimportjxORMLogger,ORM,DBDataType,ColType,jxDB2、设置数据库连接#用默认设置，设置本地的mysql数据库连接jxDB.set('testDB',password='password')目前
零基础入门数据库，万字超详细Sql server期末复习 Heyqings sql
前言本篇主要讲述的是关系型数据库SqlServer，原因也很简单，因为大部分学校还在以sqlserver为教学材料，不过没关系无论是sqlserver、mysql还是oracle,只要是关系型数据库，概念都是相通的，语句也大差不差。关系型数据库是一种采用关系模型来组织数据的数据库系统。它将数据存储在表格形式的结构中，通常称为表。这些表由行和列组成，每一行代表一条记录，每一列代表一个字段。关系型数据
EXPLAIN 解码：MySQL 索引优化的黄金决策术渡难繁辰数据库 mysql sql mysql 数据库 sql
引言在MySQL数据库中，索引是优化查询性能的核心工具。但盲目添加索引会导致写性能下降和存储浪费，而缺少关键索引又会引发全表扫描的灾难。如何科学决策？答案在于深入分析查询执行计划——EXPLAIN。本文将聚焦如何通过EXPLAIN诊断查询瓶颈，精准制定索引策略。一、EXPLAIN的核心字段解读EXPLAIN输出结果中的关键字段揭示了查询的执行逻辑，以下为需重点关注的列：1.type列：查询访问数据
SQL Server和PostgreSQL填充因子 meslog 技术分享 postgresql oracle 数据库
理解SQLServer和PostgreSQL中的填充因子在调优数据库性能时，一些小设置往往能带来显著的差异。填充因子就是其中一个经常讨论的设置。SQLServer和PostgreSQL都支持这一概念，但它们的处理方式有所不同。如果你在管理这两种系统中的数据库，了解填充因子的工作原理可以帮助你避免因索引页拆分、索引碎片以及不必要的磁盘I/O带来的头疼问题。填充因子的概念让我们先从一个比喻开始。假设你
Docker Compose 坚定的小辣鸡在努力 docker 容器运维
DockerCompose阅读原文https://www.xiaozaoshu.top/articles/docker/compose一、什么是DockerCompose？DockerCompose是一个用于定义和运行多个Docker容器的工具。你只需用一个docker-compose.yml文件，描述好服务的配置，然后一条命令就可以启动整个系统。适用场景：需要运行多个服务（如Web服务+数据库+
通过docker部署的MySQL数据库初始化方式 GIS从业者资料数据库 docker mysql
背景安装好MySQL容器后，有时需执行MySQL命令创建项目初始表才能使用。手动创建不太便捷，可将相关SQL命令保存为.sql文件（如init.sql）。在docker-compose.yml中配置MySQL容器时，借助volumes把该脚本挂载到MySQL容器的初始化目录（/docker-entrypoint-initdb.d/），以此完成自动创建，这样会方便许多。步骤1、创建SQL初始化文件在
服务器与工控机的区别解析 D-海漠其他
服务器和工控机虽然都是计算机，但它们的设计目标、使用环境和核心特性有本质的区别，就像轿车和越野车虽然都是车，但用途和构造截然不同。以下是它们的主要区别：核心设计目标：服务器：数据处理、存储、网络服务和应用托管。核心目标是高性能、高吞吐量、高可靠性、可扩展性和高可用性（通常通过集群、冗余实现）。它需要处理海量并发请求（如网页服务、数据库查询、文件共享、虚拟化等）。工控机：工业环境中的过程控制、数据采
讲讲MyBatis中二级缓存的缺点？ java1234_小锋 java java 开发语言
大家好，我是锋哥。今天分享关于【讲讲MyBatis中二级缓存的缺点？】面试题。希望对大家有帮助；讲讲MyBatis中二级缓存的缺点？超硬核AI学习资料，现在永久免费了！MyBatis的二级缓存是指在SqlSessionFactory级别上共享缓存的机制。虽然二级缓存能够有效地提高性能，减少数据库的访问次数，但它也有一些缺点和需要注意的地方：一致性问题：二级缓存中的数据通常是不可直接控制的，尤其是当
能说说MyBatis的工作原理吗？ java1234_小锋 java java 开发语言
大家好，我是锋哥。今天分享关于【能说说MyBatis的工作原理吗？】面试题。希望对大家有帮助；能说说MyBatis的工作原理吗？超硬核AI学习资料，现在永久免费了！MyBatis是一个用于简化数据库操作的持久层框架，它通过SQL映射技术，将Java对象和数据库之间的关系映射起来。MyBatis的工作原理可以从以下几个方面来解析：1.配置文件的加载MyBatis通过加载配置文件来初始化框架。配置文件
Java List 集合详解：从基础到实战，掌握 Java 列表操作全貌大葱白菜 java合集 java 开发语言后端学习个人开发
作为一名Java开发工程师，你一定在项目中频繁使用过List集合。它是Java集合框架中最常用、最灵活的数据结构之一。无论是从数据库查询出的数据，还是前端传递的参数列表，List都是处理这些数据的首选结构。本文将带你全面掌握：List接口的核心方法与特性常见实现类（如ArrayList、LinkedList、Vector、CopyOnWriteArrayList）List的遍历、增删改查、排序、线
Python特性：装饰器解决数据库长时间断连问题超龄超能程序猿数据库 python
前言在基于Python的Web应用开发里，数据库连接是极为关键的一环。不过，像网络波动、数据库服务器维护这类因素，都可能造成数据库长时间断连，进而影响应用的正常运作。本文将详细介绍怎样运用retry_on_failure装饰器来解决数据库长时间断连的难题一问题背景在实际开发场景中，应用和数据库之间的连接可能会由于各种缘由中断（长时间系统无人访问，再次访问，数据库连接超时）。当应用尝试执行数据库操作
MySQL主从模式的数据一致性 mysia
MySQL单机的数据一致性MySQL作为一个可插拔的数据库系统，支持插件式的存储引擎，在设计上分为Server层和StorageEngine层。在Server层，MySQL以events的形式记录数据库各种操作的Binlog二进制日志，其基本核心作用有：复制和备份。除此之外，我们结合多样化的业务场景需求，基于Binlog的特性构建了强大的MySQL生态，如：DTS、单元化、异构系统之间实时同步等等
Java实习模拟面试之创玖科技：前后端交互、数据库、Spring全家桶、性能优化与Linux实战培风图南以星河揽胜 java面试 java 面试科技
关键词：JavaScript、JQuery、Ajax、Node.js、MySQL、Oracle、Spring、SpringMVC、SpringBoot、MyBatis、Tomcat、Redis、Nginx、Linux、Git、SAAS系统开发一、面试开场：自我介绍面试官提问：请做个自我介绍，重点突出你的技术栈和项目经验。候选人回答：您好，我是一名计算机科学与技术专业的应届生，具备扎实的Java基础
【Java-多线程】什么是幂等性？
以下是关于幂等性的详细解析：一、幂等性定义幂等性（Idempotence）是指同一操作多次执行所产生的影响与一次执行的效果相同。就像数学中的乘法运算：1×1×1=1，无论乘多少次结果都不变。二、生活化案例外卖订单场景：用户点击"支付"按钮时网络抖动支付系统收到两次相同支付请求如果接口没有幂等性：可能扣除双倍金额具备幂等性的系统：即使收到多次请求，只扣款一次三、技术实现方案1.数据库唯一约束CREA
借助AI学习开源代码git0.7之二核心概念和总结余很多之很多源码学习 git 学习
借助AI学习开源代码git0.7之二核心概念和总结核心概念：对象数据库(ObjectDatabase):内容寻址:所有数据都通过其内容的SHA1哈希值来唯一标识和存储。这意味着任何内容的更改都会导致其SHA1哈希值的变化，从而生成一个新的对象。不可变性:一旦对象被创建并存储，它就是不可变的。这种设计保证了数据的完整性和历史的可靠性。对象类型:Blob(二进制大对象):存储文件的实际内容。它是最基本
Mysql索引底层数据结构及原理解析有缘再见
一、索引是什么？索引是帮助mysql高效获取数据排序好的数据结构。索引存储在文件里面。磁盘存取原理：1.寻道时间(速度慢，费时)2.旋转时间(速度较快)磁盘构造数据文件存储在磁盘的磁道划分出的扇区里面。磁盘指针先去找到数据存储在哪一个磁道（寻道时间），然后逆时针旋转找打扇区（旋转时间）。现在都在优化减少寻道时间。二、常见的数据结构介绍。（一）二叉树。二叉树示意图定义：二叉树（binarytree）
2021，零日漏洞最疯狂的一年 GoUpSec
2021年，零日漏洞的数量增长了一倍，价格增长了十倍，但攻击回报增长了百倍！零日漏洞利用，即通过以前未知的漏洞发起网络攻击的方式，是黑客手中最有价值的武器，因为这些漏洞在公开市场上的价格很轻松就能超过100万美元。近日，麻省理工科技评论走访了多个数据库、安全研究人员和网络安全公司，发现今年网络安全防御者的人数达到了有史以来的最高水平，但零日漏洞的数量也创下了新的记录。根据零日漏洞追踪项目的统计（下
新闻资讯|基于springboot的新闻资讯系统设计与实现(附项目源码+论文+数据库） code.song spring boot 数据库后端
私信或留言即免费送开题报告和任务书（可指定任意题目）目录一、摘要二、相关技术三、系统设计四、数据库设计五、核心代码六、论文参考七、源码获取一、摘要传统信息的管理大部分依赖于管理人员的手工登记与管理，然而，随着近些年信息技术的迅猛发展，让许多比较老套的信息管理模式进行了更新迭代，文章信息因为其管理内容繁杂，管理数量繁多导致手工进行处理不能满足广大用户的需求，因此就应运而生出相应的新闻资讯系统。本新闻
如何进行MySQL配置性能优化 anpeng2025 技术爽文大集合架构师 mysql 性能优化数据库 oracle 华为学习 Oracle ERP
MySQL的性能优化是一个系统工程，涉及配置调整、查询优化、架构设计等多个层面。下面我作为架构师，将重点讲解关键的配置参数优化，这些是提升MySQL性能最常见且效果显著的基础步骤：核心原则：基于硬件和工作负载：没有放之四海而皆准的配置。优化必须考虑你的服务器硬件（内存大小、CPU核数、磁盘类型-SSD还是HDD）以及你的应用负载特点（读多写少？写多读少？事务型还是分析型？）。循序渐进，监控验证：每
Linux教程（4）----[hive数据仓库工具] .房东的猫 Linux教程（完善中~~）linux
Hive基本概念Hive简介什么是HiveHive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。为什么使用Hive直接使用hadoop所面临的问题人员学习成本太高
Java:对给定的字符串和给定的模式执行Boyer-Moore搜索算法（附带源码） Katie。 Java算法完整教程 java 开发语言
一、项目背景详细介绍在文本处理与信息检索中，需要在海量文本中高效地查找模式串（Pattern）。经典的朴素搜素在最坏情况下时间复杂度为O(N·M)，效率不够高。Boyer–Moore算法则采用“坏字符”与“好后缀”两种启发规则，从模式尾部匹配开始，通常能大幅跳过不可能匹配的位置，平均时间复杂度接近O(N/M)，在实际应用（如grep、数据库索引）中非常高效。本项目旨在用Java实现Boyer–Mo
springboot注册servlet hie98894 spring boot servlet hive
在SpringBoot应用中，虽然SpringMVC已经提供了强大的功能来处理HTTP请求，但在某些情况下，我们可能仍需要直接注册和使用Servlet。本文将详细介绍如何在SpringBoot中注册Servlet。1.什么是Servlet？Servlet是JavaEE中的一种服务器端组件，用于处理HTTP请求和生成响应。Servlet最常见的用途是创建动态Web内容，例如表单处理和数据库查询结果的
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多