Sqlite使用WAL模式指南

本文地址:http://t.csdn.cn/kE8ND

文章目录

    • 一、WAL模式的原理
    • 二、开启WAL后必须要设置的参数
      • 1.PRAGMA SYNCHRONOUS
        • (1)SYNCHRONOUS的类型
        • (2)WAL下如何选择SYNCHRONOUS类型
      • 2.PRAGMA wal_autocheckpoint
      • 3.sqlite3_busy_timeout
        • (1)产生busy的原因
        • (2)解决措施
    • 三、在多线程读写并发下开启WAL时需要配置的参数
      • 1.避免使用PRAGMA locking_mode=EXCLUSIVE
        • (1)locking_mode的类型
        • (2)使用WAL读写并发时不应该使用EXCLUSIVE的原因
      • 2.sqlite3_config(SQLITE_CONFIG_MULTITHREAD);
        • (1)SQLite 的三种线程模式
        • (2)如何选择线程模式来支持读写并发
    • 四、和WAL不冲突的配置
      • 1.PRAGMA secure_delete=ON
      • 2.PRAGMA mmap_size
        • (1)mmap_size原理
        • (2)mmap_size和WAL不冲突
      • 3.PRAGMA auto_vacuum
        • (1)auto_vacuum原理
        • (2)auto_vacuum和WAL不冲突

一、WAL模式的原理

官方文档链接:https://www.sqlite.org/wal.html#noshm

PRAGMA journal_mode = WAL

PRAGMA journal_mode 是一个 SQLite 命令,用于查询或更改数据库的日志模式。日志模式决定了 SQLite 如何处理事务和保证数据的一致性。
以下是一些可以设置的日志模式:

  • DELETE:这是默认模式。在这种模式下,日志文件(也称为回滚日志)在每个事务结束时都会被删除。
  • TRUNCATE:与 DELETE模式类似,但是在事务结束时,日志文件不是被删除,而是被截断为零长度。这种模式的性能通常比 DELETE 模式稍好一些。
  • PERSIST:在这种模式下,日志文件在事务结束时不会被删除或截断。相反,它会被保留并用于下一个事务。这种模式的性能通常比TRUNCATE 模式稍好一些。但是PERSIST可能会影响secure_delete的设置。
  • MEMORY:在这种模式下,日志文件被存储在内存中,而不是在磁盘上。这种模式的性能最好,但是如果系统崩溃,所有未提交的事务都会丢失。
  • WAL:这是 Write-Ahead Logging 模式。在这种模式下,所有的更改首先被写入到一个单独的日志文件(WAL文件),然后在事务提交时被写入到主数据库文件。这种模式提供了最好的并发性能。

可以使用 PRAGMA journal_mode 命令来查询或更改日志模式,例如:

  • 查询日志模式:PRAGMA journal_mode;
  • 更改日志模式:PRAGMA journal_mode=WAL;
    需要注意的是,更改日志模式会影响所有的数据库连接,而且只有在数据库没有被
    其他连接使用时才能更改。

二、开启WAL后必须要设置的参数

  ptr->execute("PRAGMA journal_mode = WAL");
  ptr->execute("PRAGMA wal_autocheckpoint=5000;");
  ptr->execute("PRAGMA SYNCHRONOUS=NORMAL");

  if (sqlite3_busy_timeout(connection, 20 * 1000) != SQLITE_OK) {
    LOG(ERROR) << "config busy timeout fail, db_path: " << db_path;
  } else {
    LOG(INFO) << "config busy timeout success, db_path: " << db_path;
  }

1.PRAGMA SYNCHRONOUS

ptr->execute("PRAGMA SYNCHRONOUS=NORMAL");

(1)SYNCHRONOUS的类型

PRAGMA synchronous 是一个 SQLite 命令,用于控制数据库文件在磁盘上的写入同步级别。这个设置会影响到数据的持久性和性能。PRAGMA synchronous 有以下几个级别:

OFF (0):同步关闭。SQLite 不会等待操作系统将数据写入磁盘。这种模式下,性能最高,但在系统崩溃或电源故障时,可能会导致数据库损坏或数据丢失。

NORMAL (1):普通同步。SQLite 会在某些关键操作(如事务提交)时等待操作系统将数据写入磁盘。这种模式下,性能较好,但在某些罕见的情况下,仍然可能导致数据库损坏。

FULL (2):完全同步(默认)。SQLite 会在关键操作时确保数据已经写入磁盘。这种模式下,数据的持久性得到了保证,但性能可能较低。

EXTRA (3):额外同步。这个级别类似于 FULL,但会在某些额外的操作时进行同步,以提供更高的数据持久性保证。这种模式下,性能可能会进一步降低。

(2)WAL下如何选择SYNCHRONOUS类型

Sqlite默认是FULL,虽然是最安全的,但是在wal下性能较差,根据官方文档,建议使用NORMAL。
pragma_synchronous

Query or change the setting of the “synchronous” flag. The first (query) form will return the synchronous setting as an integer. The second form changes the synchronous setting. The meanings of the various synchronous settings are as follows:

EXTRA (3)
EXTRA synchronous is like FULL with the addition that the directory containing a rollback journal is synced after that journal is unlinked to commit a transaction in DELETE mode. EXTRA provides additional durability if the commit is followed closely by a power loss.

FULL (2)
When synchronous is FULL (2), the SQLite database engine will use the xSync method of the VFS to ensure that all content is safely written to the disk surface prior to continuing. This ensures that an operating system crash or power failure will not corrupt the database. FULL synchronous is very safe, but it is also slower. FULL is the most commonly used synchronous setting when not in WAL mode.

NORMAL (1)
When synchronous is NORMAL (1), the SQLite database engine will still sync at the most critical moments, but less often than in FULL mode. There is a very small (though non-zero) chance that a power failure at just the wrong time could corrupt the database in journal_mode=DELETE on an older filesystem. WAL mode is safe from corruption with synchronous=NORMAL, and probably DELETE mode is safe too on modern filesystems. WAL mode is always consistent with synchronous=NORMAL, but WAL mode does lose durability. A transaction committed in WAL mode with synchronous=NORMAL might roll back following a power loss or system crash. Transactions are durable across application crashes regardless of the synchronous setting or journal mode. The synchronous=NORMAL setting is a good choice for most applications running in WAL mode.

OFF (0)
With synchronous OFF (0), SQLite continues without syncing as soon as it has handed data off to the operating system. If the application running SQLite crashes, the data will be safe, but the database might become corrupted if the operating system crashes or the computer loses power before that data has been written to the disk surface. On the other hand, commits can be orders of magnitude faster with synchronous OFF.

In WAL mode when synchronous is NORMAL (1), the WAL file is synchronized before each checkpoint and the database file is synchronized after each completed checkpoint and the WAL file header is synchronized when a WAL file begins to be reused after a checkpoint, but no sync operations occur during most transactions. With synchronous=FULL in WAL mode, an additional sync operation of the WAL file happens after each transaction commit. The extra WAL sync following each transaction helps ensure that transactions are durable across a power loss. Transactions are consistent with or without the extra syncs provided by synchronous=FULL. If durability is not a concern, then synchronous=NORMAL is normally all one needs in WAL mode.

The TEMP schema always has synchronous=OFF since the content of of TEMP is ephemeral and is not expected to survive a power outage. Attempts to change the synchronous setting for TEMP are silently ignored.

2.PRAGMA wal_autocheckpoint

pagesize默认设置的是4k,autocheckpoint设置5000,表示5000个page的数据量,会进行一下checkpoint,也就是20M。

3.sqlite3_busy_timeout

(1)产生busy的原因

在 SQLite 的 WAL(Write-Ahead Logging)模式下,“busy” 错误通常是由于多个连接试图同时访问数据库时发生的。以下是一些可能导致 “busy” 错误的情况:

  1. 写入冲突:当一个连接正在执行写操作(如 INSERT、UPDATE 或 DELETE)时,其他连接试图执行写操作或读取尚未提交的数据。在这种情况下,其他连接会收到 “busy” 错误。WAL 模式允许多个读取器与一个写入器并发访问数据库,但不允许多个写入器同时进行。
  2. 检查点操作:在 WAL 模式下,所有的更改首先被写入到一个单独的日志文件(WAL 文件),然后在事务提交时被写入到主数据库文件。当 WAL 文件达到一定大小或者触发某些条件时,SQLite 会执行一个检查点操作,将 WAL 文件中的更改写入主数据库文件。在检查点操作期间,如果其他连接试图访问数据库,它们可能会收到 “busy” 错误。
  3. 独占操作:某些操作(如 VACUUM、ALTER TABLE 或 PRAGMA journal_mode)需要独占访问数据库。在这些操作期间,其他连接试图访问数据库会收到 “busy” 错误。

(2)解决措施

  1. 设置忙等待超时:使用 PRAGMA busy_timeout 命令设置一个超时值(以毫秒为单位)。当连接收到 “busy” 错误时,它会等待指定的时间,然后再次尝试访问数据库。例如,设置忙等待超时为 3000 毫秒(3 秒):
PRAGMA busy_timeout=3000;
  1. 使用互斥锁:在多线程或多进程环境中,使用互斥锁确保同一时间只有一个连接尝试访问数据库。
  2. 优化事务:尽量减少事务的持续时间,以减少冲突的可能性。在可能的情况下,将多个操作组合到一个事务中,以减少提交事务的次数。
  3. 调整检查点策略:使用 PRAGMA wal_autocheckpoint 命令设置 WAL 文件的自动检查点阈值,或者在适当的时候手动执行检查点操作(PRAGMA wal_checkpoint)。这可以帮助减少检查点操作导致的 “busy” 错误。

三、在多线程读写并发下开启WAL时需要配置的参数

1.避免使用PRAGMA locking_mode=EXCLUSIVE

(1)locking_mode的类型

PRAGMA locking_mode=EXCLUSIVE; 是一个 SQLite 命令,用于设置数据库的锁定模式为 Exclusive 模式。
SQLite 支持三种锁定模式:

  1. NORMAL:在这种模式下,SQLite 在事务开始时获取共享锁,当第一次写入时获取保留锁,当事务提交时获取排他锁。在事务结束后,SQLite 会释放所有的锁。

  2. EXCLUSIVE:在这种模式下,SQLite 在事务开始时获取排他锁,并在事务结束后保持该锁。这意味着在事务进行期间,其他数据库连接不能进行读取或写入操作。

  3. IMMEDIATE:在这种模式下,SQLite 在事务开始时获取保留锁,并在事务结束后保持该锁。这意味着在事务进行期间,其他数据库连接可以进行读取操作,但不能进行写入操作。

PRAGMA locking_mode=EXCLUSIVE; 这个命令会设置数据库的锁定模式为 Exclusive 模式。这意味着当你开始一个事务时,SQLite 会立即获取一个排他锁,并在事务结束后保持该锁。这可以防止其他数据库连接在你的事务进行期间进行任何操作。
然而,需要注意的是,Exclusive 模式可能会对并发性能产生影响,因为它阻止了其他数据库连接的所有操作。应该根据具体需求和环境来决定是否使用这种模式。

SQLite 的默认锁定模式是 NORMAL。在这种模式下,SQLite 在事务开始时获取共享锁,当第一次写入时获取保留锁,当事务提交时获取排他锁。在事务结束后,SQLite 会释放所有的锁。
这种模式允许多个读取操作同时进行,但只允许一个写入操作在同一时间进行。这对于大多数应用来说是足够的,因为读取操作通常比写入操作更频繁。

然而,如果你需要更高级的并发控制,你可以使用 PRAGMA locking_mode 命令来改变锁定模式。例如,你可以设置为 IMMEDIATE 模式或 EXCLUSIVE 模式,这两种模式在事务开始时就获取更高级别的锁,从而提供更严格的并发控制。

(2)使用WAL读写并发时不应该使用EXCLUSIVE的原因

当开启 SQLite 的 WAL (Write-Ahead Logging) 模式后,SQLite 的并发性能会得到显著提升。在 WAL 模式下,多个读取操作和一个写入操作可以同时进行,这是因为写入操作不会阻塞读取操作,反之亦然。

在 WAL 模式下,SQLite 通常使用 NORMAL 锁定模式。在这种模式下,读取和写入操作可以并发进行,这正是 WAL 模式的优势所在。因此,通常情况下,你不需要改变锁定模式。

然而,如果你有特殊的需求,比如你需要阻止其他连接进行读取或写入操作,你仍然可以使用 PRAGMA locking_mode 命令来改变锁定模式。但是请注意,这可能会降低并发性能,因为它可能会阻止其他操作的进行。

总的来说,开启 WAL 模式后,通常应该使用默认的 NORMAL 锁定模式,除非你有特殊的需求。

2.sqlite3_config(SQLITE_CONFIG_MULTITHREAD);

(1)SQLite 的三种线程模式

sqlite3_config(SQLITE_CONFIG_MULTITHREAD); 是一个 SQLite C API 的调用,用于设置 SQLite 的线程模式为多线程(multi-threaded)模式。
SQLite 支持三种线程模式:

  1. Single-threaded:在这种模式下,SQLite 不会尝试使用任何线程安全机制,所有的操作都应该在同一个线程中进行。
  2. Multi-threaded:在这种模式下,SQLite 会使用线程安全机制来允许多个线程同时访问同一个数据库连接。然而,每个数据库连接仍然只能被一个线程在同一时间使用。
  3. Serialized:在这种模式下,SQLite 会使用更严格的线程安全机制来允许多个线程同时使用同一个数据库连接。

(2)如何选择线程模式来支持读写并发

sqlite3_config(SQLITE_CONFIG_MULTITHREAD); 这个调用会设置 SQLite 为多线程模式。这意味着你可以在多个线程中使用 SQLite,但是你需要确保每个数据库连接在同一时间只被一个线程使用。

注意,这个调用应该在所有的 SQLite 操作之前进行,通常在程序启动时。另外,这个调用可能会失败,例如如果你已经在其他地方使用了 SQLite。在这种情况下,你需要检查这个调用的返回值来确定它是否成功。

设置 SQLite 为 Serialized 模式并开启 WAL(Write-Ahead Logging)模式,可以实现在多线程环境下的读写并发。在 Serialized 模式下,SQLite 会使用严格的线程安全机制,允许多个线程同时使用同一个数据库连接。这意味着你可以在多个线程中同时进行读取和写入操作,而不需要担心线程安全问题。

同时,开启 WAL 模式可以进一步提高并发性能。在 WAL 模式下,读取操作和写入操作可以同时进行。这是因为在 WAL 模式下,写入操作会被写入到一个单独的 WAL 文件中,而不是直接写入到数据库文件中。这意味着读取操作可以在不被写入操作阻塞的情况下进行。然而,需要注意的是,虽然 WAL 模式允许读取和写入操作同时进行,但是它仍然只允许一个写入操作在同一时间进行。如果你需要多个写入操作同时进行,你可能需要考虑其他的解决方案,如分片或者使用其他的数据库系统。

另外,使用 Serialized 模式和 WAL 模式可能会对性能产生影响,因为它们需要额外的线程同步和磁盘 I/O 操作。你应该根据你的具体需求和环境来决定是否使用这些模式。

四、和WAL不冲突的配置

1.PRAGMA secure_delete=ON

PRAGMA secure_delete=ON 命令用于启用安全删除模式,以避免已删除的数据被恢复和泄露。开启 WAL 模式可以提高并发读写性能和数据完整性,以提高 SQLite 数据库的性能和可靠性。
在使用 PRAGMA secure_delete=ON 命令和开启 WAL 模式时,你需要注意以下几个问题:

  1. 数据库连接和操作:在多线程环境中,你需要使用线程安全的方式管理数据库连接和操作,以避免并发读写问题和数据损坏。
  2. 数据库备份和恢复:在使用安全删除模式和 WAL 模式时,你需要使用特殊的备份和恢复方式,以确保已删除的数据无法被恢复和泄露,并保证数据的完整性和一致性。
  3. 存储空间使用量:在使用安全删除模式和 WAL 模式时,可能会增加 SQLite 数据库的存储空间使用量。你需要根据实际情况进行权衡和选择,并使用适当的存储优化技术来减少存储空间使用量。
    总之,PRAGMA secure_delete=ON 命令和开启 WAL 模式可以同时使用,以提高 SQLite 数据库的安全性和性能。但在使用这两个功能时,你需要注意一些配置和性能问题,并根据实际情况进行权衡和选择

2.PRAGMA mmap_size

(1)mmap_size原理

PRAGMA mmap_size= 是一个 SQLite 命令,用于设置内存映射 I/O 的最大字节数。内存映射 I/O 可以提高 SQLite 的性能,特别是对于大型数据库和大型查询。

这个命令的语法是 PRAGMA mmap_size=N;,其中 N 是你想要设置的字节数。例如,PRAGMA mmap_size=268435456; 会设置内存映射 I/O 的最大字节数为 256MB。

默认情况下,SQLite 的内存映射 I/O 是关闭的,也就是说 mmap_size 的默认值是 0。你可以使用 PRAGMA mmap_size; 命令来查询当前的 mmap_size 值。

需要注意的是,虽然内存映射 I/O 可以提高性能,但是它也可能会增加内存的使用量。因此,你应该根据你的具体需求和环境来决定是否使用内存映射 I/O,以及设置多大的 mmap_size 值。

(2)mmap_size和WAL不冲突

PRAGMA mmap_size 和 WAL (Write-Ahead Logging) 是两个独立的 SQLite 功能,它们可以同时使用,没有冲突。

PRAGMA mmap_size 是用来设置内存映射 I/O 的最大字节数,这可以提高 SQLite 的性能,特别是对于大型数据库和大型查询。
WAL 是一种日志模式,它允许多个读取操作和一个写入操作同时进行,从而提高并发性能。

这两个功能都是为了提高 SQLite 的性能,它们可以同时使用,以提供更高的性能。然而,你应该根据你的具体需求和环境来决定是否使用这些功能,以及如何配置它们。例如,虽然内存映射 I/O 和 WAL 都可以提高性能,但是它们也可能会增加内存的使用量,所以你需要根据你的内存资源来决定是否使用这些功能,以及如何配置它们。

3.PRAGMA auto_vacuum

(1)auto_vacuum原理

PRAGMA auto_vacuum; 是一个 SQLite 命令,用于查询或设置数据库的自动清理(auto-vacuum)模式。
SQLite 的 auto-vacuum 功能可以自动回收删除的数据所占用的磁盘空间,使其可以被后续的插入操作重用。这个功能默认是关闭的。
以下是 PRAGMA auto_vacuum; 的可能用法:

  • PRAGMA auto_vacuum;:查询当前的 auto-vacuum 设置。返回值为 0、1 或 2,分别表示 “关闭”(NONE)、“全量”(FULL)或 “增量”(INCREMENTAL)模式。
  • PRAGMA auto_vacuum = 0;:关闭 auto-vacuum 功能。
  • PRAGMA auto_vacuum = 1;:启用全量 auto-vacuum 功能。在每次事务提交时,SQLite 会尝试回收删除的数据所占用的空间。
  • PRAGMA auto_vacuum = 2;:启用增量 auto-vacuum 功能。SQLite 会在空间被标记为可回收后,但不会立即回收。你需要手动执行 PRAGMA incremental_vacuum; 命令来回收空间。
    注意,更改 auto-vacuum 设置需要 VACUUM 命令的执行,且必须在没有活动事务的情况下进行。另外,启用 auto-vacuum 功能可能会对性能产生影响,因为它需要额外的磁盘 I/O 操作来回收和重用空间。

(2)auto_vacuum和WAL不冲突

PRAGMA auto_vacuum 和 WAL (Write-Ahead Logging) 模式之间没有直接冲突。它们可以同时启用并共同工作。auto_vacuum 是用于控制 SQLite 数据库空间回收的设置,而 WAL 模式是用于控制事务和数据一致性的日志模式。
PRAGMA auto_vacuum 有以下几种模式:

  1. NONE(默认):不进行自动空间回收。
  2. FULL:在删除数据时,自动回收并释放未使用的存储空间。
  3. INCREMENTAL:允许手动执行 PRAGMA incremental_vacuum 命令来回收未使用的存储空间。
    当你使用 WAL 模式时,SQLite 会将所有更改首先写入一个单独的日志文件(WAL 文件),然后在事务提交时将其写入主数据库文件。这种模式提供了更好的并发性能。

同时启用 auto_vacuum 和 WAL 模式时,SQLite 会在事务提交时尝试回收和释放未使用的存储空间。这两个功能可以共同工作,但在某些情况下,它们可能会对性能产生一定影响。例如,当 auto_vacuum 设置为 FULL 时,SQLite 可能需要在事务提交时执行额外的磁盘操作以回收空间,这可能会导致性能下降。
总之,PRAGMA auto_vacuum 和 WAL 模式之间没有直接冲突,但在某些情况下,它们可能会对性能产生一定影响。你需要根据你的应用程序需求和性能要求来选择合适的设置。

你可能感兴趣的:(数据库,sqlite,java,数据库,WAL)