DolphinDB智臾科技

干货收藏丨DolphinDB 节点启动流程简析与常见问题一览

DolphinDB 的重启是运维工作的重要部分，在启动节点时可能会遇到一些问题，例如启动太慢、启动失败等。本教程以 DolphinDB v2.00.11 版本为例，结合运行日志简析 DolphinDB 整体的启动流程和重要模块的启动流程，并分析启动时常见问题的现象、原因和解决方案。

1. 节点整体启动流程

DolphinDB 节点整体的启动流程可分为 7 个阶段：

初始化内部基础模块；
解析和校验参数、配置文件、license 文件，并初始化和启动一些基本功能模块和线程；
根据加载的配置文件内容初始化 server，执行 dolphindb.dos，加载 preloadModules 配置的插件和模块；
初始化和启动 server 的各个功能模块和线程，绑定端口。包括用户权限与函数视图初始化、元数据初始化、事务回滚、redo log 回放、RAFT 初始化等；
执行 startup 配置项指定的 startup.dos 脚本；
初始化定时任务；
执行 postStart 配置项指定的 postStart.dos 脚本。

其中第 4 步，不同节点会根据自己的职能初始化和启动相应功能的模块和线程。例如单节点和控制节点会启动 DFS 模块来管理分布式文件元数据，而数据节点不会启动；单节点和数据节点会启动 ChunkNode 模块来存储和管理分区数据，而控制节点不会启动。

重要启动流程开始和成功日志如下表：

流程	开始日志	成功日志	备注
用户权限与函数视图初始化	Initializing AclManager with Raft	Initialization of AclManager is completed with Raft	RAFT mode 为 0 或 1
控制节点元数据初始化		非 RAFT 模式：Controller initialization completed.RAFT 模式：DFSRaftReplayWorker started
数据节点分区元数据初始化		ChunkMgmt initialization completed.
数据节点恢复事务的重做日志回放	dfsRecoverLogDir:	RecoverRedoLogManager finished chunk num is , total chunks recover num is , compare checksum succ pack num is , test replay num is , actual recover redo pack num is , redo chunk num is
数据节点 TSDB 元数据初始化		Restore TSDB meta successfuly.
redo log 回放	若存在 redo log：Start recovering from redo log. This may take a few minutes.	若存在 redo log：Completed CacheEngine GC and RedoLog GC after applying all redo logs and engine is 若不存在 redo log：No available redo log files were found. Redo log replay was skipped.	engine type 为 OLAP 或 TSDB，故如果为 DolphinDB 2.0 版本，相应日志会有两条
RAFT 初始化	DFSMaster ElectionTick is set to	DFSRaftReplayWorker started
执行 startup.dos	Executing the startup script:	The startup script: execution completed.
定时任务初始化	Job scheduler start to initialize.	Job scheduler initialization completed.
执行 postStart.dos	Executing the post start script:	The post start script: execution completed.

Redo log 回放完成后，数据节点会向控制节点汇报本地分区信息，然后启动心跳进程，此时节点在 web 集群管理界面的状态会转变为绿色，但还没有到“执行 startup.dos”一步。由于执行 postStart.dos 失败并不会导致节点启动失败，故节点启动完成的标志日志为 Job scheduler initialization completed.

2. 重要启动流程简析

2.1 license 校验

DolphinDB 启动时会先校验 license 与集群配置信息是否合规。如果启用了 license server，则连接 license server 进行校验，否则读取安装目录下 dolphindb.lic 文件进行校验。校验内容包括：

过期时间
每个节点绑定的核数
每个节点的最大内存
集群内最大节点数
最高支持的 server 版本

如果校验失败，会打印相应的错误日志然后节点关闭。例如 license 过期时会打印错误日志 The license has expired.

2.2 用户权限与函数视图初始化

DolphinDB 的权限管理与函数视图定义持久化保存在单节点或控制节点的数据目录，根据是否启用 RAFT 高可用存储在不同的位置。非 RAFT 模式（即单节点或普通集群）时，存储在控制节点的 //sysmgmt 路径下，相关文件说明如下表：

文件名	说明
aclEditlog.meta	权限与函数视图的编辑日志文件
aclCheckPoint.meta	权限与函数视图的 checkpoint 文件，当编辑日志过大时会做一次 checkpoint 保存最新的权限与函数视图的状态
aclCheckPoint.tmp	权限与函数视图的 checkpoint 临时文件，做 checkpoint 时临时生成

注意：HOME_DIR 指节点的主目录，即 getHomeDir() 方法返回结果；NodeAlias 指节点别名，即getNodeAlias() 方法返回结果。

RAFT 模式（即高可用集群）时，存储在 leader 控制节点的 //raft 路径下，详见 RAFT 元数据初始化一节。

非 RAFT 模式初始化流程如下：

开始，打印日志：Initializing AclManager with Raft ；
如果不是高可用集群：

读取节点数据目录/sysmgmt，如果不存在则创建；
如果不存在aclEditlog.meta但存在有效的aclCheckPoint.tmp，重命名aclCheckPoint.tmp为aclEditlog.meta；
如果存在aclCheckPoint.meta，检查校验和；
读取aclCheckPoint.meta 文件恢复用户权限和函数视图；
读取和回放 aclEditlog.meta 文件恢复用户权限和函数视图；
裁剪aclEditlog.meta中的无效部分；

3. 如果不存在 RSA 校验密钥（aclPublic.key 和 aclPrivate.key，存储路径为 //keys，用于集群间加密通信），如果不是高可用集群，生成RSA校验密钥；如果是高可用集群，则以控制节点名字母表顺序从其他控制节点拿密钥；

4. 如果不存在 admin 用户，创建 admin 用户；

5. 结束，打印日志：Initialization of AclManager is completed with Raft 。

2.3 控制节点元数据初始化

DolphinDB 的分布式文件系统（DFS）管理集群的所有分区数据的元数据，元数据根据是否启用 RAFT 高可用存储在不同的位置。非 RAFT 模式（即单节点或普通集群）时，存储在单节点或控制节点的 dfsMetaDir 配置项路径下，相关文件说明如下表：

文件名	说明
DFSMetaLog.cid	DFS 元数据的编辑日志文件。其中 cid 指事务提交ID
DFSMasterMetaCheckpoint.cid	DFS 元数据的 checkpoint 文件，当编辑日志过大时会做一次 checkpoint 保存最新的元数据的状态
DFSMasterMetaCheckpoint.cid.tmp	DFS 元数据的 checkpoint 临时文件，做 checkpoint 时临时生成

RAFT 模式（即高可用集群）时，存储在 leader 控制节点的 //raft 路径下，详见 RAFT 初始化一节。

非 RAFT 模式初始化流程如下：

读取节点 dfsMetaDir 配置项目录，如果不存在则创建；
如果存在临时 checkpoint 文件，尝试解析，如果文件无效，只保存文件名的 cid 信息然后删除；否则重命名为 checkpoint 文件；
如果存在 checkpoint 文件，尝试解析，如果解析失败则程序退出；否则读取 checkpoint 信息。相关运行日志： checkpoint file
metalog file
读取和回放 checkpoint 的 cid 开始的所有编辑日志。相关运行日志： ---------start replaying edit log, log files to replay----------done reading editlog file , processsed records---------done replaying edit log, record(s) processed-----------Global cid Global tid , reader snapshot id
清理过期无效的 DFSMetaLog。
结束，打印日志 Controller initialization completed.。

2.4 数据节点元数据初始化

DolphinDB 单节点或数据节点存储和管理本地分区数据及元数据，启动时会先恢复本地分区的元数据，然后根据事务 log 回滚关机时未完成的事务，上报已提交的事务到控制节点。相关文件存储在 chunkMetaDir 配置项路径和 volumes 配置项路径下，说明如下：

文件名	存储路径	说明
editlog.cid	/CHUNK_METADATA	本地元数据的编辑日志文件。其中 cid 指事务提交ID
checkpoint.cid	/CHUNK_METADATA	本地元数据的 checkpoint 文件，当编辑日志过大时会做一次 checkpoint 保存最新的元数据的状态
checkpoint.tmp.cid	/CHUNK_METADATA	本地元数据的 checkpoint 临时文件，做 checkpoint 时临时生成
以 tid 为名的文件夹	/LOG	事务 log。其中 tid 为事务ID
以 tid 为名的文件夹	/LOG	删除事务涉及的数据文件临时存放的目录

具体初始化流程如下：

如果存在 checkpoint 临时文件，校验是否有效，若有效，重命名为 checkpoint 文件；
找到 tid 最大的 checkpoint 文件并读取元数据状态；
读取 tid 大于等于最大的 checkpoint tid 的 editlog 编辑日志并回放，相关运行日志： Opened editlog file .
回滚未提交的事务，相关运行日志： Will process pending transactions.Processing transactions took seconds.Will process uncommited and committed but not completed transactions.
删除已回滚的事务 LOG 文件夹，相关运行日志： As transaction is rollbacked, transaction log directory is deleted.
完成，打印日志 ChunkMgmt initialization completed.

2.5 数据节点恢复事务的重做日志回放

DolphinDB 集群支持节点间数据恢复功能，若配置了 enableDfsRecoverRedo = true，在节点间数据恢复的过程中，会将恢复事务相关的数据先写入 recover redo log 中，然后在启动时回放恢复事务的重做日志。相关文件存储在 recoverLogDir 配置项目录下，说明如下：

文件名	说明
recover.log	恢复事务重做日志
recover.log.tmp	生成恢复事务重做日志时的临时文件

具体初始化流程如下：

如果同时存在恢复事务重做日志和对应临时文件，删除临时文件；
从恢复事务重做日志中解析需要回放的恢复事务，相关运行日志： RecoverRedoLogManager will recover chunk num=, total recover pack num=, skip garbage pack num= will redo pack num=
重做恢复事务，相关运行日志： RecoverRedoLogManager finished chunk num is , total chunks recover num is , compare checksum succ pack num is , test replay num is , actual recover redo pack num is , redo chunk num is
清理无用的恢复日志。

2.6 数据节点 TSDB 元数据初始化

DolphinDB 2.0 版本支持 TSDB 存储引擎，启动时会恢复 TSDB 的 level file 相关元数据。相关文件存储在 TSDBRedoLogDir 配置项的同级目录的 TSDBMeta 目录下，说明如下：

文件名	说明
iotEditLog.meta	TSDB 元数据的编辑日志文件。其中 cid 指事务提交ID
iotCheckPointFile.meta	TSDB 元数据的 checkpoint 文件，当编辑日志过大时会做一次 checkpoint 保存最新的元数据的状态
iotCheckPointerFile.tmp	TSDB 元数据的 checkpoint 临时文件，做 checkpoint 时临时生成

具体初始化流程如下：

如果存在 checkpoint 临时文件，校验是否有效，若有效，重命名为 checkpoint 文件并删除编辑日志；若无效，则删除 checkpoint 临时文件，相关运行日志： ------RESTORE size , size , size ;------RESTORE rename tmp file to
读取 checkpoint 文件恢复元数据状态，相关运行日志： ------RESTORE checkpoint file to validPos
读取和回放编辑日志文件恢复元数据状态，相关运行日志： ------RESTORE editLogFile file to validPos
完成，打印日志 Restore TSDB meta successfuly.。

2.7 数据节点 redo log 回放

DolphinDB 通过 redo log 来实现意外重启时对已提交但未完成事务的回放。DolphinDB v2.00.10.3 版本对 append, tableInsert, insert into 等新增数据的写入操作支持 redo log。OLAP 存储引擎的 redo log 存储路径 redoLogDir 配置项目录下，TSDB 存储引擎的 redo log 存储路径在 TSDBRedoLogDir 配置项目录下，相关文件：

文件名	说明
head.log	redo log 元数据信息
head.log.tmp	生成 redo log 元数据信息时的临时文件
lsn.log	redo log 全局序列号
tid.log	未完成的事务数据信息

具体初始化流程如下：

如果不存在 redo log 文件夹或 redo log 文件夹为空，跳过 redo log 回放，打印日志：No available redo log files were found. Redo log replay was skipped.；
开始回放，打印日志：Start recovering from redo log. This may take a few minutes.；
如果存在 head.log.tmp，删除；
解析 head.log 得到 redo log 的元数据信息，包含可能需要回放的事务（已提交的）和不需要回放的事务（未提交或已完成的）；
遍历可能需要回放的事务的 redo log，结合多方面信息具体判断是否需要回放，对于状态完成的事务立即回放，状态不确定的事务保留相关信息以备决议，相关运行日志： applyTidRedoLog : ,,,,,,
结束回放，打印日志：Completed CacheEngine GC and RedoLog GC after applying all redo logs and engine is 。

注意：redo log 与 cache engine 的具体功能介绍见 redo log 和 cache engine。有后台线程定期自动清理不再需要的 tid.log 文件。

2.8 控制节点 RAFT 元数据初始化

DolphinDB 的高可用集群通过 RAFT 管理 DFS 元数据、权限和函数视图数据等控制节点的元数据。Raft 日志存储在控制节点的 //raft目录下，相关文件说明：

文件	说明
raftHardstate[group]	RAFT 的任期（term）和投票相关元数据信息。其中 group 为 RAFT 组号
raftWAL[group]	RAFT 业务数据日志，含其他使用 RAFT 模块的数据，如 DFS 元数据、权限和函数视图数据等。
raftSnapshot[group]	RAFT 业务数据日志的快照
raftWAL[group].old	旧的业务数据日志，生成快照时的临时文件
raftSnapshot[group].tmp	生成快照时的临时文件

具体初始化流程如下：

开始，打印日志：DFSMaster ElectionTick is set to [electionTick]；
从 controller.cfg 读取 RAFT 集群信息；
从 raftHardstate 读取 RAFT 成员相关的信息；
从 raftSnapshot 读取业务日志的快照（可以理解为 checkpoint），清理快照临时文件；
从 raftWAL 读取和重做业务日志（包含 dfsMeta, acl log, streamingHA log等），相关运行日志： Group RaftWAL::reconstruct: read new file with entries Group RaftWAL::reconstruct: read old file with entries
初始化节点成为 follower，加入 RAFT 集群，相关运行日志： Group became follower at term , leader is Group begin to clear all old notifiers
完成，打印日志： Group initialized successfully.

2.9 定时任务初始化

DolphinDB 的定时任务会持久化保存到硬盘，单节点或控制节点保存在 //sysmgmt目录下，数据节点或计算节点保存在 /sysmgmt目录下，相关文件说明：

文件	说明
jobEditlog.meta	定时任务的编辑日志文件
jobCheckPoint.meta	定时任务的 checkpoint 文件，当编辑日志过大时会做一次 checkpoint 保存最新的元数据的状态
jobCheckPoint.tmp	定时任务的 checkpoint 临时文件，做 checkpoint 时临时生成

具体初始化流程如下：

开始，打印日志：Job scheduler start to initialize.；
如果不存在编辑日志文件或为空，校验 checkpoint 临时文件，如果有效则重命名为 checkpoint 文件；
如果存在 checkpoint 文件，校验，如果失效则报错退出；
读取 checkpoint 文件恢复定时任务；
读取和回放编辑日志文件恢复定时任务；
裁剪无效的编辑日志；
结束，打印日志：Job scheduler initialization completed.

3. 启动问题定位思路

DolphinDB 节点启动失败时，最明显的现象是启动节点后，对应的 web 界面无法访问，如果是集群在 web 管理界面会看到节点状态为红色。启动问题主要可以分为三类：

启动异常关闭
启动异常卡住
启动慢

首先需要先确认是哪类问题，在启动节点后，通过如下命令查看节点进程是否存在：

ps -ef | grep dolphindb // 如果修改了可执行文件名，需要修改 dolphindb 为相应可执行文件名

若进程不存在则是启动异常关闭；若进程存在，通过如下命令搜索日志确定节点是否启动完成：

grep "Job scheduler initialization completed." dolphindb.log

若有执行启动后的时间的日志输出则节点已正常启动，可以去 web 界面刷新确认节点状态是否已为绿色；否则是启动异常卡住或启动慢。通过如下命令搜索节点运行日志中的 ERROR：

grep "ERROR" dolphindb.log

若在执行启动后的时间一直重复刷某段 ERROR 日志，且节点进程一直在，则为启动异常卡在某个阶段；否则为正常启动，只是比较慢还没启动成功，需要继续等待观察启动结果。

具体问题需要分析节点运行日志，节点运行日志存储位置由命令行参数 logFile 决定。另外集群环境下可以通过 logFile 配置项指定节点运行日志存储位置。

注意：若使用 startSingle.sh 启动单节点，节点运行日志默认存储在安装目录的 dolphindb.log。若使用 clusterDemo 文件夹下的 startController.sh 和 startAgent.sh 来启动集群，节点运行日志默认存储在 clusterDemo/log，文件名为 .log。

3.1 启动异常关闭

首先需要区分节点是启动成功后的运行过程中异常宕机，还是启动过程中异常关闭。需要参照《1. 节点整体启动流程》一节查看是否有节点启动完成的日志 Job scheduler initialization completed.，有则是节点启动成功后运行过程中异常宕机，需要根据《排查节点宕机的原因》来定位节点宕机问题；否则是启动过程中异常关闭问题。

需要查看节点最新运行日志中启动阶段的 ERROR 日志。注意要查看启动阶段的 ERROR 日志而不是启动失败后关机阶段的 ERROR 日志。DolphinDB 在关机时打印如下 ERROR 日志是预期的：

...
 : The socket server ended.
...
 : AsynchronousSubscriberImp::run Shut down the subscription daemon.
...

如果存在关机日志，需要继续往上搜索 ERROR 查看启动阶段的日志，结合前文的启动流程分析和后文的常见启动问题来分析失败原因。另外需要注意是否在启动过程中宕机，若宕机节点进程会直接被杀死，而不会走关机流程，此时需要查看 coredump 里的堆栈信息：

cd /path/to/dolphindb
gdb dolphindb /path/to/corefile
bt

堆栈信息需要发给 DolphinDB 技术支持来分析定位。

3.2 启动异常卡住

需要查看节点最新运行日志中的 ERROR 日志，结合前文的启动流程分析、后文的常见启动问题来确定当前节点正在启动什么模块、执行什么动作失败。一般会重复打印某段 ERROR 日志以尝试启动，可以使用如下命令实时查看节点刷的日志：

tail -f dolphindb.log

另外可以使用 pstack 命令来查看启动时节点内部各个线程的堆栈信息，以确定线程具体执行的动作：

pstack dolphindb_pid > /tmp/pstack.log # 替换 dolphindb_pid 为 dolphindb 进程号

堆栈信息需要发给 DolphinDB 技术支持来分析定位。

3.3 启动慢

需要查看节点最新运行日志结合前文的启动流程分析、后文的常见启动问题来确定当前节点正在启动什么模块、执行什么动作。启动慢时，一般不会有 ERROR 日志。常见的启动慢原因是回滚事务或回放 redo log，详见《4.3 启动慢》一节。

另外可以使用 pstack 命令来查看启动时节点内部各个线程的堆栈信息，以确定线程具体执行的动作：

pstack dolphindb_pid > /tmp/pstack.log # 替换 dolphindb_pid 为 dolphindb 进程号

堆栈信息需要发给 DolphinDB 技术支持来分析定位。

4. 常见问题

列出 DolphinDB 常见的启动问题和解决方案。若问题现象不属于常见问题，请联系 DolphinDB 技术支持定位处理。

4.1 启动异常关闭

4.1.1 license 过期

DolphinDB 会在 license 过期前 15 天在 web 或 gui 提示 license 即将过期，而过期后如果节点还在线则能够继续使用 15 天，到第 15 天时会自动关机。License 过期后启动 DolphinDB 会失败，节点运行日志中会有如下 WARNING 和 ERROR 日志：

2023-10-13 09:52:30.007743  :The license has expired. Please renew the license and restart the server.
2023-10-13 09:52:30.163238  : The license has expired.

需要联系销售获取更新 license。

4.1.2 端口冲突

DolphinDB 启动时会绑定一个端口用来做网络传输，由配置文件的 localSite 配置项指定。若配置的端口被其他程序占用，或上一次关闭节点还没有完全关闭，则会导致节点启动时绑定端口失败而启动失败。查看节点运行日志有如下报错：

2023-10-26 09:01:31.349118  :Failed to bind the socket on port 8848 with error code 98
2023-10-26 09:01:31.349273  :Failed to bind the socket on port 8848. Shutting down the server. Please try again in a couple of
 minutes.

运行如下命令查看占用指定端口的程序：

netstat -nlp | grep 端口号

解决方案是停止占用端口的程序后再启动。若为上一次关闭的节点还没有完全关闭，需要等待节点关闭或使用 kill -9 强行停止节点再启动，强行停止节点可能会导致关机前未完成的写入的数据丢失。

4.1.3 redo log 文件损坏

数据节点启动时会回放 redo log，如果上次运行时出现磁盘满、宕机或 bug，可能导致 redo log 文件损坏，可能导致节点启动时回放 redo log 失败抛出异常而启动失败。例如查看节点运行日志有如下报错：

2023-12-11 15:18:58.888865  :applyTidRedoLog : 2853,c686664b-d020-429a-1746-287d670099e9,/hdd/hdd7/hanyang/server/clusterDemo/data/P1-datanode/storage/CHUNKS/multiValueTypeDb1/20231107/Key0/g
z,pt_2,32054400,1046013,0
2023-12-11 15:18:58.895064  :VectorUnmarshall::start Invalid data form 0 type 0
2023-12-11 15:18:58.895233  :The redo log for transaction [2853] comes across error: Failed to unmarshall data.. Invalid message format
2023-12-11 15:18:58.895476  :The ChunkNode failed to initialize with exception [Failed to unmarshall data.. Invalid message format].
2023-12-11 15:18:58.895555  :ChunkNode service comes up with the error message: Failed to unmarshall data.. Invalid message format

日志含义为回放 redo log 时发现 tid 为 2853 的 redo log 文件格式错误导致回放失败。此时需要通过如下步骤跳过 redo log 回放：

mv 移走和文件夹下的 head.log 文件，cp 备份报错对应的 2853.log 文件；
启动节点，观察是否正常启动，启动后检查重启前正在写入的数据完整性，是否要补数据等。

如果不是磁盘满导致，需要将 head.log 和报错对应的 2853.log 发给 DolphinDB 技术支持定位问题。

4.1.4 函数视图或定时任务包含不存在的方法

节点启动时会反序列化函数视图和定时任务文件，若反序列化的方法定义中包含不存在于内存的方法，将会导致相关函数视图和定时任务反序列化失败。常见情况如下：

使用了未配置自动加载的插件和模块的方法
更新插件或模块后相关方法名变更

例如，定义定时任务 myTest 调用 rabbitmq 插件的方法：

loadPlugin("plugins/rabbitmq/PluginRabbitMQ.txt")

def myTest() {
	HOST="192.168.0.53"
    PORT=5672
    USERNAME="guest"
    PASSWORD="guest"

    conn = rabbitmq::connection(HOST, PORT, USERNAME, PASSWORD);
}

scheduleJob("myTest", "myTest", myTest, 15:50m, startDate=today(), endDate=today()+3, frequency='D')

如果未配置 preloadModules=plugins::rabbitmq，则节点启动时不会加载 rabbitmq 插件的函数定义到内存，节点启动反序列化定时任务会失败，运行日志会有如下报错：

2023-10-13 09:55:30.166268  :CodeUnmarshall::start readObjectAndDependency exception: Can't recognize function: rabbitmq::connection
2023-10-13 09:55:30.166338  :Failed to unmarshall the job [myTest]. Can't recognize function: rabbitmq::connection. Invalid message format

解决方案是添加报错方法对应的插件或模块到 preloadModules 配置项，即配置 preloadModules=plugins::rabbitmq，然后再启动节点。

若为更新插件或模块后相关方法名变更，需要回退插件或模块再启动，删除对应的视图或定时任务后，再升级插件或模块。

4.1.5 函数视图或定时任务包含不存在的共享表

该问题已在 1.30.23.1/2.00.11.1 或以上版本修复。

节点启动时会反序列化函数视图和定时任务文件，若反序列化的方法定义中包含不存在于内存的共享表，将会导致相关函数视图和定时任务反序列化失败。

问题1：定时任务反序列化失败

例如，定时任务 myTest 的定义如下：

share table(1 2 3 as id, 1 2 3 as val) as t

def myTest() {
	update t set val = val + 1
}

scheduleJob("myTest", "myTest", myTest, minute(now())+5, today(), today(), 'D')

其中第 4 行的 update 语句用于更新共享表 t。如果在启动脚本 startup.dos 中未创建共享表 t，则节点启动时反序列化定时任务会失败，运行日志会有如下WARNING 和 ERROR 日志：

2023-10-23 09:38:27.746184  :Failed to recognize shared variable t
2023-10-23 09:38:27.746343  :CodeUnmarshall::start readObjectAndDependency exception: Failed to deserialize update statement
2023-10-23 09:38:27.746404  :Failed to deserialize update statement. Invalid message format

原因：定时任务的定义中使用了未创建的表。

解决方法：

在报错的定时任务 myTest 中检查是否使用了未创建的表，例如前述的共享表 t。
在定时任务所在节点的启动脚本 startup.dos 中添加相应的建表语句。
启动节点。

问题 2：函数视图反序列化失败

如果将前述问题 1 中的定时任务 myTest 添加到函数视图，例如：addFunctionView(myTest)，也会导致节点启动时反序列化函数视图失败，运行日志中会出现相同的报错。

原因：函数视图反序列化先于节点启动，因此在控制节点的 startup.dos 中定义共享表 t 也不会有效。

解决方法：

对于普通集群：

移除 /sysmgmt下的 aclEditlog.meta、aclCheckPoint.meta、aclCheckPoint.tmp。
重新启动节点。
启动后重新添加所有权限和函数视图定义。

对于高可用集群，如果未重启，或存在半数以上控制节点存活：

删除相关函数视图：dropFunctionView("myTest")
生成权限与函数视图的 checkpoint 文件以避免启动时回放 RAFT 日志执行之前的函数视图定义。rpc(getControllerAlias(), aclCheckPoint, true) // 参数 force = true 表示强制生成 checkpoint

对于高可用集群，如果已重启：

移除所有控制节点的 //raft目录下的 raftHardstate[group]、raftWAL[group]、raftSnapshot[group]、raftWAL[group].old、raftSnapshot[group].tmp。注意：这会导致集群元数据全部失效。
重新启动节点。

必然存在 aclEditlog.meta，可能存在aclCheckPoint.meta，aclCheckPoint.tmp。

必然存在 raftHardstate[group]，raftWAL[group]，可能存在 raftSnapshot[group]，raftWAL[group].old，raftSnapshot[group].tmp。

后续版本会优化添加函数视图的功能以避免需要删除元数据来解决该问题。

4.1.6 函数视图方法名与预加载的模块或插件的方法名冲突

节点启动时会反序列化函数视图文件，若反序列化的函数视图方法名与已通过 preloadModule 加载的方法名冲突，将会导致函数视图反序列化失败。例如，直接添加 ops 模块的 cancelJobEx 方法到函数视图：

use ops
addFunctionView(ops::cancelJobEx)

若同时配置 preloadModules=ops，启动时运行日志会有如下报错：

2023-10-20 08:46:15.733365  :CodeUnmarshall::start readObjectAndDependency exception: Not allowed to overwrite existing functions/procedures [ops::cancelJobEx] by system users.
2023-10-20 08:46:15.733422  :Not allowed to overwrite existing functions/procedures [ops::cancelJobEx] by system users.. Invalid message format

解决方案是去掉 preloadModules=ops 配置项，然后再启动节点。不建议先定义模块再将模块内的方法添加到函数视图，而应该直接定义方法再添加到函数视图。

4.1.7 定时任务文件损坏

DolphinDB 序列化定时任务到文件时，如果上次运行时出现磁盘满、宕机或 bug，可能导致定时任务文件损坏，可能导致节点启动时反序列化失败抛出异常而启动失败。例如查看节点运行日志有如下报错：

2023-10-13 09:57:30.456789  :CodeUnmarshall::start readObjectAndDependency exception: Failed to deserialize update statement
2023-10-13 09:57:30.456789  :Failed to unmarshall the job [myTest]. Failed to deserialize update statement. Invalid message format

此时如果希望尽快启动节点，可以移走jobEditlog.meta，jobCheckPoint.meta，jobCheckPoint.tmp文件以跳过启动时的定时任务反序列化，再启动节点。

必然存在 jobEditlog.meta，可能存在 jobCheckPoint.meta， jobCheckPoint.tmp。

请打包定时任务文件、日志里报错的定时任务脚本和节点运行日志，联系 DolphinDB 技术支持排查问题。

节点启动后，需要重新提交所有定时任务。

4.1.8 权限与函数视图文件损坏

DolphinDB 序列化权限操作和函数视图定义到文件时，如果上次运行时出现磁盘满、宕机或 bug，可能导致权限和函数视图文件损坏，可能导致节点启动时反序列化失败抛出异常而启动失败。例如查看节点运行日志有如下报错：

2023-10-13 09:59:35.786438  :CodeUnmarshall::start readObjectAndDependency exception: Failed to deserialize sql query object
2023-10-13 09:59:35.786438  :Failed to unmarshall the job [myTest1]. Failed to deserialize sql query object. Invalid message format

此时如果希望尽快启动节点，可以参考《4.1.5 函数视图或定时任务包含不存在的共享表》的 问题 2：函数视图反序列化失败 小节的解决方法移走权限与函数视图文件以跳过反序列化。

请打包权限和函数视图文件、日志里报错的函数视图脚本和节点运行日志，联系 DolphinDB 技术支持排查问题。

节点启动后，需要重新添加所有权限和函数视图定义。

4.1.9 RAFT 文件损坏

注意下面介绍的操作需要确保已经有另一个节点成为 RAFT 集群 leader 才可以进行。DolphinDB 写 RAFT 元数据和日志时，如果上次运行时出现磁盘满、宕机或 bug，可能导致 RAFT 元数据或日志文件损坏，可能导致控制节点启动时恢复 RAFT 数据失败抛出异常而启动失败。例如查看节点运行日志有如下报错：

2023-10-13 09:59:35.786438  :[Raft] incomplete hardstate file [/data/server/data/controllerl/raft/raftHardstatel]
2023-10-13 09:59:35.786438  :[Raft] Group DFSMaster RaftWAL::reconstruct: read new file with 83213 entries 
2023-10-13 09:59:35.786438  :[Raft] Group DFSMaster RawNode::init: failed to initialize with exception [basic_string::_S_create].
2023-10-13 09:59:35.786438  :Failed to start DFSMaster with the error message: basic_string::_S_create

此时如果希望尽快启动节点，可以移走问题节点的 dfsMetaDir 配置项文件夹和 //raft 文件夹以跳过启动时的 DFS 和 RAFT 元数据初始化，再启动节点。

请打包 dfsMetaDir 配置项文件夹、 //raft 文件夹和节点运行日志，联系 DolphinDB 技术支持排查问题。

节点启动后，会自动同步 leader 节点的元数据。

4.2 启动异常卡住

4.2.1 集群间网络不通

在多台机器上部署 DolphinDB 时，需要确保集群间各个节点的IP:端口号互通，否则会导致节点启动失败。常见原因和现象是调整了机器网络配置后重启高可用集群，进入控制节点 web 管理界面白屏，查看控制节点日志中有如下报错：

2023-11-01 16:00:34.992500  :New connection from ip = 192.168.0.44 port = 35416
2023-11-01 16:00:35.459220  :DomainSiteSocketPool::closeConnection: Close connection to ctl1 #44 with error: epoll-thread: Read/Write failed. Connection timed out. siteIndex 0, withinSiteIndex 44

或在 web 启动数据节点时报错 IO error type 1（含义为 Socket is disconnected/closed or file is closed，即网络连接断开）。

需要联系运维调通网络。

4.2.2 RSA 密钥校验文件损坏

DolphinDB 生成 RSA 密钥校验文件时，如果上次运行时出现磁盘满、宕机或 bug，可能导致 RSA 密钥校验文件损坏，使节点无法正常通过 RSA 密钥来通信，进而导致启动流程卡住。查看节点运行日志有如下报错：

2023-10-25 11:55:04.987161  :Failed to decrypt the message by RSA public key.

解决方案是删除所有控制节点的 //keys 目录并重启集群，以触发 RSA 密钥校验文件重新生成。注意删除 keys 文件夹后需要重新提交集群的所有定时任务。

4.3 启动慢

4.3.1 正在回滚事务，如何查看进度，如何删除事务 log 以跳过

DolphinDB 启动时，如果日志里有 Will process pending transactions. 而没有ChunkMgmt initialization completed. 说明正在回滚事务。如果节点宕机时的写入事务涉及的分区过多或数据量过大，可能导致事务回滚时间较长。

查看回滚进度的方法：

查看 /LOG 目录下以 tid 命名的文件夹数目是否减少，这里只能根据文件夹减少速度估计回滚速度；
若关机前有删除事务，查看 /LOG 目录下以 tid 命名的文件夹数目是否减少，文件夹数目为 0 时回滚完毕。

统计文件数目可以使用 linux 命令： ll -hrt /LOG | wc -l

强烈建议等待事务回滚完成，跳过事务回滚会使原本应该回滚的事务不回滚，会导致事务相关的数据或元数据错误。若客户希望尽快启动节点且不需要保证节点宕机前正在写入的数据完整性，可以通过如下步骤跳过事务回滚：

使用 kill -15 pid 安全关闭节点，若正在启动时无法关闭则使用 kill -9 强制关闭节点，因为正在启动所以不会有新的写入；
mv 移走 /LOG 和 /LOG 文件夹；
启动节点，观察是否正常启动，启动后检查重启前正在写入的数据完整性，是否要补数据等。

4.3.2 正在回放 redo log，如何查看进度，如何删除 redo log 以跳过

DolphinDB 启动时，如果日志里有 Start recovering from redo log. This may take a few minutes. 而没有Completed CacheEngine GC and RedoLog GC after applying all redo logs and engine is ，说明正在回放 redo log。期间会刷带 “RedoLog” 的日志例如：

"applyTidRedoLog : 20716,f7dbaef9-05bc-10b6-f042-a14bc0e9c897,/home/DolphinDB/server/clusterDemo/data/node2/storage/CHUNKS/snapshotDB/20220803/Key17/5o7,shfe_5,166259,107,0"

注意如果是 DolphinDB 2.0 版本，会有两次 redo log 回放，对应 OLAP 和 TSDB 存储引擎，故对应的日志也有两份；如果是 DolphinDB 1.0 版本，只会有一次 OLAP 存储引擎的 redo log 回放。

查看回放进度的方法：

统计和下的 tid.log 文件数目，为 0 时回放完毕；
统计和文件夹大小，除以硬盘的读速率，可估计最快的回放完成时间。

统计文件夹大小可以使用 linux 命令：du -sh

强烈建议等待 redo log 回放完成，跳过 redo log 回放会使原本应该回放的事务不回放，会导致事务相关的数据或元数据错误。若客户希望尽快启动节点且不需要保证节点宕机前正在写入的数据完整性，可以通过如下步骤跳过 redo log 回放：

使用 kill -15 pid 安全关闭节点，若正在启动时无法关闭则使用 kill -9 强制关闭节点，因为正在启动所以不会有新的写入；
mv 移走和文件夹下的 head.log 文件；
启动节点，观察是否正常启动，启动后检查重启前正在写入的数据完整性，是否要补数据等。

4.4 其他问题

4.4.1 启动脚本运行慢或失败

启动脚本 startup.dos 运行慢会导致启动流程走不到初始化定时任务一步，但由于节点在 redo log 回放完成后即在 web 集群管理界面转变状态为绿色，已经可以访问，故会导致定时任务相关功能在 startup.dos 执行完前无法使用。

启动脚本 startup.dos 或 postStart.dos 运行失败会在节点运行日志里打印错误日志，然后跳过启动脚本报错行后的执行，不会导致节点启动失败，也不会回滚执行失败的动作，需要客户自行考虑启动脚本运行失败的情况。注意在集群模式下，执行启动脚本时无法保证分布式数据库已初始化完毕，在启动脚本访问分布式库表可能会报错。

故不建议在启动脚本执行太慢的操作或涉及分布式库表的操作，而只做一些比较简单的操作如建共享表、加载插件等。启动脚本详细介绍见《启动脚本》。

可以参考如下脚本在 startup.dos 或 postStart.dos 等待分布式模块准备完毕：

def isClusterOk() {
    do {
        try {
            meta = rpc(getControllerAlias(), getClusterChunksStatus)
            configReplicaCount = 2 // 需要修改为 dfsReplicationFactor 配置项值

            cnt1 = exec count(*) from meta where state != "COMPLETE"
            cnt2 = exec count(*) from meta where replicaCount != configReplicaCount
  
            if (cnt1 == 0 and cnt2 == 0) {
                break
            } else {
                writeLog("startup isClusterOk: state != 'COMPLETE' cnt: " + string(cnt1) + ", " + "replicaCount != " + string(configReplicaCount) + " cnt: " + string(cnt2))
            }
        } catch (err) {
            writeLog("startup isClusterOk: " + err)
        }

        sleep(3*1000)
    } while(1)

    return true
}

res = isClusterOk()
writeLog("startup isClusterOk: ", string(res))

5. 新旧版本日志对照表

2.00.11 及以后	新版备注	2.00.11 以前	旧版备注
Initializing AclManager with Raft	RAFT mode 为 enabled 或 disabled	AclManager start to initialize with raftmode is	RAFT mode 为 0 或 1
Initialization of AclManager is completed with Raft	RAFT mode 为 enabled 或 disabled	AclManager::init successfully with raftmode is	RAFT mode 为 0 或 1
Controller initialization completed.		DFS master is ready.
ChunkMgmt initialization completed.		ChunkMgmt initiated successfully.
Restore TSDB meta successfuly.		Restore iot meta successfuly.
No available redo log files were found. Redo log replay was skipped.		No need to recover from redo log.
Job scheduler start to initialize.		Job schedule start to initialize.
Job scheduler initialization completed.		Job schedule initialized successfully.

6. 总结

本文介绍了 DolphinDB 整体的启动流程和重要模块的启动流程，并分析了启动时常见问题的现象、原因和解决方案。了解 DolphinDB 的启动流程与常见问题，有助于维护 DolphinDB 的稳定运行。遇到启动问题时，DolphinDB 运维人员可以参照本文处理一些常见问题，使 DolphinDB 尽快正常运行。

你可能感兴趣的:(时序数据库使用教程,时序数据库,数据库,运维开发,运维管理,DolphinDB)

Android图书借阅系统完整App开发教程(源码+数据库)
本文还有配套的精品资源，点击获取简介：本教程深入介绍了基于Android平台的图书借阅系统App开发过程，涵盖了从UI设计、网络通信到数据库操作的全面实践。项目包含源码和数据库文件，让学生能够通过实际案例学习并掌握Android应用开发的核心技术。本App具有预约借书、书籍评论、图书推荐和逾期提醒等功能，要求开发者熟悉Java语言和Android系统，以及实现后端逻辑和数据存储。此项目是一个宝贵的
Python Django 数据库索引优化 Python编程之道 python django 数据库 ai
PythonDjango数据库索引优化关键词：DjangoORM、数据库索引、查询优化、性能调优、PostgreSQL、MySQL、执行计划摘要：本文深入探讨Django框架中的数据库索引优化策略。我们将从数据库索引的基本原理出发，详细分析DjangoORM如何生成SQL查询，以及如何通过合理的索引设计提升查询性能。文章包含索引类型选择、复合索引优化、Django模型字段索引配置、查询集优化技巧等
github jekyll+chirpy主题搭建博客 handsomestWei 后端 github Jekyll Chirpy GitHub Pages 博客建站
githubjekyll+chirpy主题搭建博客标签：后端、blog、jekyll全文链接本文简要介绍了如何基于GitHubPages、Jekyll及Chirpy主题搭建个人博客的流程和注意事项。主要内容GitHubPages站点简介可免费搭建个人博客，支持自定义域名，适合静态网站部署。Jekyll简介Jekyll是一个静态博客生成工具，无需数据库，适合部署在GitHub上。提供了相关文档和教程
Django `transaction.atomic()` 完整使用指南言之。 python django 数据库 python
目录#概述#基本用法#事务一致性保障机制#破坏一致性的常见场景#高级用法#最佳实践#诊断与调试#附录概述transaction.atomic()是Django提供的数据库事务管理工具，用于确保一系列数据库操作要么全部成功提交，要么全部回滚，维护数据的一致性。基本用法1.作为上下文管理器fromdjango.dbimporttransactiondefview_func(request):witht
MySQL-SQL优化Explain命令以及参数详解只吹45°风 MySQL mysql sql 优化 explain
前言在MySQL优化的众多手段中，EXPLAIN命令扮演着至关重要的角色。它是数据库管理员和开发者手中的利器，用于分析SQL查询的执行计划。通过执行EXPLAIN，MySQL会提供一份详细的查询执行计划报告，这份报告揭示了查询将如何执行，包括数据访问路径、表的连接顺序、使用的索引、预期扫描的行数等关键信息。这些信息对于识别和解决性能瓶颈至关重要。基于EXPLAIN提供的洞察，我们可以采取措施，如优
PostgreSQL数据库集群如何进行自动化性能监测？ TechVision大咖圈数据库 postgresql 自动化性能监测
前言：在这个数据爆炸的时代，PostgreSQL数据库集群就像是我们的"数据宝库"。但是，再好的宝库也需要有专业的"保安"来守护。今天我们就来聊聊如何给PostgreSQL集群配备一套智能的"保安系统"——自动化性能监测。文章目录一、为什么需要自动化监测？二、核心监测指标解析三、监测工具选型指南四、监测架构设计五、实施方案详解六、告警策略配置七、最佳实践总结八、常见问题解答一、为什么需要自动化监测
阿里云RDS MySQL物理备份文件恢复到自建数据库
官方文档RDSMySQL物理备份用XtraBackup恢复到自建数据库_云数据库RDS(RDS)-阿里云帮助中心通过Percona官方仓库来安装最新版本的xtrabackup：（如果没安装）#添加Percona仓库sudoyuminstallhttps://repo.percona.com/yum/percona-release-latest.noarch.rpmsudopercona-relea
如何优雅解决缓存与数据库的数据一致性问题？亲爱的非洲野猪缓存 kafka 分布式 java lock
在高并发系统中，缓存是提升性能的“利器”，但随之而来的“缓存与数据库数据不一致”问题，却常常让开发者头疼。比如用户刚更新了资料，刷新页面却还是旧数据；或者订单状态明明已支付，缓存却显示未付款——这类问题不仅影响用户体验，严重时甚至会引发业务故障。今天就来聊聊如何从“更新策略”“异常处理”“实战方案”三个维度，搭建一套可靠的缓存一致性管控体系。一、核心更新策略：根据业务选对“姿势”缓存与数据库的同步
系统架构设计师教程第二章计算机系统基础知识-2.9 系统性能 AncleLeen 软考-系统架构设计师-学习路线系统架构软考-系统架构师
系统架构设计师教程第二章计算机系统基础知识-2.9系统性能2.9.1.性能指标2.9.1.1计算机的性能指标2.9.1.2路由器的性能指标（了解即可）2.9.1.3交换机的性能指标（了解即可）2.9.1.4网络的性能指标2.9.1.5操作系统的性能指标2.9.1.6数据库管理系统的性能指标2.9.1.7Web服务器的性能指标2.9.2.性能计算2.9.3.性能设计2.9.3.1性能调整2.9.3.
mysql.createPool(db)_nodejs解决mysql和连接池(pool)自动断开问题会咕咕咕的小夫爷
最近在做一个个人项目，数据库尝试使用了mongodb、sqlite和mysql。分享一下关于mysql的连接池用法。项目部署于appfog，项目中我使用连接池链接数据库，本地测试一切正常。上线以后，经过几次请求两个数据接口总是报503。一直不明就里，今天经过一番排查终于顺利解决了。1.mysql链接普通模式varmysql=require('mysql'),env={host:'localhost
揭开SQL Server和PostgreSQL填充因子的神秘面纱 Alex-Hua postgresql oracle 数据库
揭开SQLServer和PostgreSQL填充因子的神秘面纱理解SQLServer和PostgreSQL中的填充因子在调优数据库性能时，一些小设置往往能带来显著的差异。填充因子就是其中一个经常讨论的设置。SQLServer和PostgreSQL都支持这一概念，但它们的处理方式有所不同。如果你在管理这两种系统中的数据库，了解填充因子的工作原理可以帮助你避免因索引页拆分、索引碎片以及不必要的磁盘I/
python连接数据库的方法,Python 连接数据库的多种方法 AI MIU python连接数据库的方法
JZGKCHINAPython是一种计算机程序设计语言，它是一种动态的、面向对象的脚本语言。它是一种跨平台的，可以运行在Windows，Mac和Linux/Unix系统上。在日常使用中需要对大量数据进行数据分析，那么就必然用到数据库，我们常用的数据库有SQLServer,MySQL,Oracle,DB2,SQLite，Hive，PostgreSQL,MongoDB还有其他常用的MicrosoftA
25数据库三级备考自整理笔记
备考策略：博主是边做题边学习知识点的，从每个章节->每套真题的流程，知识点清晰详细，喜欢的请点个关注和收藏，祝大家考试顺利，必过必过必过！一、数据库应用系统开发方法1.数据库的三级模式：外模式、模式、内模式。外->是数据库用户（包括应用程序员和最终用户看见和使用的局部数据的逻辑结构和特征的描述，是数据库用户的视图，是某一应用有关的数据的逻辑表示；外模式是模式的子集，一个数据库可以有多个外模式）；（
python 连接数据库小鱼拉灯 mysql 数据库 python
一.连接MYSQL1.下载PyMySql模块2.在MYSQL中创建数据库并连接importpymysqlconn=pymysql.connect(host='localhost',user='root',password='123456',database='ikun',charset='utf8',port=3306)3.创建表importpymysqlconn=pymysql.connect(
Prometheus监控-第1天我为你走过-YOYO prometheus
7.1基于Prometheus的全方位监控平台一、打造基于Prometheus的全方位监控平台1.1、前言官网地址：https://prometheus.io/docs/prometheus/latest/getting_started/灵活的时间序列数据库；定制各式各样的监控规则；Prometheus的开发人员和用户社区非常活跃；独立的开源项目，不依赖于任何公司；继Kurberntes之后第二个
【开源项目】实测 Google 开源的 AI MCP 数据库网关：10行代码隔离风险，连接池自动复用
1.引言这两天试了谷歌新开的MCPToolboxforDatabases，它用不到10行代码就能让AI助手（比如LangChain智能体）安全地操作数据库。作为一个常年和数据库连接池、凭证泄露搏斗的开发者，这东西确实解决了我的痛点——把数据库访问抽象成“工具”，通过集中管控的MCPServer隔离风险，还自带性能优化。下面分享实测体验和避坑指南。2.正文2.1核心逻辑：为什么需要MCP？传统AI代
jxORM--整体说明 jxandrew jxWebUI 数据库 python ORM
系列文章目录：jxORMI–编程指南jxORM是配套jxWebUI使用的数据库操作库。使用说明jxORM的使用非常简单，主要包括几个步骤：1、导入依赖fromjxORMimportjxORMLogger,ORM,DBDataType,ColType,jxDB2、设置数据库连接#用默认设置，设置本地的mysql数据库连接jxDB.set('testDB',password='password')目前
零基础入门数据库，万字超详细Sql server期末复习 Heyqings sql
前言本篇主要讲述的是关系型数据库SqlServer，原因也很简单，因为大部分学校还在以sqlserver为教学材料，不过没关系无论是sqlserver、mysql还是oracle,只要是关系型数据库，概念都是相通的，语句也大差不差。关系型数据库是一种采用关系模型来组织数据的数据库系统。它将数据存储在表格形式的结构中，通常称为表。这些表由行和列组成，每一行代表一条记录，每一列代表一个字段。关系型数据
EXPLAIN 解码：MySQL 索引优化的黄金决策术渡难繁辰数据库 mysql sql mysql 数据库 sql
引言在MySQL数据库中，索引是优化查询性能的核心工具。但盲目添加索引会导致写性能下降和存储浪费，而缺少关键索引又会引发全表扫描的灾难。如何科学决策？答案在于深入分析查询执行计划——EXPLAIN。本文将聚焦如何通过EXPLAIN诊断查询瓶颈，精准制定索引策略。一、EXPLAIN的核心字段解读EXPLAIN输出结果中的关键字段揭示了查询的执行逻辑，以下为需重点关注的列：1.type列：查询访问数据
SQL Server和PostgreSQL填充因子 meslog 技术分享 postgresql oracle 数据库
理解SQLServer和PostgreSQL中的填充因子在调优数据库性能时，一些小设置往往能带来显著的差异。填充因子就是其中一个经常讨论的设置。SQLServer和PostgreSQL都支持这一概念，但它们的处理方式有所不同。如果你在管理这两种系统中的数据库，了解填充因子的工作原理可以帮助你避免因索引页拆分、索引碎片以及不必要的磁盘I/O带来的头疼问题。填充因子的概念让我们先从一个比喻开始。假设你
Docker Compose 坚定的小辣鸡在努力 docker 容器运维
DockerCompose阅读原文https://www.xiaozaoshu.top/articles/docker/compose一、什么是DockerCompose？DockerCompose是一个用于定义和运行多个Docker容器的工具。你只需用一个docker-compose.yml文件，描述好服务的配置，然后一条命令就可以启动整个系统。适用场景：需要运行多个服务（如Web服务+数据库+
通过docker部署的MySQL数据库初始化方式 GIS从业者资料数据库 docker mysql
背景安装好MySQL容器后，有时需执行MySQL命令创建项目初始表才能使用。手动创建不太便捷，可将相关SQL命令保存为.sql文件（如init.sql）。在docker-compose.yml中配置MySQL容器时，借助volumes把该脚本挂载到MySQL容器的初始化目录（/docker-entrypoint-initdb.d/），以此完成自动创建，这样会方便许多。步骤1、创建SQL初始化文件在
服务器与工控机的区别解析 D-海漠其他
服务器和工控机虽然都是计算机，但它们的设计目标、使用环境和核心特性有本质的区别，就像轿车和越野车虽然都是车，但用途和构造截然不同。以下是它们的主要区别：核心设计目标：服务器：数据处理、存储、网络服务和应用托管。核心目标是高性能、高吞吐量、高可靠性、可扩展性和高可用性（通常通过集群、冗余实现）。它需要处理海量并发请求（如网页服务、数据库查询、文件共享、虚拟化等）。工控机：工业环境中的过程控制、数据采
讲讲MyBatis中二级缓存的缺点？ java1234_小锋 java java 开发语言
大家好，我是锋哥。今天分享关于【讲讲MyBatis中二级缓存的缺点？】面试题。希望对大家有帮助；讲讲MyBatis中二级缓存的缺点？超硬核AI学习资料，现在永久免费了！MyBatis的二级缓存是指在SqlSessionFactory级别上共享缓存的机制。虽然二级缓存能够有效地提高性能，减少数据库的访问次数，但它也有一些缺点和需要注意的地方：一致性问题：二级缓存中的数据通常是不可直接控制的，尤其是当
能说说MyBatis的工作原理吗？ java1234_小锋 java java 开发语言
大家好，我是锋哥。今天分享关于【能说说MyBatis的工作原理吗？】面试题。希望对大家有帮助；能说说MyBatis的工作原理吗？超硬核AI学习资料，现在永久免费了！MyBatis是一个用于简化数据库操作的持久层框架，它通过SQL映射技术，将Java对象和数据库之间的关系映射起来。MyBatis的工作原理可以从以下几个方面来解析：1.配置文件的加载MyBatis通过加载配置文件来初始化框架。配置文件
Java List 集合详解：从基础到实战，掌握 Java 列表操作全貌大葱白菜 java合集 java 开发语言后端学习个人开发
作为一名Java开发工程师，你一定在项目中频繁使用过List集合。它是Java集合框架中最常用、最灵活的数据结构之一。无论是从数据库查询出的数据，还是前端传递的参数列表，List都是处理这些数据的首选结构。本文将带你全面掌握：List接口的核心方法与特性常见实现类（如ArrayList、LinkedList、Vector、CopyOnWriteArrayList）List的遍历、增删改查、排序、线
Python特性：装饰器解决数据库长时间断连问题超龄超能程序猿数据库 python
前言在基于Python的Web应用开发里，数据库连接是极为关键的一环。不过，像网络波动、数据库服务器维护这类因素，都可能造成数据库长时间断连，进而影响应用的正常运作。本文将详细介绍怎样运用retry_on_failure装饰器来解决数据库长时间断连的难题一问题背景在实际开发场景中，应用和数据库之间的连接可能会由于各种缘由中断（长时间系统无人访问，再次访问，数据库连接超时）。当应用尝试执行数据库操作
MySQL主从模式的数据一致性 mysia
MySQL单机的数据一致性MySQL作为一个可插拔的数据库系统，支持插件式的存储引擎，在设计上分为Server层和StorageEngine层。在Server层，MySQL以events的形式记录数据库各种操作的Binlog二进制日志，其基本核心作用有：复制和备份。除此之外，我们结合多样化的业务场景需求，基于Binlog的特性构建了强大的MySQL生态，如：DTS、单元化、异构系统之间实时同步等等
Java实习模拟面试之创玖科技：前后端交互、数据库、Spring全家桶、性能优化与Linux实战培风图南以星河揽胜 java面试 java 面试科技
关键词：JavaScript、JQuery、Ajax、Node.js、MySQL、Oracle、Spring、SpringMVC、SpringBoot、MyBatis、Tomcat、Redis、Nginx、Linux、Git、SAAS系统开发一、面试开场：自我介绍面试官提问：请做个自我介绍，重点突出你的技术栈和项目经验。候选人回答：您好，我是一名计算机科学与技术专业的应届生，具备扎实的Java基础
【Java-多线程】什么是幂等性？
以下是关于幂等性的详细解析：一、幂等性定义幂等性（Idempotence）是指同一操作多次执行所产生的影响与一次执行的效果相同。就像数学中的乘法运算：1×1×1=1，无论乘多少次结果都不变。二、生活化案例外卖订单场景：用户点击"支付"按钮时网络抖动支付系统收到两次相同支付请求如果接口没有幂等性：可能扣除双倍金额具备幂等性的系统：即使收到多次请求，只扣款一次三、技术实现方案1.数据库唯一约束CREA
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分