禹鼎侯

ckman：非常好用的ClickHouse可视化集群运维工具

概述

什么是ckman

ckman，全称是ClickHouse Management Console，即ClickHouse管理平台。它是由擎创科技数据库团队主导研发的一款用来管理和监控ClickHouse集群的可视化运维工具。目前该工具已在github上开源，开源地址为：github.com/housepower/ckman。

为什么要有ckman

我们不妨思考一下这样的场景：如果要部署一个ClickHouse集群，需要怎么做？

首先，我们需要在所有ClickHouse节点上安装ClickHouse的rpm包，然后，需要修改配置文件，包括但不限于config.xml、users.xml、metrika.xml。注意，是所有节点上都要修改，修改完成后需要依次启动各个节点。

当集群规模不大，这些操作手动去完成可能不觉得有什么，但是如果集群规模比较大，单个集群的节点达到了上百台甚至上千台，这时候要手工去每台机器上去操作，显然变得不太现实。

如果需要往集群增加一个节点呢？

我们需要在已有的节点上的metrika.xml配置文件中加上该节点，然后在新增节点上安装rpm包，修改metrika.xml，启动ClickHouse服务，最后还要同步其他节点上的schema表结构，至此才能完成。

删除节点亦如是。

如果要升级集群呢？我们不仅需要在每个节点上重新安装升级rpm包，还需要考虑一些其他的问题：需不需要停服务？如果升级失败了怎么办？

总之，ClickHouse的集群运维，如果靠人工去做，不仅繁琐，容易出现各种问题，当集群规模变大后，也变得不切实际。

这时候，ckman的出现，就可以完美解决上述的问题。ckman将这些运维操作都集成在管理界面中，用户只需要在web界面上通过简单的信息配置，点击鼠标，就可以完成所有的配置工作，而无需关注其他细节，也减少了出错的可能。

ckman能做什么

ckman主要的功能是管理和监控ClickHouse集群。因此，它的操作对象只能是ClickHouse集群，而不是单个ClickHouse节点。

管理ClickHouse集群

部署ClickHouse集群
导入ClickHouse集群
升级ClickHouse集群
增加或删除集群节点
对集群（或节点）进行启停
实现数据再均衡
存储策略配置
用户权限配额控制
集群配置文件最佳实践及定制化能力
简单SQL查询能力

监控ClickHouse集群

监控ClickHouse Query
监控节点系统性能指标（CPU，Memory， IO等）
监控Zookeeper相关指标
监控集群分布式表相关指标
监控副本状态相关指标
监控慢SQL等相关指标

如何部署ckman

见ckman部署文档。

如何使用源码编译ckman

编译依赖

由于ckman使用golang实现，因此需要提前安装go(请使用>=1.17版本)；

如果需要编译成rpm包或deb包，需要安装nfpm:

wget -q https://github.com/goreleaser/nfpm/releases/download/v2.15.1/nfpm_2.15.1_Linux_x86_64.tar.gz 
tar -xzvf nfpm_2.15.1_Linux_x86_64.tar.gz 
cp nfpm /usr/local/bin

编译前端需要安装yarn。在CentOS 7上安装yarn: (参考How to Install Yarn on CentOS 7 | Linuxize)

$ curl --silent --location https://dl.yarnpkg.com/rpm/yarn.repo | sudo tee /etc/yum.repos.d/yarn.repo
$ sudo rpm --import https://dl.yarnpkg.com/rpm/pubkey.gpg
$ sudo yum install yarn
$ yarn --version

在其他平台上安装yarn，请参考yarn官方文档。

编译命令

tar.gz包编译

make package VERSION=x.x.x

以上命令会编译成打包成一个tar.gz安装包，该安装包解压即可用。

VERSION是指定的版本号，如果不指定，则默认取git describe --tags --dirty的结果作为版本号。

rpm包编译

make rpm VERSION=x.x.x

docker编译

鉴于编译环境的诸多依赖，配置起来可能比较麻烦，因此也提供了docker编译的方式，直接运行下面的命令即可：

make docker-build VERSION=x.x.x

如果想利用docker编译rpm版本，可以先进入docker环境，再编译：

make docker-sh
make rpm VERSION=x.x.x

前端单独编译

为了减少编译上的麻烦，ckman代码已经将前端代码编译好，做成静态链接放在static/dist目录下，但是仍然将前端代码以submodule的形式嵌入在frontend目录下，如果想要自己编译前端，在提前安装好前端编译依赖后，可以使用如下命令：

cd frontend
yarn
cd ..
make frontend

架构设计

配置文件

server

ip
- 服务端的ip地址，如果不指定，取默认路由的ip
port
- ckman的监听端口
- 默认为8808
https
- 是否监听https
- 默
- 认为false
certfile
- https的证书文件路径，如果开启了https，必须要有证书文件
- 默认使用conf下的server.crt
- 注意证书文件的路径ckman需要有访问权限
keyfile
- https的key文件路径，如果开启了https，必须要有key文件
- 默认使用conf下的server.key
- 注意key文件的路径ckman需要有访问权限
pprof
- 是否支持pprof监控
- 默认为true
session_timeout
- 会话超时时间，如果超过该时间没有对ckman进行任何操作，则token失效，需要重新登录
- 默认超时时间为3600秒
public_key
- 用来接入ckman的公钥
- ckman可通过RSA配置公钥的方式跳过token鉴权，只需要在客户端对header配置userToken，并对userToken使用私钥加密，然后在ckman服务端使用该公钥进行解密即可。
swagger_enable
- 是否开启swagger文档
- 默认不开启
task_interval
- 执行异步运维动作的扫描时间间隔
- 前端请求部署、升级、销毁以及增删节点等比较耗时的操作时，ckman先记录状态，然后使用另外的协程异步扫描处理，异步扫描的时间间隔通过该参数可配，默认为5秒
persistant_policy
- 持久化策略，主要用来存储集群的配置信息，包括集群配置、逻辑集群映射关系、查询语句历史记录、运维操作状态等。
- 持久化策略支持local、mysql和postgres
  - local：存储到本地，在conf目录下生成一个clusters.json文件，不支持集群，为默认配置
  - mysql：持久化到mysql，支持ckman集群，支持HA，需要提前创建数据库，数据库编码为UTF-8，不需要创建表，ckman会自动创建数据库表
  - postgres：持久化到postgres，支持ckman集群，支持HA，需要提前创建数据库，并且需要提前创建数据库表。建表语句内置在dbscript/postgres.sql中。
  - dm8: 持久化到达梦数据库，支持ckman集群，支持HA，需要提前创建用户，不需要自动创建表
  - 除local策略外，其他持久化策略都依赖persistent_config中的配置项，当然local也可以配置该项。

clickhouse

clickhouse连接池相关设置。

max_open_conns:
- 每个ck节点最大可以打开的连接数
max_idle_conns:
- 每隔ck节点最大的空闲连接数
conn_max_idle_time:
- 每个ck连接最大空闲时间

log

level
- 日志打印级别
- 默认为INFO
- 支持 DEBUG、INFO、WARN、ERROR、PANIC、FATAL
max_count
- 滚动日志数量
- 默认为5个
max_age
- 日志生命有效期
- 默认为10天

cron

enabled：
- 是否开启定时任务
sync_logic_schema
- 同步逻辑表的schema 定时任务，默认为1分钟一次。
watch_cluster_status
- 针对tgz集群，监控节点状态，如果有节点非正常挂掉，自动拉起，默认3分钟一次
sync_dist_schema
- 同步集群内物理表的schema，默认10分钟一次

persistent_config

mysql & postgres & dm8

mysql和postgres配置项基本一致，主要涉及以下配置项：

host
- 连接数据库的ip地址
port
- 连接数据库的端口号，如mysql默认为3306，postgres默认为5432
user
- 连接数据库的用户
password
- 连接数据库的密码，可选择是否加密，如果需要加密，可使用下面命令获得密码的密文。
```
ckman --encrypt 123456 
E310E892E56801CED9ED98AA177F18E6
```
- 如果数据库密码选择加密，请使用ENC()将密文包含起来，如：
```
password: ENC(E310E892E56801CED9ED98AA177F18E6)
```
database
- 需要连接的数据库，需提前创建，并且保证编码为UTF-8

local

format
- 本地文件格式，支持JSON和yaml，默认为json
config_dir
- 本地文件的目录，需要填写路径，默认为ckman工作路径的conf目录下
config_file
- 本地文件的文件名，默认为clusters

nacos

enabled
- 是否开启nacos
- 默认为不开启
hosts
- nacos服务的ip地址
- 可以配置多组
port
- nacos服务的端口
user_name
- 登录nacos的用户名
password
- 登录nacos的密码，加密规则同持久化策略数据库密码，同样，如果需要加密，需要以ENC()将密文包含起来。
namespace
- 指定nacos的namespace，默认为DEFAULT
group
- 向nacos注册的服务所在的组
- 默认为DEFAULT_GROUP
data_id
- 向nacos注册服务名称、数据项名称
- 默认为ckman

示例如下：

// ckman config file
// All password can be encrypt by ENC(xxxxxxxxx),
// you can get encrypt password by using: ./ckman --encrypt 123456 to get password like: E310E892E56801CED9ED98AA177F18E6
// If password not including by ENC(), that means it's a plaintext.
// hjson(https://hjson.github.io/)  is easy for humans to read and write.
 
{
  "server":{
    "port": 8808,
    "https": false,
    //certfile:
    //keyfile:
    "pprof": true,
    "session_timeout": 3600,
    //support local, mysql, postgres
    "persistent_policy": "local",
    "task_interval": 5
    //public_key:
  },

  "log":{
    "level": "INFO",
    "max_count": 5,
    // megabyte
    "max_size": 10,
    // day
    "max_age": 10
  },

  // clickhouse connect pool options
  "clickhouse":{
    //sets the maximum number of open connections to the database
    "max_open_conns": 10,
    //sets the maximum number of connections in the idle
    "max_idle_conns": 2,
    //sets the maximum amount of time a connection may be idle.
    "conn_max_idle_time": 10
  },

  // cron job task
  "cron":{
    "sync_logic_schema": "0 * * * * ?",
    "watch_cluster_status": "0 */3 * * * ?",
    "sync_dist_schema": "30 */10 * * * ?"
  },

  //"persistent_config":{ 
  //  // if peristent_policy is mysql, must config this
  //  "mysql":{
  //    "host": "127.0.0.1",
  //    "port": 3306,
  //    "user": "root",
  //    // you can use ./ckman --encrypt 123456 to get password like: E310E892E56801CED9ED98AA177F18E6
  //    "password": "ENC(E310E892E56801CED9ED98AA177F18E6)",
  //    // database must be created before start ckman
  //    "database": "ckman_db"
  //  },
  //  "local":{
  //    "format": "json"
  //    "config_dir": "/etc/ckman/conf"
  //    "config_file": "clusters"
  //  }
  //},

  "nacos":{
    "enabled": false,
    "hosts":[
      "127.0.0.1"
    ],
    "port": 8848,
    "user_name": "nacos",
    // you can use './ckman --encrypt nacos' to get password like: A7561228101CB07938FAFF00C4444546
    "password": "ENC(A7561228101CB07938FAFF00C4444546)"
    //namespace:
  }
}

功能介绍

集群管理

部署集群

点击主页的 Create a ClickHouse Cluster，就会进入创建集群的界面：

需要填写的项主要有以下：

Cluster Name：集群的名字，注意不要和ckman已有的名字重合

Package Type: 安装包类型，用来区分平台和架构，不需要自己填写，上传安装包后可通过下拉框选择。

如果选择的平台和架构不正确，如在arm的机器上部署x86的安装包，则不会成功。

ClickHouse Version: ck的版本，不需要自己填写，通过下拉列表选择，下拉列表中会列出ckman服务器中所有的安装包版本。

此处版本信息只会列出当前ckman服务下的安装包版本，如果配置了多中心，其他ckman的安装包是无法看见的

在部署集群之前，需要先上传安装包。部署的集群版本是基于上传安装包的版本的。

Logic Name：逻辑集群名字，可以指定，也可以不指定

TCP Port: clickhouse的TCP端口，默认是9000，当然也可以自己指定

ClickHouse Node List: clickhouse节点列表，支持简写

对于clickhouse节点机器，推荐配置如下：

所有HDD做一个大的RAID 5阵列

用hostnamectl设置hostname

用timedatectl set-timezone设置timezone

启动ntpd或者chrony网络时间同步

永久关闭swap

永久关闭防火墙firewalld

安装tmux, mosh, emacs-nox等常用软件

创建一个普通账户并加入wheel组，允许其sudo切换（是否输入密码均可）到超级用户
Replica：是否开启副本，默认是关闭

如果开启了副本，默认是1个shard2个副本，如果节点是奇数，则最后一个 shard为1个副本。

如果要增加节点的副本数，可通过增加节点完成，创建集群时最多只能指定2个副本

如果没有开启副本，则有几个节点就有几个shard

注意：集群是否支持副本在部署集群时就已经决定了，后续不可更改

Zookeeper Node List: zk列表

ckman并没有提供zookeeper集群搭建的功能，因此在部署集群之前，需要将zookeeper集群搭建好。

ZooKeeper Port: zk端口，默认是2181

ZK Status Port: zookeeper指标监控的端口，默认8080

该功能是zookeeper v3.5.0以上版本开始支持的，如果zk版本太旧，无法从界面看到zk的指标

Data path: ck节点数据存放的路径

Cluster Username: ck的用户名

注意：default用户作为保留用户，此处不能填default。

Cluster Password: ck的密码

SSH Username: ssh登录ck节点的用户名

该用户必须具有root权限或是sudo权限，可以是普通用户，只需要该普通用户具有sudo权限即可。

AuthenticateType: 认证方式

支持三种认证方式：0-密码认证(保存密码)， 1-密码认证(不保存密码) ，2-公钥认证

默认方式为公钥认证，公钥认证需要配置免密登录，并将证书(.ssh/id_rsa)拷贝到ckman的工作目录的conf下（rpm安装位置为/etc/ckman/conf），同时需要保证ckman与用户对id_rsa有可读权限。

如果认证方式为密码认证（不保存密码），则后续运维操作如增删节点、启停集群以及升级等，都需要手动输入密码

SSH Password: ssh登录ck节点的密码

SSH Port: ssh端口，默认是22

Storage: 存储策略

disks

支持local，hdfs，s3三种磁盘，clickhouse内置了名为default的磁盘策略

注意hdfs只有在ck版本大于21.9时才支持。

policies

策略的磁盘必须要在上述disks中存在。

User Config：用户配置

Users：配置用户的名字，密码，以及使用什么profile和quota策略

Profiles：配置信息，规定了资源使用以及是否只读等权限策略

Quotas: 配额配置，该配置项规定了一段时间内查询、插入等使用的资源配置

User Custom Config: 用户自定义配置，规则同下面的Custom Config，不过该项自定义配置最终生成在users.xml中。
Custom Config:自定义配置项
自定义配置项最终生成在config.d/custom.xml中，在clickhouse启动时会与默认的config.xml进行merge，形成最终的config.xml配置文件
自定义配置项提供一个空的key-value模板，key的写法尽量靠近xpath语法标准（请参阅：https://www.w3schools.com/xml/xpath_syntax.asp），不同`xml`层级之间以`/`分隔，attr属性以[]包裹，每个属性的key以 @开头，举例如下：

key填写内容： title[@lang='en', @size=4]/header

value填写内容：header123

则生成的xml样式如下：
 
    <header>header123</header> 

除此之外，还有一个强制覆盖的选项。如果待部署的主机上已经有clickhouse服务正在运行了（可能是其他的集群的其中一个节点，但不受当前的ckman纳管），正常情况下是不允许部署的。如果勾选了强制覆盖，则会强制销毁该节点上已有的clickhouse服务，重新覆盖部署。

通过此种方式安装部署成功的集群的mode就是deploy，可以对其进行删、改、rebalance、启停、升级以及节点的增删等操作。

导入集群

点击主页的 Import a ClickHouse Cluster按钮，会进去导入集群界面。

需要填写的信息如下所示：

Cluster Name: 节点名称，该名称必须是确实存在的集群名，且不能与ckman中已有的集群名字重复。

ClickHouse Node IP: clickhouse节点ip列表，以逗号分隔

ClickHouse TCP Port: ck节点TCP端口，默认为9000

Zookeeper Node List: zk节点列表

ZooKeeper Port: zk端口，默认为2181

ZK Status Port: zookeeper指标监控的端口，默认8080

Cluster Username: ck的用户名

Cluster Password: ck的密码，非必输

导入集群有个前提是该集群必须确实存在，否则导入会出现问题。

导入的集群的mode为import，这种模式的集群不能进行修改、rebalance、启停、升级以及节点的增删等操作，但是可以删除和查看。

升级集群

如果上传了新版本的安装包，可以从Upgrade Cluster下拉列表中选择新版本，点击Upgrade即可进行升级。

目前支持全量升级和滚动升级两种策略。并让用户选择是否检查相同版本。

升级界面如下：

销毁集群

集群销毁后，该集群在物理上都不存在了。因为销毁集群动作不止会停止掉当前集群，还会将节点上的ClickHouse卸载，相关目录清空，所以该动作应该慎重操作。

增加节点

点击Manage页面的Add Node按钮以增加节点。

增加节点需要填写：

New Node IP: 新节点的IP，可以一次性增加多个节点，这些节点将会位于同一个shard上。

Node Shard: 节点的Shard NUmber。

如果填写的shard是已经存在的，那么增加的节点会作为已存在shard的一个副本；如果shard不存在（一般是最大的shard编号+1，如果不是就不正确了），就会新增加一个shard。

如果集群不支持副本模式，则每个shard只能有一个节点，不可以给已有shard添加副本节点，如果集群支持副本模式，则可以在任意shard增加节点。

同部署集群，增加节点时也有一个强制覆盖的选项，即：如果待添加的节点上已经有clickhouse服务正在运行了，则不允许部署，当勾选了覆盖安装选项后，会强制销毁已有服务，重新部署。

删除节点

删除节点时需要注意的是：删除节点并不会销毁该节点，只会停止该节点的clickhouse服务，并从clusters.json中删除掉。

删除节点时，如果某个shard有且只有一个节点，那么这个节点一般是不可以被删除的，除非该节点处于shard编号的最大位置。

如果被删除的节点上仍然存在数据，且该节点被删除后会造成整个shard的缩容，则存在数据丢失的风险，这种情况下默认不允许删除，可通过数据均衡功能先将该shard的数据迁移到其他shard上，然后再进行删除。

如果该shard的数据本身就不打算要了，也可以通过勾选强制删除选项，主动丢弃这部分数据，完成节点的删除。

监控管理

ckman提供了ClickHouse相关的一些指标监控项。这些监控项依赖于从prometheus中获取数据，因此，需要提前配置好prometheus。相关配置教程见ckman部署文档。

从v2.3.5版本以后，ckman支持http service discovery功能，只需要在promethues中配置好对应的url，即可自动发现需要监控的节点。配置方法如下：

- job_name: "ckman" 
	http_sd_configs: 
		- url: http://192.168.0.1:8808/discovery/node?cluster=abc 
		- url: http://192.168.0.1:8808/discovery/zookeeper?cluster=test2 
		- url: http://192.168.0.1:8808/discovery/clickhouse

node会⾃动发现node_exporter相关的指标配置，默认端⼝为9100
zookeeper会⾃动发现zookeeper相关的指标配置，默认端⼝为7000
clickhouse会⾃动发现clickhouse 相关的指标配置，默认端⼝为9363

如果url不带参数，则默认发现该ckman管理的所有集群，如果通过cluster指定集群名，则只⾃动

发现该集群相关的指标服务。

ClickHouse Database KPIs

指标	说明
`clickhouse.Query`	针对`Clickhouse`集群的分布式表发起的查询，按照发起时刻的分布图

ClickHouse Node KPIs

指标	说明
`cpu usage`	`CPU`占用情况
`memory usage`	内存占用情况
`disk usage`	硬盘占用情况
`IOPS`	`IO`指标

ZooKeeper KPIs

指标	说明
`znode_count`	`znode`数
`leader_uptime`	`leader`存活时间
`stale_sessions_expired`	过期的会话
`jvm_gc_collection_seconds_count`	`jvm` `gc`的次数
`jvm_gc_collection_seconds_sum`	`jvm` `gc`花费的时间

表&会话管理

Table Metrics

统计表的一些指标。除system数据库的表之外，其他数据库的表都会显示在下面。

指标包括：

Table Name

表名

Columns

列数

Rows

行数

Partitions

当前所有未合并的分区数

Parts Count

分区数

Disk Space(uncompress)

使用磁盘（未压缩）

Disk Space(compress)

使用磁盘（压缩），该大小是最终数据落盘的占用空间

RWStatus

读写状态， TRUE代表可读写，FALSE代表不可读写

Completed Queries in last 24h

过去24小时成功的SQL条数

Failed Queries in last 24h

过去24小时失败的SQL条数

Queries cost(0.5, 0.99, max) in last 7days(ms)

过去7天SQL花费的时间。

Queries Cost有三个值：

0.5：过去7天50% SQL的平均耗时

0.99：过去7天99% SQL的平均耗时

max：过去7天 SQL最大耗时

Table Replication Status

统计复制表的一些状态。

此处会统计每个shard下每张表的各副本之间的统计量。

理论上每个shard内副本之间各表的统计都应该相等的，如果有不相等，就说明有节点落后了，这时候落后的节点会标黄。如果某个副本上所有的表都落后，说明这个副本可能出问题了。

Zookeeper Status

zookeeper的相关指标查看。zookeeper监控使用的是zookeeper-3.5.0版本新增的特性，通过暴露的8080端口监控mntr指标信息，因此，如果想要看到zookeeper的监控指标，需要保证当前使用的zookeeper版本大于等于3.5.0。

可查看的指标包括：版本，主从状态，平均延迟，近似数据总和大小，znode数等。

Open Sessions

显示当前正在进行的会话，如果有正在执行的SQL，可通过界面将其kill掉。

Slow Sessions

显示7天内最慢的10条SQL语句。

包含SQL的执行时间、SQL耗时、SQL语句、ck用户、query id、查询的IP以及线程号。

Query管理

ckman还提供了简单的clickhouse查询的页面。通过该页面可以查询集群中的数据。

注意：

该工具只能查询，不能进行mutation的相关操作。

该工具主要针对分布式表，本地表也能查，但是如果本地表在集群的其他节点不存在，就会报错。即使表在所有节点都存在，查询出来的数据也是某个节点的数据，因此每次查询出来的数据可能不一致。

默认情况下，sql随机挑选一个节点执行，因此返回的结果依赖于该节点的本地查询情况，如果查询的是本地表，则结果可能是不一致的。可以通过右上角的下拉框指定执行sql的节点。

配置管理

通过集群配置管理页面，可以修改集群的配置，注意对存储策略的配置的修改，如果已有的存储介质上已有数据，则该存储介质不可删除。

ckman会根据修改的集群配置的具体内容来决定集群是否需要重启。

接口规范

[POST]/api/login

ckman登录接口，输入用户名和密码，返回一个token。该token用户http鉴权，当用户对ckman不作任何操作超过1小时(超时时间可通过配置文件配置)，该token会失效，此时访问任何页面都会重新跳转到登录页面。

username

用户名，默认是ckman
password
密码，ckman接收到的密码是前端通过hash之后的密码，默认hash之前是Ckman123456!, 该密码可以通过ckmanpassword工具进行修改。
修改登录密码步骤：
注意： Ckman123456!是默认的密码，该密码可以通过ckmanpassword工具进行修改。修改方式和ckman的安装方式有关：
如果是tar.gz解压安装，则需要进入到bin目录下，在该目录下执行：
./ckmanpassword
如果是通过rpm方式安装，则需要cd到/etc/ckman/conf目录下，执行:
cd /etc/ckman/conf
ckmanpassword
执行完成后，在conf目录下会生成一个新的password文件，覆盖掉原来的password，这样就可以使用新的密码登录了。

请求参数示例：

{
  "password": "63cb91a2ceb9d4f7c8b1ba5e50046f52",
  "username": "ckman"
}

返回示例：

{
    "retCode":"0000",
    "retMsg":"ok",
    "entity":{
        "username":"ckman",
        "token":"eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9"
    }
}

[PUT]/api/logout

退出ckman登录状态的接口，无需任何参数，无任何返回数据。

调用该接口后，退出登录，跳转回登录状态，同时原来的token失效。

[POST]/api/v1/ck/archive/{clusterName}

归档指定表的一定时间段的数据。

begin

指定时间段的开始时间，该时间要小于结束时间

database

指定数据库的名字

end

指定时间段的结束时间，该时间要大于开始时间

注意时间段是包含开始时间，不包含结束时间

maxfilesize

每个文件的最大大小，如果超过该大小，会被切割成另外的文件

默认每个文件大小为1G

如果文件过大，则在备份时需要耗费更大的内存，如果系统内存不大，或者配置的clickhouse可使用的内存比较小，则容易造成备份失败

tables

需要导入的表名，该参数是一个数组，可以配置多个

format

备份格式。支持ORC、CSV、Parquet三种格式的备份

target

备份的目标

支持以下三种备份：

hdfs：备份到hdfs

local：备份到本地

s3：备份到s3

hdfs:

当target为hdfs时有效

addr

HDFS的地址

dir

HDFS的目录，如果该目录不存在会报错

导入到HDFS的最终路径为: hdfs://addr/dir/shard_%d_host/cluster/database.table/archive_table_slotbegin/data.suffix

user

登录HDFS的用户名

local

当target为local时有效

path

每个节点的本地路径，该路径不能与ck的原始数据路径重合

最终存储的路径为： path/shard_%d_host/cluster/database.table/archive_table_slotbegin/data.suffix

s3

当target为s3时生效

Endpoint

连接s3使用的端点地址

AccessKeyID

连接s3使用的访问key，需要提前创建好

SecretAccessKey

连接s3使用的访问秘钥，需要提前创建好

Region

s3的region，需要提前制定好

Bucket

数据存放的bucket，如果不存在则自动创建

Compression

压缩格式，支持none, gzip/gz, brotli/br, xz/LZMA, zstd/zst

gzip压缩格式对比none，压缩率高达80倍左右

gzip压缩存入s3，磁盘占用比之存储ck，压缩率达到2倍左右

如果不配置压缩格式，默认使用gzip

最终存储的路径为： bucket/shard_%d_host/cluster/database.table/archive_table_slotbegin/data.suffix.compression

请求参数示例：

{
	"begin": "2023-01-01",
	"database": "default",
	"end": "2023-01-11",
	"format": "ORC",
	"hdfs": {
		"addr": "sea.hub:8020",
		"dir": "/ckman",
		"user": "hdfs"
	},
	"local": {
		"Path": "/data/backup/"
	},
	"maxfilesize": 1000000000,
	"s3": {
		"AccessKeyID": "KZOqVTra982w51MK",
		"Bucket": "ckman.backup",
		"Compression": "gzip",
		"Endpoint": "http://192.168.0.1:9000",
		"Region": "zh-west-1",
		"SecretAccessKey": "7Zsdaywu7i5C2AyvLkbupSyVlIzP8qJ0"
	},
	"tables": [
		"tb_result_offline"
	],
	"target": "hdfs"
}

[GET]/api/v1/ck/cluster

获取集群列表。

返回给前端的集群信息中，凡是涉及到密码的都进行了脱敏，显示的全是星号。

[POST] /api/v1/ck/cluster

导入一个集群。

该接口可以导入一个已经存在的ClickHouse集群。

cluster

集群名称，该集群需要在ClickHouse中已经存在，不可乱填

hosts

节点列表，导入集群是通过该节点查询system.clusters获取集群的相关信息，所以该节点实际上可以只填一个

如果填写多个节点，会从节点中随机选取一个去连接数据库查询相关信息

port

ClickHouse的TCP端口，默认是9000

user

连接ClickHouse集群的用户名

password

连接ClickHouse集群的密码，该密码不能为空

zkNodes

ClickHouse集群依赖的zookeeper集群，该集群也要提前存在

zkPort

zookeeper端口，默认是2181

zkStatusPort

监控zookeeper指标的端口，默认是8080，3.5.0以上版本支持

请求参数示例：

{
  "cluster": "test",
  "hosts": [
    "192.168.0.1",
    "192.168.0.2",
     "192.168.0.3",
     "192.168.0.4"
  ],
  "password": "123456",
  "port": 9000,
  "user": "ck",
  "zkNodes": [
    "192.168.0.1",
    "192.168.0.2",
    "192.168.0.3"
  ],
  "zkPort": 2181,
  "zkStatusPort": 8080
}

[GET]/api/v1/ck/cluster/{clusterName}

获取指定集群的配置信息。

返回示例：

{
	"retCode": "0000",
	"retMsg": "ok",
	"entity": {
		"mode": "deploy",
		"hosts": ["192.168.0.1", "192.168.0.2"],
		"port": 9000,
		"httpPort": 8123,
		"user": "ck",
		"password": "********",
		"cluster": "test",
		"zkNodes": ["192.168.0.1", "192.168.0.2", "192.168.0.3"],
		"zkPort": 2181,
		"zkStatusPort": 8080,
		"isReplica": false,
		"version": "21.3.9.83",
		"sshUser": "root",
		"sshPassword": "********",
		"sshPasswdFlag": 0,
		"sshPort": 22,
		"shards": [{
			"replicas": [{
				"ip": "192.168.0.1",
				"hostname": "node1"
			}]
		}, {
			"replicas": [{
				"ip": "192.168.0.2",
				"hostname": "node2"
			}]
		}],
		"path": "/data01",
		"zooPath": null,
		"logic_cluster": "logic_eoi"
	}
}

[DELETE]/api/v1/ck/cluster/{clusterName}

删除一个集群。

注意：此处的删除集群只是从ckman的纳管列表中将集群移除，该集群物理上仍然存在，并不会实际销毁集群。

该操作导入的集群和部署的集群均可操作。

[PUT]/api/v1/ck/destory/{clusterName}

销毁一个集群。

该操作只有使用ckman部署的集群才能操作。与删除集群不同，该操作会将集群彻底销毁，卸载掉集群所有节点的rpm或deb包。

[POST]/api/v1//ck/dist_logic_table/{clusterName}

为逻辑集群创建分布式表。

由于逻辑集群自身的限制，无法直接通过创建常规分布式表的方式创建出跨逻辑集群的分布式表，该接口主要用来创建跨逻辑集群查询的分布式表。

database

数据库名

table_name

需要创建的表名称

需要注意的是该表指的是本地表，需要在逻辑集群纳管的所有物理集群中都存在。

dist_name

分布式表名

本地表名和分布式表名只需指定一个即可

请求参数示例：

{
  "database": "default",
  "table_name": "test_table"
}

[DELETE]/api/v1/ck/dist_logic_table/{clusterName}

删除逻辑集群的逻辑表。接口参数同创建逻辑表。

[GET]/api/v1/ck/get/{clusterName}

获取集群状态。

返回示例：

{
	"retCode": "0000",
	"retMsg": "ok",
	"entity": {
		"status": "red",
		"version": "20.8.9.6",
		"nodes": [{
			"ip": "192.168.0.1",
			"hostname": "node1",
			"status": "green",
			"shardNumber": 1,
			"replicaNumber": 1,
			"disk": "2.21TB/13.64TB"
		}, {
			"ip": "192.168.0.2",
			"hostname": "node2",
			"status": "green",
			"shardNumber": 1,
			"replicaNumber": 2,
			"disk": "2.06TB/13.64TB"
		}, {
			"ip": "192.168.0.3",
			"hostname": "node3",
			"status": "red",
			"shardNumber": 2,
			"replicaNumber": 1,
			"disk": "NA/NA"
		}, {
			"ip": "192.168.0.4",
			"hostname": "node4",
			"status": "red",
			"shardNumber": 2,
			"replicaNumber": 2,
			"disk": "NA/NA"
		}, {
			"ip": "192.168.0.5",
			"hostname": "node5",
			"status": "green",
			"shardNumber": 3,
			"replicaNumber": 1,
			"disk": "2.87TB/19.02TB"
		}],
		"mode": "deploy",
		"needPassword": false
	}
}

[PUT]/api/v1/ck/node/start/{clusterName}

只有当节点状态是red的时候才可以调用。

[PUT]/api/v1/ck/node/stop/{clusterName}

只有当节点状态是green时才可以调用。

[POST]/api/v1/node/{clusterName}

增加节点。

ips

需要增加节点的ip列表

可以增加多个，支持CIDR和Range简写

shard

分片编号

如果集群为非副本模式，只能在最后添加（也就是只能增加新的分片，无法为已有分片添加副本）

如果集群为副本模式，可以填写已有分片编号或新分片编号

如果填写已有分片编号，则为已有分片添加一个副本

如果填写新的分片编号，则新增一个分片

新增分片编号只能填写当前最大分片编号+1

请求参数示例：

{
    "ips":[
        "192.168.0.5",
        "192.168.0.6"
    ],
    "shard": 3
}

[DELETE]/api/v1/node/{clusterName}

删除节点。

删除节点时需要注意：

当集群为非副本模式，只能删除最后一个节点，无法删除中间的节点
当集群为副本模式，可以删除任意分片的节点。但是如果该分片有且仅有一个节点，除非它是最后一个分片，否则不允许删除
总之，如果删除节点会导致某个分片被删除，则该节点只能是最后一个，否则不允许删除

当点击Manage页面节点列表的删除按钮时，该接口会被调用。

[GET]/api/v1/ck/open_sessions/{clusterName}

获取正在运行的SQL语句。

[POST]/api/v1/ck/ping/{clusterName}

探测集群节点可用性。

原则是只要每个shard有一个节点可用，那么该集群就属于可用状态。

[POST]/api/v1/ck/purge_tables/{clusterName}

删除指定时间段范围的历史数据。

begin

指定时间段的开始时间，该时间要小于结束时间

database

指定数据库的名字

end

指定时间段的结束时间，该时间要大于开始时间

注意时间段是包含开始时间，不包含结束时间

tables

需要导入的表名，该参数是一个数组，可以配置多个

请求参数示例：

{
  "begin": "2021-01-01",
  "database": "default",
  "end": "2021-04-01",
  "tables": [
    "t1",
    "t2",
    "t3"
  ]
}

[GET]/api/v1/ck/query/{clusterName}

简单的查询SQL接口。

该接口只支持分布式表的查询，且数据量不宜太大。

如果查询的表是本地表，如果该表在所有节点都存在，那么查询不会报错，但是查询的结果只会显示其中某一个节点上的数据。

[PUT]/api/v1/ck/rebalance/{clusterName}

数据再均衡。

数据再均衡提供了两种模式：按partition做rebalance，和按shardingkey做rebalance。

在请求参数中，用户可以填写需要均衡的表名和shardingkey，表名支持正则表达式写法，如果shardingkey不填，则默认按照partition做rebalance。

另外有一个可选的all选项，当all为true时，则会自动均衡所有的分布式表，如果all为false，则仅均衡请求中传过来的表。默认为true。

按partition做rebalance

需要注意，如果集群为非副本模式，是通过rsync直接进行分区数据的迁移的，因此，需要机器提前安装好rsync工具，且需要保证clickhouse各节点之间配置ssh互信。如果部署时使用的是普通用户，则需要配置/etc/sudoers文件里该用户为NOPASSWD。

为了保证数据均衡时不影响数据写入，最新的partition不参与数据的均衡。因此，分区粒度越细，均衡效果越好。

按shardingkey做rebalance

shardingkey支持字符串、日期、数值等类型，如果是字符串，则使用xxHash该key，计算出一个数值，除以shard数目，余数为几，就落到哪个分区，如果是数值类型，也是一样，直接拿这个数值除以shard数目取余数。

ckman会将计算出来的数据插入到对应分片的一个本地临时表内，然后清空正式表，再将临时表数据物理搬运过去。因此，在搬运期间如果失败，可能造成正式表数据丢失，但是临时表数据是全的，所以需要手动将临时表数据迁移回正式表。

另外，数据均衡时提供了一个选项，是否清空最后一个shard的数据，如果打开此开关，则会将最后一个分片的所有数据均衡地迁移到剩余的shard种，使最后一个分片处于没有数据的状态，方便无丢失数据地进行缩容。

[GET]/api/v1/ck/slow_sessions/{clusterName}

获取慢SQL查询。

该接口提供了三个参数，分别为start、end、limit。

start

开始时间，可通过时间选择器选择，默认是7天前

end

结束时间，可通过时间选择器选择，默认是当前时间

limit

查询条数，默认是10条

调用示例：

/api/v1/ck/slow_sessions/abc?limit=10&start=1626665021&end=1627269821

[PUT]/api/v1/ck/start/{clusterName}

启动集群。

如果集群内的节点本身就是green状态，则该节点不会被启动。如果所有节点都是start状态，则Start Cluster按钮是灰色的，不能点击。

[PUT]/api/v1/ck/stop/{clusterName}

停止集群。

如果集群内的节点本身就是red状态，则该节点不会被启动。如果所有节点都是red状态，则Stop Cluster按钮是灰色的，不能点击。

[GET]/api/v1/ck/table/{clusterName}

获取表的描述信息。

该接口的对象为本地表，且该本地表需要在集群的各个节点上都存在。

调用示例：

/api/v1/ck/table/test?tableName=tbtest&database=default

返回示例：

{
    "retCode": "0000",
    "retMsg": "ok",
    "entity": [
        {
            "name": "service",
            "type": "String",
            "defaultType": "",
            "defaultExpression": "",
            "comment": "",
            "codecExpression": "",
            "ttlExpression": ""
        },
        {
            "name": "ip",
            "type": "String",
            "defaultType": "",
            "defaultExpression": "",
            "comment": "",
            "codecExpression": "",
            "ttlExpression": ""
        },
        {
            "name": "metric",
            "type": "String",
            "defaultType": "",
            "defaultExpression": "",
            "comment": "",
            "codecExpression": "",
            "ttlExpression": ""
        },
        {
            "name": "value",
            "type": "Int64",
            "defaultType": "",
            "defaultExpression": "",
            "comment": "",
            "codecExpression": "",
            "ttlExpression": ""
        },
        {
            "name": "timestamp",
            "type": "DateTime",
            "defaultType": "",
            "defaultExpression": "",
            "comment": "",
            "codecExpression": "",
            "ttlExpression": ""
        }
    ]
}

[PUT]/api/v1/ck/table/{clusterName}

更新表。使用ALTER语句完成分布式表的更新。

支持的操作包括增加列、修改列、删除列。

修改完成后需要删除分布式表并重建。

name

表名

database

数据库名

add

要添加的字段，包含以下属性

name

字段名

type

字段类型

after

字段位置

modify

要修改的字段，包含以下属性

name

字段名

type

字段类型

drop

需要删除的字段，可以是多个

请求参数示例：

{
	"name":"t1",
    "database":"default",    
    "add":[{
    	"name":"fieldNew",	
        "type":"String",
        "after":"field3"
	},
	{
    	"name":"filedLast",	
        "type":"Int32"
	}],
    "modify":[{
        "name":"field6",	
        "type":"DateTime"
    }],
    "drop": ["field8", "field9"]	
}

[POST]/api/v1/ck/table/{clusterName}

创建表。默认使用的是MergeTree引擎，如果指定了distinct为false，表示支持去重，使用的引擎为ReplacingMergeTree。

最终的引擎还要根据集群是否支持副本来决定，一共有以下几种情况：

distinct	isReplica	engine
`true`	`true`	`ReplicatedReplacingMergeTree`
`true`	`false`	`ReplacingMergeTree`
`false`	`true`	`ReplicatedMergeTree`
`false`	`false`	`MergeTree`

与此同时，还需要在集群里创建一张dist_开头的分布式表。

name

表名

database

数据库名

fields

字段名称，可以是多个字段，包含以下属性：

name

字段名

type

字段类型

order

order by的字段，可以是多个

partition

partition by的字段，支持以下三种策略

policy

分区策略， 0- 按天 1-按周 2-按月"

name

分区字段

distinct

是否支持去重

请求参数示例：

{
	"name": "t1",		
    "database": "default",  
    "fields":[{			
        "name":"id",
        "type":"Int32"
    },{
        "name":"birth",
        "type":"Date"
    },{
        "name":"name",
        "type":"String"
    }],
    "order": ["id"],	
    "partition": "partition by的字段",
    "partition":{
        "policy": 0,
        "name": "birth"
    },
    "distinct": true
}

[DELETE]/api/v1/ck/table/{clusterName}

操作和描述表类似，通过tableName指定表名，database指定数据库名。

调用示例：

/api/v1/ck/table/test?tableName=t1&database=default

通过以上操作就能删除掉表t1。删除时先删dist_开头的分布式表，再删表t1。

注意：表必须在集群的各个节点存在且不能是dist_开头的分布式表。如果该本地表虽然在集群中各节点存在，但没有根据该本地表创建过分布式表，删除依然会报错。这一点需要注意。

[GET]/api/v1/ck/table_metric/{clusterName}

获取集群内表的相关指标。

[GET]/api/v1/ck/table_schema/{clusterName}

获取指定表的建表语句。该接口是v2.0.0新增接口。

[PUT]/api/v1/ck/upgrade/{clusterName}

升级集群。

packageVersion

版本号

policy

升级策略，支持全量升级和滚动升级，默认为全量升级。

Full-全量升级， Rolling-滚动升级

skip

是否跳过相同版本

实时查询各节点的版本号，如过数据库无法连接，则强制升级

[GET]/api/v1/config

获取ckman配置。

[PUT]/api/v1/config

修改ckman配置。

[POST]/api/v1/deploy/ck

部署集群。

clickhouse

ckTcpPort

ClickHouse绑定的TCP端口，默认为9000

clusterName

集群名，不可与已有集群名重复

isReplica

是否支持副本，部署时一旦指定，后续不可更改

logic_cluster

逻辑集群名称，非必输

packageVersion

ClickHouse版本

password

连接ClickHouse的密码，不可为空

path

ClickHouse数据路径

shards：分片

replicas：副本

ip：副本内的ip，可以有多个

user

连接ClickHouse的用户名，不可为default

zkNodes

ClickHouse集群依赖的zookeeper集群

zkPort

zookeeper集群的端口，默认为2181

zkStatusPort

监控zookeeper的端口，默认为8080

hosts

集群列表

password

ssh连接节点的密码

savePassword

是否保存ssh密码

sshPort

连接ssh的端口，默认为22

usePubkey

是否使用公钥连接

user

ssh连接节点的用户，该用户需要有root权限或sudo权限

请求调用示例：

{
  "clickhouse": {
    "ckTcpPort": 9000,
    "clusterName": "test",
    "isReplica": true,
    "logic_cluster": "logic_test",
    "packageVersion": "20.8.5.45",
    "password": "123456",
    "path": "/data01/",
    "shards": [
      {
        "replicas": [
          {
            "ip": "192.168.0.1"
          },{
             "ip":"192.168.0.2"
          }
        ]
      }, {
         "replicas": [
          {
            "ip": "192.168.0.3"
          },{
             "ip":"192.168.0.4"
          }
        ]  
      }
    ],
    "user": "ck",
    "zkNodes": [
      "192.168.0.1",
      "192.168.0.2",
      "192.168.0.3"
    ],
    "zkPort": 2181,
    "zkStatusPort": 8080
  },
  "hosts": [
    "192.168.0.1",
    "192.168.0.2",
    "192.168.0.3",
    "192.168.0.4"
  ],
  "password": "123456",
  "savePassword": true,
  "sshPort": 22,
  "usePubkey": false,
  "user": "root"
}

[GET]/api/v1/metric/query/{clusterName}

从prometheus获取单点指标数据。

[GET]/api/v1/metric/query_range/{clusterName}

从prometheus获取某一个范围的指标数据。

[GET]/api/v1/package

获取ClickHouse的rpm安装包列表。

返回示例：

{
  "retCode": "0000",
  "retMsg": "ok",
  "entity": [
    {
      "version": "22.3.3.44",
      "pkgType": "aarch64.rpm",
      "pkgName": "clickhouse-common-static-22.3.3.44-2.aarch64.rpm"
    },
    {
      "version": "22.3.6.5",
      "pkgType": "amd64.tgz",
      "pkgName": "clickhouse-common-static-22.3.6.5-amd64.tgz"
    },
    {
      "version": "22.3.3.44",
      "pkgType": "x86_64.rpm",
      "pkgName": "clickhouse-common-static-22.3.3.44.x86_64.rpm"
    },
    {
      "version": "21.9.5.16",
      "pkgType": "x86_64.rpm",
      "pkgName": "clickhouse-common-static-21.9.5.16-2.x86_64.rpm"
    },
    {
      "version": "21.8.15.7",
      "pkgType": "x86_64.rpm",
      "pkgName": "clickhouse-common-static-21.8.15.7-2.x86_64.rpm"
    },
    {
      "version": "21.8.13.6",
      "pkgType": "x86_64.rpm",
      "pkgName": "clickhouse-common-static-21.8.13.6-2.x86_64.rpm"
    },
    {
      "version": "21.8.9.13",
      "pkgType": "x86_64.rpm",
      "pkgName": "clickhouse-common-static-21.8.9.13-2.x86_64.rpm"
    }
  ]
}

[POST]/api/v1/package

上传ClickHouse的安装包。

注意安装包上传时需要三个安装包都上传（server、client、common）。上传成功后，会显示在安装包列表中。

注意：如果上传的安装包有缺失（比如少了common），安装包仍然能上传成功，但不会显示在列表上。所有上传成功的安装包都会保存在ckman工作目录的package/clickhouse目录下。

[DELETE]/api/v1/package

删除ClickHouse安装包。

[GET]/api/v1/version

获取ckman的版本信息。

[GET]/api/v1/zk/replicated_table/{clusterName}

获取复制表状态。统计复制表的一些状态。

[GET]/api/v1/status/{clusterName}

zookeeper的相关指标查看。

RoadMap

监控集成grafna
支持只读用户
云原生适配
clickhouse-keeper支持

本专栏知识点是通过<零声教育>的系统学习，进行梳理总结写下文章，对C/C++课程感兴趣的读者，可以点击链接，查看详细的服务：C/C++Linux服务器开发/高级架构师

Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
[特殊字符] 实时数据洪流突围战：Flink+Paimon实现毫秒级分析的架构革命（附压测报告）——日均百亿级数据处理成本降低60%的工业级方案 Lucas55555555 flink 大数据
引言：流批一体的时代拐点据阿里云2025白皮书显示，实时数据处理需求年增速达240%，但传统Lambda架构资源消耗占比超运维成本的70%。某电商平台借助Flink+Paimon重构实时数仓后，端到端延迟从分钟级压缩至800ms，计算资源节省5.6万核/月。技术红利窗口期：2025年ApachePaimon1.0正式发布，支持秒级快照与湖仓一体，成为替代Iceberg的新范式一、痛点深挖：实时数仓
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
什么是OA系统？使用OA系统对企业有哪些好处？
OA系统（OfficeAutomationSystem），即办公自动化系统，是将现代化办公和计算机网络功能结合起来的一种新型的办公方式。是现代企业管理中一种重要的信息化工具，它通过计算机技术、网络技术和数据库技术等手段，实现企业内部办公流程的自动化和信息化管理。使企业的信息交流更加顺畅，办公流程更加高效，从而提高企业的运营效率和管理水平。一、主要功能1.文档管理文档存储与检索：OA系统可以集中存储
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Flutter——数据库Drift开发详细教程(七) 怀君 flutter flutter 数据库
目录入门设置漂移文件入门变量数组定义表支持的列类型漂移特有的功能导入嵌套结果LIST子查询Dart互操作SQL中的Dart组件类型转换器现有的行类Dart文档注释结果类名称支持的语句自定义SQL类型定义类型使用自定义类型在Dart中在SQL中方言意识支持的SQLite扩展json1fts5地缘垄断自定义查询带有生成的api的语句自定义选择语句自定义更新语句入门Drift提供了一个dart_api来
android中百度定位、城市选择列表，右侧字母展示
好久好久没光顾过自己空空的博客了，做项目的时候都是逛着别人的博客急着把功能实现，近来闲下来了总结总结。这个城市选择功能也是当时做项目急着实现从哪找来的框架不记得了，然后改改用到项目中来的。非常感谢提供最初源码的博主，主要的区别是添加了搜索功能、定位功能，把以前的操作本地数据库sqlite的部分，改为操作对assest文件的操作，封装的有百度地图定位方法、可删除的edittext。百度地图的key需
Flutter——数据库Drift开发详细教程之迁移(九) 怀君 flutter flutter 数据库
迁移入门引导式迁移配置用法例子切换到make-migrations开发过程中手动迁移迁移后回调导出模式导出架构下一步是什么？调试导出架构的问题修复这个问题架构迁移助手自定义分步迁移转向逐步迁移手动生成测试迁移编写测试验证数据完整性在运行时验证数据库模式迁移器API一般提示迁移视图、触发器和索引复杂的迁移更改列的类型更改列约束删除列重命名列合并列添加新列入门Drift通过严格的架构确保查询类型安全。
【运维实战】解决 K8s 节点无法拉取 pause:3.6 镜像导致 API Server 启动失败的问题 gs80140 各种问题运维 kubernetes 容器
目录【运维实战】解决K8s节点无法拉取pause:3.6镜像导致APIServer启动失败的问题问题分析✅解决方案：替代拉取方式导入pause镜像Step1.从私有仓库拉取pause镜像Step2.重新打tag为Kubernetes默认命名Step3.导出镜像为tar包Step4.拷贝镜像到目标节点Step5.在目标节点导入镜像到containerd的k8s.io命名空间Step6.验证镜像是否导
《Python星球日记》第35天：全栈开发（综合项目） Code_流苏 Python星球日记编程项目实战 Python全栈开发 Django Flask 后端开发博客系统
名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）专栏：《Python星球日记》，限时特价订阅中ing目录一、全栈开发概述1.全栈开发的优势2.全栈开发技能组合二、博客系统项目需求分析1.功能需求2.技术栈选择3.项目结构规划三、数据库设计1.实体关系分析2.Django模型设计四、后端开发1.Django项目创建2.视图
Spring 声明式事务：从原理到实现的完整解析 Code季风 Spring详解 spring 数据库后端开发语言 java spring boot
在后端开发中，事务管理是保证数据一致性的核心机制。尤其是在复杂业务场景下，一个操作可能涉及多步数据库操作，任何一步失败都需要回滚到初始状态。Spring的声明式事务通过AOP思想，将事务管理从业务逻辑中剥离，让开发者更专注于核心业务。本文将结合实际实现，详解声明式事务的核心机制和设计思路。一、为什么需要声明式事务？在讨论实现之前，我们先明确一个问题：为什么要用声明式事务，而不是手动编写事务代码？假
【Android】安卓四大组件之内容提供者（ContentProvider）：从基础到进阶 m0_59734531 Android android Java ContentProvider 安卓四大组件
你手机里的通讯录，存储了所有联系人的信息。如果你想把这些联系人信息分享给其他App，就可以通过ContentProvider来实现。。一、什么是ContentProvider‌ContentProvider‌是Android四大组件之一，负责实现‌跨应用程序的数据共享与访问‌，通过统一接口封装数据存储细节，提供标准化操作方式。其中主要功能包括：数据抽象层：将应用内部的数据（如SQLite数据库、文
400多个免费在线编程与计算机科学课程 zhufafa 基础理论课程理论计算机基础免费
来源：medium作者：DhawalShah五年前，麻省理工学院和斯坦福大学等学校首先向公众开放免费的在线课程。如今，全球有700多所学校创造了数以千计的免费在线课程。从入门到精通系列，是作者通过ClassCentral的课程数据库整理的400多个免费在线课程的简介和链接（来源于ClassCentral，一个在线课程搜索引擎），根据课程难度分为入门、进阶和高阶三大类，每门课程还有星级评分（统计自C
AnythingLLM教程系列之 12 AnythingLLM 上的 Ollama 与 MySQL+PostgreSQL 知识大胖 NVIDIA GPU和大语言模型开发教程 mysql postgresql 数据库 anythingllm ollama
简介一款全栈应用程序，可让您将任何文档、资源或内容转换为上下文，任何LLM都可以在聊天期间将其用作参考。此应用程序允许您选择要使用的LLM或矢量数据库，并支持多用户管理和权限。本文将介绍如何在AnythingLLM上将Ollama与MySQL+PostgreSQL连接起来。系列文章如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI应用程序，可以执行RAG、A
AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 anythingllm llm
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志，以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型（教程含安装步骤）知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 ai anythinllm llama
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
Java实习模拟面试之安徽九德 —— 面向对象编程、Spring框架与数据库技术详解培风图南以星河揽胜 java面试 java 面试 spring
关键词：Java实习生、模拟面试、安徽九德、SpringBoot、MySQL、Redis、面向对象编程、团队协作一、前言作为一名计算机相关专业的学生，想要顺利进入一家互联网公司或软件开发企业实习，技术面试是必须面对的一道门槛。本文将带你走进一场真实的Java实习生模拟面试场景，以“安徽九德”公司为背景，围绕其发布的招聘岗位要求，进行一次全方位的技术面试演练。本次模拟面试涵盖以下核心知识点：Java
为什么你的服务器总被攻击？运维老兵的深度分析
作为运维人员，最头疼的莫过于服务器在毫无征兆的情况下变得异常缓慢、服务中断，甚至数据泄露。事后查看日志，常常发现一些“莫名其妙”的攻击痕迹。为什么服务器会成为攻击者的目标？这些攻击又是如何悄无声息发生的？今天，我们就从实战角度分析几种常见且容易被忽视的攻击模式，并教你如何通过日志分析初步定位问题。一、服务器被攻击的常见“莫名其妙”原因“扫楼式”探测与弱口令爆破：现象：服务器CPU、内存无明显异常，
如何在Windows系统下使用Dockerfile构建Docker镜像：完整指南 996蹲坑 windows docker 容器
前言Docker作为当前最流行的容器化技术，已经成为开发、测试和运维的必备工具。本文将详细介绍在Windows系统下使用Dockerfile构建Docker镜像的完整流程，包括两种镜像构建方式的对比、Dockerfile核心指令详解、实战案例演示以及Windows系统下的特殊注意事项。一、Docker镜像构建的两种方式1.容器转为镜像（不推荐）这种方式适合临时保存容器状态，但不适合生产环境使用：#
Spring Boot基础小李是个程序 spring boot 后端 java
5.SpringBoot配置解析5.1.基础服务端口：server.port=8080（应用启动后监听8080端口）应用名称：spring.application.name=Chat64（注册到服务发现等场景时的标识）5.2.数据库连接（MySQL）URL：jdbc:mysql://localhost:3306/ai-chat（连接本地3306端口的ai-chat数据库，含时区、编码等参数）驱动：
2025年网络安全人员薪酬趋势程序员肉肉 web安全安全网络安全计算机信息安全程序员
2025年网络安全人员薪酬趋势一、网络安全行业为何成“香饽饽”？最近和几个朋友聊起职业规划，发现一个有趣的现象：不管原来是程序员、运维还是产品经理，都想往网络安全领域跳槽。问原因，答案出奇一致——“听说这行工资高”。确实，从2025年的数据来看，网络安全行业的薪资水平不仅跑赢了大多数IT岗位，甚至成了“技术岗里的天花板”。但高薪背后到底有哪些门道？哪些职位最赚钱？城市和经验如何影响收入？今天我们就
Docker初识：mysql8主从复制（单向）- 主从搭建扩展知识滴水可藏海 #mysql 数据库
主从服务（master-slave）新学习到的知识。1、全库同步与部分同步上回书说到Docker初识：mysql8主从复制（单向）的配置都是针对全库配置的。但是实际上并不需要针对全库做备份，只需要对一些特别重要的库或者表来进行同步。例如information_schema等。可以通过配置文件中的一些属性指定需要针对哪些库或者哪些表记录binlog。Master配置：#需要同步的二进制数据库名bin
在拉卡拉分账功能中实现实时更新，需结合异步回调通知和数据库事务来确保数据一致性。以下是具体实现方案肥仔全栈开发拉卡拉支付 php 拉卡拉支付三方支付
一、实时更新的核心逻辑依赖拉卡拉分账回调拉卡拉分账完成后会主动推送回调通知（类似支付回调），需监听该回调并更新订单分账状态。数据库事务保障分账金额更新、状态变更等操作需放在事务中，避免部分失败导致数据不一致。二、代码实现1.分账回调处理接口（监听拉卡拉分账结果推送，实时更新数据库）//文件：application/api/controller/Notify.phppublicfunctionlak
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
Android开发中RxJava的使用与原理你过来啊你 android rxjava
RxJava是ReactiveExtensions在JVM上的实现，专为处理异步事件流和基于观察者模式的编程而设计。在Android开发中，它极大地简化了异步操作（如网络请求、数据库访问、UI事件处理）的管理、组合和线程调度，有效解决了回调地狱问题。一、RxJava核心概念Observable(可观察者)：数据源或事件源。它负责发出数据项(onNext)或事件（成功完成onComplete/发生错
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam