1.alter system stop server '192.168.2.64:2882'
select * from __all_server
Stop Server 后该 Server 的状态仍为 Active ,但 stop_service_time的值由 0 变为 Stop Server 的时间点。
kill -15 pid/observer
select * from __all_server
状态变为了 inactive
__all_server 内部表中同时通过 stop_time 和 status 两个字段来标识 OBserver 的状态:
stop_time 为 0 时,表示 OBServer 为 active状态; stop_time 不为 0 时, 表示 OBServer 处于 stopped 状态,且此时间戳。
status 有以下三种状态: active :表示该 OBServer 为正常状态。 inactive :表示该 OBServer 为下线状态。 deleting :表示该 OBServer 正在被删除。
obclient> SELECT * FROM oceanbase.__all_zone WHERE zone= ‘zone1’ and name=‘status’;
--status 字段为 stopped,表示该 Zone 处于 stopped状态。
隔离故障的 Zone 后,如果需要解除隔离状态,可以通过执行 ALTER SYSTEM START ZONE ‘zone1’ 命令来完成。
2.合并状态
SELECT ZONE, NAME, INFO FROM __ALL_ZONE WHERE NAME ='MERGE_STATUS';
INFO 字段信息代表合并状态,分别有以下几种
IDLE :表示未进行合并
MERGING :表示正在进行合并
TIMEOUT :表示合并超时(但是合并不会暂停,仍然继续,仅设置超时标志)
ERROR :表示合并出错(需要高优先级处理)
3.obproxy
hostname -i 没有ip 启动失败
端口被占用,启动失败
4.系统变量 ob_tcp_invited_nodes 用于设置租户的 IP 白名单,是租户全局的白名单限制
5.合并相关参数,
merger_check_interval ,每个 Zone 的合并进度检查间隔。 默认10分钟
minor_freeze_times. --转储的参数
zone_merge_timeout
merge_thread_count 合并线程数
6.不可直接替换租户的资源池
注:希望对租户进行扩容,可以修改资源单元的规格,不可直接替换租户的资源池,否则将出现错误
MySQL [oceanbase]> alter tenant obcp_t1 resource_pool_list=('p5c2g_t2');
ERROR 1210 (HY000): Incorrect arguments to resource pool list
更改资源池,实际上是删除资源池时使用,例如可以将5副本替换为3副本。例如:
通过修改租户 tenant1 的 Locality 来删除副本。
根据 Locality 的变更规则,每次只能删除一个 Zone 内的 Locality,Locality 的变更规则相关信息请参见 Locality 概述。
obclient>ALTER TENANT tenant1 LOCALITY='F@z1,F@z2,F@z3,F@z4';
obclient>ALTER TENANT tenant1 LOCALITY='F@z1,F@z2,F@z3';
删除 z4、z5 上的资源池 pool2。
obclient>ALTER TENANT tenant1 RESOURCE_POOL_LIST =('pool1') ;
7.添加Server(状态为Inactive,随后切为active[start_service_time>0])
ALTER SYSTEM ADD SERVER 'ip:port' [,'ip:port'...] [ZONE=’zone_name’];
删除Server(状态为Deleting)
ALTER SYSTEM DELETE SERVER 'ip:port' [,'ip:port'...] [ZONE=’zone_name’];
取消删除Server(状态为Active[start_service_time>0或stop_time>0])
ALTER SYSTEM CANCEL DELETE SERVER 'ip:port' [,'ip:port'...] [ZONE=’zone_name’];
Start Server (状态为Active[start_service_time>0且Active[stop_time=0])
ALTER SYSTEM START SERVER 'ip:port'[,'ip:port'...][ZONE='zone'];
Stop Server (状态为Active[stop_time>0])
ALTER SYSTEM STOP SERVER 'ip:port'[,'ip:port'...][ZONE='zone'];
8.集群初始状态:2-2-2 Unit: 每个Zone 4个Unit
集群扩容:2-2-2 -> 3-3-3
目标端创建新Unit ,分区复制 ,角色切换 ,下线多余分区及Unit
Unit 是资源调度的最小单元
图中Unit移动是示意图,实际细节是目标端先创建Unit,然后分区复制和切换
参数控制 enable_rebalance 和 enable_auto_leader_switch
添加过服务器后,集群内已经存在的资源单元会开始向新的空闲服务器迁移
9.Skyline 剪枝规则对每个索引(主键也是一种索引)定义了如下三个维度:
是否回表
是否存在 Interesting Order
索引前缀能否抽取 Query Range
通过比较两个索引, 剪掉一些比较”差”的索引
剩下的索引通过代价模型选出
10.freeze_trigger_percentage 用于设置触发全局冻结的租户使用内存阈值。 70%
大小由参数memstore_limit_percentage决定,表示租户的 MemStore 部分占租户总内存的百分比。 默认值为50,即占用租户内存的50%