clickhouse字段自增解决办法

rowNumberInAllBlocks()实现

字段设置自增值rowNumberInAllBlocks()坑

在用ReplacingMergeTree表引擎的表,插入时使用rowNumberInAllBlocks()实现id递增,在分布式的时候,id会分别在每个集群递增,假如合并是以id进行合并的话,那么就会发现数据量减半

图示如下:

clickhouse字段自增解决办法_第1张图片

如果将数据插入新表,在新增一列atuo_id用rowNumberInAllBlocks()实现递增,会发现,atuo_id同一个值是集群服务器数量的重复次,例如集群有三个服务器,那么自增atuo_id为1的就有三次

如图所示:

clickhouse字段自增解决办法_第2张图片

集群数量较少的情况下可以用以下方式解决:

方法一:换一个表引擎例如MergeTree,但是id还是上面那个样子,因为id是不能进行更新等操作的,就新增一个id_auto字段,但是依次将id_auto字段在本地表上用rowNumberInAllBlocks()设置自增,注意的一点就是依次在服务器上进行,而且每次运行都要看一下上次运行之后,id_auto的最大值,在这个值上进行自增

方法二:不换表引擎,还是用ReplacingMergeTree表引擎,解决办法就是用本地表,分别插入要插入表的本地表,每插入一次,确定插入表id最大值,在rowNumberInAllBlocks()上加表中最大值

你可能感兴趣的:(clickhouse,数据库,clickhouse)