AntDB支持自定义分区函数,实现数据路由到特定节点

原文链接: https://my.oschina.net/zaclu/blog/1611589

AntDB支持自定义分区函数,当集群节点确定时,用户可以自定义分区函数,实现特定数据路由到特定的节点。

规则:

1、自定义分区函数的返回值需为整数(smallint, integer, bigint均可)。

2、自定义分区函数的参数需为表的可见字段,一个或者多个字段。

3、分区字段需有非空约束(NOT NULL)。

 

使用举例:

集群结构:两个coordinator,两个datanode

步骤:

1、自定义函数(注意要满足上面3个规则):

CREATE OR REPLACE FUNCTION mydistributor(id integer, value integer)

    RETURNS integer

    AS

    $$

    BEGIN

        RETURN ( id + value ) % 2;

    END;

    $$

    LANGUAGE plpgsql

    IMMUTABLE

    STRICT;

2、创建表,使表根据自定义的函数分布,传入表的可见字段。

CREATE TABLE test(id integer not null, value integer not null) distribute by mydistributor(id, value);

3、插入数据

postgres=# insert into test values(1,2),(2,2),(3,4);

INSERT 0 3

4、验证

datanode0上查询结果如下:

postgres=# select * from test;

id | value

----+-------

2 | 2

(1 row)

 

datanode1上查询数据如下:

postgres=# select * from test;

id | value

----+-------

1 | 2

3 | 4

(2 rows)

由此可知,id和value相加结果为偶数的数据在节点0上,id和value相加结果为奇数的数据在节点1上,与自定义函数的逻辑一致。

目前,ADB支持hash(column)、modulo(column)、roundrobin、replication、自定义分片五中分片方式。

转载于:https://my.oschina.net/zaclu/blog/1611589

你可能感兴趣的:(AntDB支持自定义分区函数,实现数据路由到特定节点)