patternrange -> PartitionByPattern

与hash算法的最终效果一样，这个算法也是先求模得到逻辑分片号，再根据逻辑分片号直接映射到物理分片的一种散列算法。

PartitionByPattern工作示意图g

用户需要在rule.xml中给出patternValue来定义逻辑分片数量
在DBLE的启动阶段，读取用户在rule.xml中给出的mapFile，得到逻辑分片到物理分片的映射表
在DBLE的运行过程中，用户访问使用这个算法的表时，WHERE子句中的分片索引值会被提取出来进行求模，得到逻辑分片号
再根据逻辑分片号，查映射表，直接得到物理分片号

开发注意点
- 【分片索引】1，必须是整型数字或整型数字的字符串（可以为负数）
- 【分片索引】2，最大物理分片配置方法是，在mapFile文件中，为每一个逻辑分片指定单独的物理分片，例如“0=0<换行>1=1<换行>...”
- 【分片索引】3，最小物理分片配置方法是，在mapFile文件中，为所有逻辑分片指定同一个物理分片，例如“0-<逻辑分片数量>=0”
- 【数据分布】1，与分片索引值相关而与INSERT先后无相关性，所以在直接使用时无法保证数据分布均匀，但如果分片索引本身连续递增（交易流水号等），则可以期待数据分布较为平均（但副作用会导致范围语句，例如SELECT ... WHERE shard_key BETWEEN 1 AND 100，变成跨分片查询）
运维注意点
- 【扩容】1，预先过量分片，并且不改变patternValue，可以避免数据再平衡，只需进行涉及数据的迁移
- 【扩容】2，若需要改变patternValue，需要数据再平衡
- 【缩容】1，预先过量分片，并且不改变patternValue，可以避免数据再平衡，只需进行涉及数据的迁移
- 【缩容】2，若需要改变patternValue，需要数据再平衡
配置注意点
- 【配置项】1，在rule.xml中，可配置项为和和
- 【配置项】2，在rule.xml中配置标签，非必须配置项，不配置该项的话，用户的分片索引值没落在mapFile定义的范围时，DBLE会报错；若需要配置，必须为非负整数，用户的分片索引值没落在mapFile定义的范围时，DBLE会路由至这个值的MySQL分片
- 【配置项】3，在rule.xml中配置标签，范围映射文件的路径：若在映射文件在DBLE_HOME/conf或其中，则可以使用相对路径的形式配置，例如，映射文件是DBLE_HOME/conf/map/table_map.txt时，配置值就可以简写为map/table_map.txt；映射文件在DBLE_HOME/conf目录以外时，需要使用绝对路径，但这种做法需要考虑用户权限等问题，因此不建议把映射文件放在DBLE_HOME/conf外。
- 【配置项】4，编辑mapFile所配置的文件，记录格式为“<逻辑分片范围的最小值>-<逻辑分片范围的最大值>=<物理分片编号>”，<逻辑分片范围的最小值>和<逻辑分片范围的最大值>必须是整型数字，取值范围为Java的长整型范围内，，<物理分片编号>必须是非负整型数字，记录之间以换行分隔，一行仅能有一条记录，允许以“//”和“#”在行首来注释该行
- 【配置项】5，读取mapFile时，DBLE不会对其中的范围记录查重，也不会检查范围最小值和范围最大值相互之间谁更大
- 【配置项】6，mapFile中逻辑分片范围的最小值非常重要，DBLE读取mapFile时会对范围进行基于逻辑分片范围的最小值的插入排序，目前的最佳实践是人手确保范围与范围之间没有重叠

patternrange -> PartitionByPattern

你可能感兴趣的:(patternrange -> PartitionByPattern)