patternrange -> PartitionByPattern

与hash算法的最终效果一样,这个算法也是先求模得到逻辑分片号,再根据逻辑分片号直接映射到物理分片的一种散列算法。

patternrange -> PartitionByPattern_第1张图片
PartitionByPattern工作示意图g
  1. 用户需要在rule.xml中给出patternValue来定义逻辑分片数量
  2. 在DBLE的启动阶段,读取用户在rule.xml中给出的mapFile,得到逻辑分片到物理分片的映射表
  3. 在DBLE的运行过程中,用户访问使用这个算法的表时,WHERE子句中的分片索引值会被提取出来进行求模,得到逻辑分片号
  4. 再根据逻辑分片号,查映射表,直接得到物理分片号
  • 开发注意点

    • 【分片索引】1,必须是整型数字或整型数字的字符串(可以为负数)
    • 【分片索引】2,最大物理分片配置方法是,在mapFile文件中,为每一个逻辑分片指定单独的物理分片,例如“0=0<换行>1=1<换行>...”
    • 【分片索引】3,最小物理分片配置方法是,在mapFile文件中,为所有逻辑分片指定同一个物理分片,例如“0-<逻辑分片数量>=0”
    • 【数据分布】1,与分片索引值相关而与INSERT先后无相关性,所以在直接使用时无法保证数据分布均匀,但如果分片索引本身连续递增(交易流水号等),则可以期待数据分布较为平均(但副作用会导致范围语句,例如SELECT ... WHERE shard_key BETWEEN 1 AND 100,变成跨分片查询)
  • 运维注意点

    • 【扩容】1,预先过量分片,并且不改变patternValue,可以避免数据再平衡,只需进行涉及数据的迁移
    • 【扩容】2,若需要改变patternValue,需要数据再平衡
    • 【缩容】1,预先过量分片,并且不改变patternValue,可以避免数据再平衡,只需进行涉及数据的迁移
    • 【缩容】2,若需要改变patternValue,需要数据再平衡
  • 配置注意点

    • 【配置项】1,在rule.xml中,可配置项为
    • 【配置项】2,在rule.xml中配置标签,非必须配置项,不配置该项的话,用户的分片索引值没落在mapFile定义的范围时,DBLE会报错;若需要配置,必须为非负整数,用户的分片索引值没落在mapFile定义的范围时,DBLE会路由至这个值的MySQL分片
    • 【配置项】3,在rule.xml中配置标签,范围映射文件的路径:若在映射文件在DBLE_HOME/conf或其中,则可以使用相对路径的形式配置,例如,映射文件是DBLE_HOME/conf/map/table_map.txt时,配置值就可以简写为map/table_map.txt;映射文件在DBLE_HOME/conf目录以外时,需要使用绝对路径,但这种做法需要考虑用户权限等问题,因此不建议把映射文件放在DBLE_HOME/conf外。
    • 【配置项】4,编辑mapFile所配置的文件,记录格式为“<逻辑分片范围的最小值>-<逻辑分片范围的最大值>=<物理分片编号>”,<逻辑分片范围的最小值>和<逻辑分片范围的最大值>必须是整型数字,取值范围为Java的长整型范围内,,<物理分片编号>必须是非负整型数字,记录之间以换行分隔,一行仅能有一条记录,允许以“//”和“#”在行首来注释该行
    • 【配置项】5,读取mapFile时,DBLE不会对其中的范围记录查重,也不会检查范围最小值和范围最大值相互之间谁更大
    • 【配置项】6,mapFile中逻辑分片范围的最小值非常重要,DBLE读取mapFile时会对范围进行基于逻辑分片范围的最小值的插入排序,目前的最佳实践是人手确保范围与范围之间没有重叠

你可能感兴趣的:(patternrange -> PartitionByPattern)