学习shardIng-精确分片

Sharding-JDBC认为对于分片策略存有两种维度:

数据源分片策略(DatabaseShardingStrategy):数据被分配的目标数据源
表分片策略(TableShardingStrategy):数据被分配的目标表

两种分片策略API完全相同,但是表分片策略是依赖于数据源分片策略的(即:先分库然后才有分表)

分片算法

通过分片算法将数据分片,支持通过=、>=、<=、>、<、BETWEEN和IN分片。分片算法需要应用方开发者自行实现,可实现的灵活度非常高。

目前提供4种分片算法。由于分片算法和业务实现紧密相关,因此并未提供内置分片算法,而是通过分片策略将各种场景提炼出来,提供更高层级的抽象,并提供接口让应用开发者自行实现分片算法。

  • 精确分片算法
    对应PreciseShardingAlgorithm,用于处理使用单一键作为分片键的=与IN进行分片的场景。需要配合StandardShardingStrategy使用。

  • 范围分片算法
    对应RangeShardingAlgorithm,用于处理使用单一键作为分片键的BETWEEN AND、>、<、>=、<=进行分片的场景。需要配合StandardShardingStrategy使用。

  • 复合分片算法
    对应ComplexKeysShardingAlgorithm,用于处理使用多键作为分片键进行分片的场景,包含多个分片键的逻辑较复杂,需要应用开发者自行处理其中的复杂度。需要配合ComplexShardingStrategy使用。

  • Hint分片算法
    对应HintShardingAlgorithm,用于处理使用Hint行分片的场景。需要配合HintShardingStrategy使用。

分片策略

包含分片键和分片算法,由于分片算法的独立性,将其独立抽离。真正可用于分片操作的是分片键 + 分片算法,也就是分片策略。目前提供5种分片策略。

  • 标准分片策略
    对应StandardShardingStrategy。提供对SQL语句中的=, >, <, >=, <=, IN和BETWEEN AND的分片操作支持。StandardShardingStrategy只支持单分片键,提供PreciseShardingAlgorithm和RangeShardingAlgorithm两个分片算法。PreciseShardingAlgorithm是必选的,用于处理=和IN的分片。RangeShardingAlgorithm是可选的,用于处理BETWEEN AND, >, <, >=, <=分片,如果不配置RangeShardingAlgorithm,SQL中的BETWEEN AND将按照全库路由处理。

  • 复合分片策略
    对应ComplexShardingStrategy。复合分片策略。提供对SQL语句中的=, >, <, >=, <=, IN和BETWEEN AND的分片操作支持。ComplexShardingStrategy支持多分片键,由于多分片键之间的关系复杂,因此并未进行过多的封装,而是直接将分片键值组合以及分片操作符透传至分片算法,完全由应用开发者实现,提供最大的灵活度。

  • 行表达式分片策略
    对应InlineShardingStrategy。使用Groovy的表达式,提供对SQL语句中的=和IN的分片操作支持,只支持单分片键。对于简单的分片算法,可以通过简单的配置使用,从而避免繁琐的Java代码开发,如: t_user_$->{u_id % 8} 表示t_user表根据u_id模8,而分成8张表,表名称为t_user_0到t_user_7。

  • Hint分片策略
    对应HintShardingStrategy。通过Hint指定分片值而非从SQL中提取分片值的方式进行分片的策略。

  • 不分片策略
    对应NoneShardingStrategy。不分片的策略。

建表语句

CREATE TABLE `t_order_0` (
  `order_id` bigint DEFAULT NULL COMMENT '订单号',
  `cust_id` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '客户id',
  `order_time` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '下单时间'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

CREATE TABLE `t_order_1` (
  `order_id` bigint DEFAULT NULL COMMENT '订单号',
  `cust_id` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '客户id',
  `order_time` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '下单时间'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

CREATE TABLE `sku_1` (
  `sku_id` varchar(60) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku号',
  `sku_name` varchar(20) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku名称',
  `order_id` bigint DEFAULT NULL COMMENT '订单ID'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

CREATE TABLE `sku_0` (
  `sku_id` varchar(60) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku号',
  `sku_name` varchar(20) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku名称',
  `order_id` bigint DEFAULT NULL COMMENT '订单ID'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

1: 重点

order_id 是bigint 类型的 我采用了行表达式分片策略,直接配置的,由于找不到怎么配置varchar 所以我才不得不开始学习怎么重写实现方法。

代码1 使用标准分片:

@Slf4j
public class MyPreciseShardingAlgorithm implements PreciseShardingAlgorithm {

    /**
     * Sharding.
     * 实现标准分片策略,通过计算分到不同的表来实现分表策略。
     * @param collection available data sources or tables's names
     * @param preciseShardingValue        sharding value
     * @return sharding result for data source or table's name
     */
    @Override
    public String doSharding(Collection collection, PreciseShardingValue preciseShardingValue) {
        Comparable value = preciseShardingValue.getValue();
        String columnName = preciseShardingValue.getColumnName();
        String logicTableName = preciseShardingValue.getLogicTableName();
        log.info("collection:" + JSON.toJSONString(collection) + ",preciseShardingValue:" + JSON.toJSONString(preciseShardingValue));
        String data = value.toString();
        int size = collection.size();
        for(String tableName: collection){
            int index = Math.abs(data.hashCode() % size);
            if(tableName.endsWith(index+"")){
                return tableName;
            }
        }
        return null;
    }
}

配置:

spring:
  main:
    allow-bean-definition-overriding: true
  # 相关的配置
  shardingsphere:
    props:
      sql:
        show: true
    datasource:
      names: ds1
      ds1:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbcUrl: jdbc:mysql://localhost:3306/springcloud?serverTimezone=CTT&useUnicode=true&characterEncoding=utf-8&allowMultiQueries=true&useSSL=false
        username: root
        password: root
    sharding:
      tables:
        # 这个地方注意: sharding-jdbc会根据名称去找本节点,所以写sql的时候,要写此节点的名称
        t_order:
          # 表达式, 健康节点: 根据上一个节点找到此值, {0..1}为groovy语言,$会替换成{0..1}的一个值,数据库表是: book_0 , book_1
          # 这个配置是告诉sharding有多少个表
          actual-data-nodes: ds1.t_order_$->{0..1}
          # 配置其分片策略和分片算法
          table-strategy:
            # 行表达式
            inline:
              # 配置sharding的计算列
              sharding-column: order_id
              # 配置sharding的表达式,对应的n_id必须和sharding-column的值对应,否则报错
              algorithm-expression: t_order_$->{order_id % 2}
        # 这个地方注意: sharding-jdbc会根据名称去找本节点,所以写sql的时候,要写此节点的名称
        sku:
          # 表达式, 健康节点: 根据上一个节点找到此值, {0..1}为groovy语言,$会替换成{0..1}的一个值,数据库表是: book_0 , book_1
          # 这个配置是告诉sharding有多少个表
          actual-data-nodes: ds1.sku_$->{0..1}
          # 配置其分片策略和分片算法
          table-strategy:
            standard:
              sharding-column: sku_id
              precise-algorithm-class-name: com.xulei.spring.shardConfig.MyPreciseShardingAlgorithm

具体配置在starter下面的json文件。

实际案例:

    select  sku.order_id,t_order.order_time,sku.sku_id,sku.sku_name
        from t_order,sku
        where t_order.order_id=sku.order_id
        and t_order.order_id =3
因为t_order表里面是采用了order_id 进行分片,所以具体执行sql 只查询了1个库 t_order_1。
image.png

sql 修改:
select sku.order_id,t_order.order_time,sku.sku_id,sku.sku_name
from t_order,sku
where t_order.order_id=sku.order_id
and sku.order_id =3
结果就是全表扫描了。因为sku 表是根据sku_id 来进行分表的


image.png

你可能感兴趣的:(学习shardIng-精确分片)