《Kratos使用过程中的常见问题》
原文地址:https://github.com/gaoxianglong/kratos/wiki/常见问题
1、什么是Kratos?
基于Java语言编写的轻量级分库分表(Sharding)中间件,丰富的Sharding算法支持(2类4种分片算法),能够方便DBA实现库的水平扩容和降低数据迁移成本。Kratos站在巨人的肩膀上(SpringJdbc),采用与应用集成架构,放弃通用性,只为换取更好的执行性能与降低分布式环境下外围系统的宕机风险。
关于更多Kratos的介绍,请参考https://github.com/gaoxianglong/kratos/wiki/kratos简介
2、怎么获取Kratos的源码
Kratos是一个开源项目,源码托管在github上,源代码仓库地址是https://github.com/gaoxianglong/kratos。 同时每次Kratos发布正式版本和快照的时候,都会把源码打包,你可以从上面的下载地址中找到相关版本的源码。
3、RDBMS的数据库为什么需要做垂直分库、水平分区操作?
主要是为了解决单库性能瓶颈,充分利用分布式和集群的威力提升数据库读/写性能。关于互联网场景下常见的性能瓶颈:
- 大量的并发访问,导致单库出现难以承受的负载压力;
- 单表数据量过大,导致检索效率低下;
关于互联网当下的数据拆分过程,请参考https://github.com/gaoxianglong/kratos/wiki/互联网当下的数据拆分过程
4、和其它sharding中间件相比,Kratos的优势体现在哪里?
目前市面上Sharding中间件太多,应用集成架构鼻祖TDDL闭源,而其它成熟的更多是基于Proxy,在分布式场景下,多一个外围系统依赖就意味着需要多承担一分风险,况且性能相对于应用集成架构直连数据库而言,网络连接带来的消耗也是一个问题。并且市面上大多数的Sharding中间件都会附加很多看似“实用”的鸡肋功能,导致过多的代码,可读性、维护性不好。
Kratos不考虑通用性,采用应用集成架构,站在巨人的肩膀上,只为换取更好的执行性能与降低分布式环境下外围系统的宕机风险。并且处于成本(人员成本、物理资源成本)上的考虑,Kratos有着较大优势,最重要的是,Kratos的分片模型丰富,能够帮助DBA在较短时间内实现库的水平扩容和降低数据迁移成本。
关于更多的对比细节,请参考https://github.com/gaoxianglong/kratos/wiki/目前市面上常见的一些Sharding中间件产品对比
5、是否可以单独使用Kratos的功能子集?
Kratos简单易用,开发人员可以使用所有或者部分Kratos的功能,如果你的应用还没有达到Sharding级别,那么你可以优先考虑使用Kratos实现master/slave一主一从的读写分离操作。
关于读写分离配置,请参考https://github.com/gaoxianglong/kratos/wiki/Master-Slave一主一从读写分离配置
6、Kratos是否一定要依赖于SpringJdbc?
Kratos诞生的初衷就是因为SpringJdbc,自然依赖于它。简单来说,Kratos重写了JdbcTemplate,并使用了Spring提供的AbstractRoutingDataSource作为动态数据源层。相信一直到最后,Kratos都不会考虑与其它第三方持久层组件集成,这主要是为了使Kratos的核心代码更加纯粹。
关于Kratos的架构模型,请参考https://github.com/gaoxianglong/kratos/wiki/kratos的架构模型
7、Kratos支持哪些分片算法?
Kratos支持2类4种分片算法:
- 库内分片类型:
- 片名连续的库内分片算法;
- 非片名连续的库内分片算法;
- 一库一片类型:
- 片名连续的一库一片算法;
- 非片名连续的一库一片算法;
关于Kratos的分片模型,请参考https://github.com/gaoxianglong/kratos/wiki/kratos的分片模型
8、Kratos所使用数据库连接池是否可随意替换?
你可以使用任意的数据库连接池,比如C3P0、DBCP、BoneCP、Druid等,Kratos推荐使用Druid与C3P0,并且Kratos对这2款数据库连接池产品提供了一定程度上的集成支持。
9、Kratos是否支持分布式事物?
Kratos不支持分布式事物,并且提示大家,能够避免引入分布式事物的,最好还是避免最好。如果实在要使用事物,那么强一致性的分布式事物肯定是不现实,也是不推荐的,但可以在业务层依赖MQ、异步操作的方式实现事物,保证最终一致性即可。
关于更多使用注意事项,请参考https://github.com/gaoxianglong/kratos/wiki/kratos的使用注意事项
10、如何配置分片规则?
有3个属性非常重要,如下所示:
<!-- 分片开关 -->
<constructor-arg name="isShard" value="true" />
<!-- 分片模式,false为库内分片模式,true为一库一表分片模式 -->
<property name="shardMode" value="true" />
<!-- 片名是否连续,true为片名连续,false为非片名连续 -->
<property name="consistent" value="true" />
属性“shardMode”指定了分片类型,而属性“consistent”指定了分片方式。
关于片名连续的库内分片配置,请参考https://github.com/gaoxianglong/kratos/wiki/片名连续的库内分片配置
关于非片名连续的库内分片配置,请参考https://github.com/gaoxianglong/kratos/wiki/非片名连续的库内分片配置
关于片名连续的一库一片配置,请参考https://github.com/gaoxianglong/kratos/wiki/片名连续的一库一片配置
关于非片名连续的一库一片配置,请参考https://github.com/gaoxianglong/kratos/wiki/非片名连续的一库一片配置
11、路由条件是否必须是整型?
Kratos不支持其它类型的路由条件,这就意味着路由条件必须是整型。当然在实际的开发过程中,查询条件往往比较复杂,不可能都是整型,那么在这种情况下,就需要在主表的基础上,构建一个反向索引表(也称之为二级索引表)。
12、构建反向索引表时,如何避免路由条件产生hash碰撞?
查询反向索引表获取主表的路由条件时,反向索引表的路由条件一般都是主键值做hash,为了避免产生hash碰撞,检索条件一般都会采用“select uid from tab where emailhash=? and email=?”。
13、数据库Sharding后,多机的Sequence如何解决?
如果在单库的情况下,开发人员可以使用主键自增,而多机场景下,将不再适用,Kratos提供有解决生成全局唯一的SequenceId策略。
关于自动生成全局唯一的sequenceId,请参考https://github.com/gaoxianglong/kratos/wiki/自动生成全局唯一的sequenceId
14、数据源配置文件能否自动生成?
为了避免手工配置出现错误的情况,Kratos提供有自动生成核心配置文件和数据源配置文件的功能。
关于自动生成核心配置文件,请参考https://github.com/gaoxianglong/kratos/wiki/自动生成kratos核心配置文件
关于自动生成数据源配置文件,请参考https://github.com/gaoxianglong/kratos/wiki/自动生成druid数据源文件