分布式数据库DDB introduce

DDB(Distributed database)是网易杭研院立项最早,应用最为广泛的后台产品之一,也是国内最早出现的基于现有database之上开发的分布式数据库中间件,目前依然在为网易易信,云音乐,云阅读等大型互联网产品提供稳定的数据库服务。业界中同类型的产品有阿里集团的TDDL,阿里B2B的cobar等。

DDB主要以两种方式向应用方提供服务:

一种是以JDBC的jar包形式为JAVA应用提供直接依赖,JAVA应用(如tomcat)通过依赖DDB提供的JDBC包实现透明访问分布式数据库集群中的各个分库分表,这种服务方式与淘宝TDDL如出一辙,我们称之为中间件模式。

另一种方式是为应用部署独立的DDBProxy服务来满足应用分库分表的需求,在这种方式下,应用通过标准JDBC访问Proxy,而Proxy则根据MySQL标准通信协议对客户端请求解析,还原应用SQL请求,然后通过本地的DDB JDBC访问数据库集群,最后再将得到的结果根据MySQL标准通信协议编码返回给客户端。这种服务方式与B2B的cobar以及现在阿里云的DRDS类似,不同的是DDB的Proxy与DDB在语法特性上一脉相承,而根据目前已有的资料来看,与TDDL相比DRDS在语法特性和事务支持上是有所阉割的。

DDB的中间件模式概念架构:

dbi architecture

DDB Proxy概念架构:

proxy architecture

DDB支持的语法功能:

  1. General Insert(support batch, on duplicate key..), update, delete, replace, select(with alias)
  2. Global group by, order by, limit, having
  3. Global aggregate: max, min, count, avg, concat
  4. Global incremental id
  5. Multiple table join(limited), union
  6. Subquery(need trade off sometimes)

一些语法细节上DDB无法支持,如全局跨表表达式:select A.num + B.num from a, b where …,其中A和B都是跨库的表,这种类似功能我个人认为在中间件层面是难以实现的,或者说即使实现了对实际应用场景也是不可用的。

总体来说,DDB的语法集属于“大而全”的类型,对一些情况如limit一个很大的数据所带来的性能折损,需要DBA帮助应用去优化SQL写法,或者直接在SQL审核中砍掉。对分布式数据库来说,DBA的把关至关重要,尤其在表模式设计和均衡字段选择上,一旦一张表的均衡字段选择和表设计上存在疏漏,会给应用未来的开发造成极大的困扰。

无论是阿里系的各种分布式数据库(TDDL, DRDS, OceanBase)还是DDB,又或是其他公司自研项目如youtube Vitess和google spanner,它们的运维和学习成本要比传统数据库高很多,不同系统在功能,性能以及高可用架构上的取舍体现了不同开发团队的品味。

最后贴一个facebook来交流时给老大写的一个PPT,简单介绍了下DDB中各种概念和整体架构,分享给有兴趣的同学。

DDB-introduce ppt

BTW,DDB目前是网易非开源项目(根据上层的意思,以后可能会开源,或向其他公司提供服务,日期未定),但是欢迎有兴趣的同学多多交流 ~_~


http://www.majin163.com/2014/09/24/ddb-introduce/

你可能感兴趣的:(RDS)