http://nosql-databases.org/

 

作为一个DBA,几年走过来,工作中历经MS SQL Server 2000/2005,Oracle9i/10g/11g,MySQL5.0/5.1等不同的数据库产品和版本,对于关系型数据库系统(RDBMS)应该说有了一定的了解。从一个数据库切换到另外一个数据库,虽然有些许艰难,却谈不上抗拒,甚至乐意主动去深入了解其他的数据库产品。关系理论的成熟,造就了这三十年来关系数据库在数据领域的绝对地位。

这两年在互联网行业,时间虽然不长,却深切的感受到了一个大型网站真实的压力。随着业务滚雪球式的增长,关系数据库由于对数据一致性的强硬要求(ACID),在扩展性方面天生不足,可以预见的天花板犹如达摩克利斯之剑,随时可能落下。SQL优化,应用重构,硬件升级,垂直拆分,能用的武器轮番上场,也不过救急于一时。要能做到系统随着网站压力几乎无限制的扩展需求,水平拆分横向扩展是不可避免的终极魔法。过去一年,我们也在一些应用上逐步尝试水平拆分,遇到过各种各样的问题,当然也有很大的收获,积累了很多的经验。MySQL作为开源的关系数据库,也开始得到大规模的应用,毕竟水平拆分后数据库的规模将是指数级的增长,商业数据库如Oracle的成本,是不得不考虑的一个问题。

我们所遇到的问题,相信所有大型的互联网站都会碰到。关系数据库有其不可替代的特性,但是,我们真的所有的数据都需要使用关系数据库么?或许一个简单但是更加容易扩展的key-value存储更能够满足很多互联网应用的数据存储需求,Google和Amazon相继推出BigTable和Dynamo,可以说是在分布式数据库方面一个开荒式的尝试。2009年初,一个叫做NoSQL的组织开始出现并运作,纠集了一支优秀的开源部队想要革了关系型数据库的命,至少是想革了关系型数据库在互联网行业的命。不管NoSQL是不是关系型数据库的终结者,却确确实实在推广一些优秀的开源分布式数据库产品,作为DBA,或许我们是时候花点时间去了解一下这个对手了,不然饭碗丢了可能还不明白是谁抢去了,呵呵。

下面是wikipedia上列出了NoSQL的一些开源项目,有时间应该去了解一下。实际上,淘宝也有在开发并使用自己的一套分布式cache和持久化系统,不知道什么时候也能看到开源版本的出现,呵呵。
* Cassandra
* Chordless
* CouchDB
* Db4o
* GT.M
* Hbase
* Hypertable
* Memcachedb
* Mnesia
* MongoDB
* Neo4j
* Project Voldemort
* Redis