为什么选择了Cassandra而没有用Hbase

部署运维:

  1. hbase依赖组件多,部署麻烦一点,但是相关资料很多,降低了难度;需要部署的组件有zookeeper,hdfs,然后才是hbase。对应的Cassandra就比较简单很多,单台服务器启动一个Cassandra进程即可。
  2. cassandra部署组件依赖少,但是配置参数多,相关资料较少。

读写速度最快:

  1. Cassandra的读写性能最好。写自然不必说,Cassandra的设计就是为了提升写的效率,写入内存(并且记录日志,周期性的刷入或者必须记录)就返回成功,然后才持久化。读也很快,硬盘中是顺序读,另外又有多级缓存,例如KeyCache,RowCache,Key Filter。

稳定性高:

  1. 稳定性上主要是考虑的是某个节点挂了怎么办,出现故障怎么办,Cassandra是没有单点故障的,出现故障后,本该写入这个节点的数据会平均的分配到其它节点,并在该节点回复后,写回对应的数据。多重机制保证了某个节点出现故障后,不会对其它节点有太大的影响,不会让集群受不了。

向一个新手描述 Cassandra  数据库最好的办法,是将它描述为 KKV 存储,两个 K 构成了主键。

第一个 K 是分区键(partition key),用于确定数据存储在哪个节点上,以及在磁盘上的位置。一个分区包含很多行数据,行的位置由第二个 K 确定,这是聚类键(clustering key),聚类键充当分区内的主键,以及决定了数据行如何排序。可以将分区视为有序字典。这些属性相结合,可以支持非常强大的数据建模。

Cassandra 可是宣称单个分区可以支持 2GB!

Cassandra 以写入速度比读取速度要快著称。

 

你可能感兴趣的:(Cassandra)