【CSDN云计算俱乐部】NoSQL选型及HBase案例详解

  • Share-Nothing的分布式存储和计算架构
  • 异构多源数据的组织管理:实现了结构化数据、非结构化文本及非结构化多媒体的统一存储管理
  • 支持异构数据的统一SQL查询:支持对于结构化数据、非结构化文本的检索和分析,该检索和分析操作都可以通过SQL进行实现
  • 丰富的数据访问和处理模式
  • 高效的检索机制
  • 异构多副本存储和恢复机制
  • 跨域数据管理和检索:支持跨域部署,可以在多个物理地点建立多个数据中心,在此之上可以支持数据在数据中心之间进行移动,并且可以支持对于位于不同地域的数据进行全局检索和访问

应用场景

  1. 海量结构化记录管理
  2. 处理海量小文档管理和处理
  3. 面向异构数据的智能搜索和挖掘系统

成功案例

王树鹏介绍说这个系统已经有了成功的应用案例,是国家某部委大数据管理项目。这个系统的主要需求是:

  • 大量信息记录,每天产生约40亿条(约4TB);
  • 数据保留备份副本,记录数据保留半年;
  • 可对数据进行精确、模糊查询及统计,结果秒级响应;
  • 可批量导入结构化、非结构化数据;

最终达到的实施效果是:

  • 采用分布式存储架构(3个元数据节点+115个存储节点);
  • 数据规模超过5000亿 ,查询响应时间为秒级;
  • 数据保留2个副本,保证数据安全;
  • 系统可用容量约2PB。(文/周小璐 审校/仲浩)

CSDN云计算俱乐部为云计算领域的用户,技术工作者,云计算厂商提供面对面交流与讨论的机会。如果您有好的话题想跟大家分享也欢迎联系我们

你可能感兴趣的:(【CSDN云计算俱乐部】NoSQL选型及HBase案例详解)