HBase的是建立在Hadoop的Apache的开源的NoSQL数据库,提供了大量的非结构化和半结构化数据的随机存取和强大的一致性。它是仿照谷歌的BigTable是一个列面向家庭的数据库。数据被存储在一排内的表和数据的行是由列族分组。 HBase的是在这个意义上,无论是列也不存储在其中的数据类型需要在使用它们之前所定义的模式的更小的数据库。开放源代码是首次发布由Mike Cafarella于2007年,线性扩展处理PB级数据数千个节点。它可以依靠数据冗余,批处理和通过在Hadoop的生态系统的分布式应用程序提供的其他功能。
HDInsight HBase的是提供一个管理的集群集成到Azure的环境。集群被配置为直接在Azure的Blob存储,这提供了在性能/成本的选择低延迟和增加的弹性存储数据。这使客户能够建立一个大型数据集工作的互动式网站,构建存储传感器和遥测数据,从数以百万计的端点的服务,并分析这些数据与Hadoop作业。 HBase的和Hadoop的都是很好的出发点,在Azure的大数据项目,特别是,可以实现实时应用与大型数据集工作。
在HDInsight实现利用的HBase的横向扩展架构,可提供自动分片表,强一致性读取和写入,并自动故障转移。性能提高了内存高速缓存的读取和高吞吐量数据流写入。虚拟网络配置也可用于HDInsight HBase的。有关详细信息,请参阅提供HDInsight集群在Azure虚拟网络。
数据可以在HBase的使用创造GET,PUT和Scan从HBase的shell命令来管理。数据使用付诸表决,并阅读使用get命令写入到数据库中。Scan命令被用于获得在表中从多行的数据。数据也可以使用HBase的C#的API,它提供了一个客户机库上HBase的REST API之上管理。一个HBase的数据库也可以使用配置单元查询。的介绍,这些编程模型,请参阅获取使用HBase的用Hadoop的HDInsight开始。协处理器也可以允许在数据库所在的节点数据的处理。
BigTable的,并推而广之,HBase的创建为其典型使用案例就是网络搜索。搜索引擎建立一个映射条款,包含它们的网页索引。但也有许多其他的用例HBase的适合哪几个的,都逐项列出在本节。
HBase的可作为一个键值存储,适用于管理信息系统。 Facebook的使用HBase的为自己的邮件系统,它是理想的存储和管理互联网通信。 WebTable使用HBase的搜索和管理从网页中提取表。
HASE是用于捕捉是从各种来源的增量收集的数据是有用的。这包括社交分析,时间序列,保持交互式仪表盘的最新潮流和计数器,以及管理审计日志系统。例子包括Bloomberg 交易终端和开放时间序列数据库(OpenTSDB)的商店,并提供访问收集服务器系统的健康指标。
Phoenix 是Apache HBase的一个SQL查询引擎。它是作为一个JDBC驱动程序,并能使查询和使用SQL管理HBase的表。
应用程序可以在HBase的顶部使用它作为数据存储上运行。例子包括Phoenix ,OpenTSDB,KIJI,和Titan。应用程序也可以集成HBase的。例子包括Hive,Pig,Solr,Storm,Flume,Impala,Spark,Ganglia和Drill。
获取在HDInsight开始使用HBase的用Hadoop
提供HDInsight集群在Azure虚拟网络
与HBase的在HDInsight分析Twitter的感悟
使用Maven构建使用HBase的与HDInsight Java应用程序(Hadoop的)
C#HBase的SDK
Apache的HBase
Bigtable的:分布式存储系统的结构化数据
本文翻译自Windows Azure官网:http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-overview/
转载请注明出处:http://blog.csdn.net/yangzhenping, 谢谢!