HBase 官方文档

Question

Hbase还有其他的FAQs吗?

Answer 1

可以在Hbase的wiki HBase Wiki FAQ 和 Troubleshooting 看到更多的FAQ.

Answer 2

不支持。可以通过Hive 的SQL-ish来支持，该功能还在开发中。但是Hive是基于MapReduce的，对于低延迟的应用并不适合。参见Chapter 11, 数据模型 ，可以看到Hbase客户端的例子。

Answer 3

HDFS 是一个为大文件设计的分布式文件系统。他的文档明确说了，它不是一个通用的文件系统，文件不支持快速的记录查找。另一方面，HBase是建立在HDFS之上，并且支持大表快速记录查找(更新)。这有时候会混淆概念。参见Chapter 11, 数据模型 和 Chapter 12, 架构，来了解更多Hbase的目标。

Answer 4

因为我们没有使用本地的压缩类库。参见 HBASE-1900 Put back native support when hadoop 0.21 is released .将Hadoop的本地类库拷贝到Hbase下面(或者做软链接)就可以了

Answer 5

根据用户列表，参见: Remote Java client connection into EC2 instance .

Answer 6

忽略他。这不是一个错误。这是officially ugly .

Answer 7

如果启用了压缩，参见用户列表 Long client pauses with compression .

Answer 8

如果你使用了一个老式的JVM (< 1.6.0_u21?)?你可以看看thread dump,是不是线程都BLOCKED但是没有一个hold着锁。参见 HBASE 3622 Deadlock in HBaseServer (JVM bug?) . 在Hbase的conf/hbase-env.sh 中的 HBASE_OPTS 加上 -XX:+UseMembar 来修复它。

Answer 9

修正你的DNS。在Hbase 0.92.x之前的版本，反向DNS和正向DNS需要返回一致。参见 HBASE 3431 Regionserver is not using the name given it by the master; double entry in master listing of servers 获得详细信息.

Answer 10

对于在Hbase中维护一个二级索引的问题，有一个用户的指导。参见David Butler在 HBase, mail # user - Stargate+hbase 的信息。

"com.cnn.www"	t9		`anchor:cnnsi.com` = "CNN"
"com.cnn.www"	t8		`anchor:my.look.ca` = "CNN.com"
"com.cnn.www"	t6	`contents:html` = "<html>..."
"com.cnn.www"	t5	`contents:html` = "<html>..."
"com.cnn.www"	t3	`contents:html` = "<html>..."

"com.cnn.www"	t9	`anchor:cnnsi.com` = "CNN"
"com.cnn.www"	t8	`anchor:my.look.ca` = "CNN.com"

"com.cnn.www"	t6	`contents:html` = "<html>..."
"com.cnn.www"	t5	`contents:html` = "<html>..."
"com.cnn.www"	t3	`contents:html` = "<html>..."

C.1. 一般问题
Hbase还有其他的FAQs吗? HBase 支持 SQL吗? HBase是如何工作在HDFS上的? 为什么日志的最后一行是'2011-01-10 12:40:48,407 INFO org.apache.hadoop.io.compress.CodecPool: Got brand-new compressor'?
	Hbase还有其他的FAQs吗?
	可以在Hbase的wiki HBase Wiki FAQ 和 Troubleshooting 看到更多的FAQ.
	HBase 支持 SQL吗?
	不支持。可以通过Hive 的SQL-ish来支持，该功能还在开发中。但是Hive是基于MapReduce的，对于低延迟的应用并不适合。参见Chapter 11, 数据模型，可以看到Hbase客户端的例子。
	HBase是如何工作在HDFS上的?
	HDFS 是一个为大文件设计的分布式文件系统。他的文档明确说了，它不是一个通用的文件系统，文件不支持快速的记录查找。另一方面，HBase是建立在HDFS之上，并且支持大表快速记录查找(更新)。这有时候会混淆概念。参见Chapter 11, 数据模型和 Chapter 12, 架构，来了解更多Hbase的目标。
	为什么日志的最后一行是'2011-01-10 12:40:48,407 INFO org.apache.hadoop.io.compress.CodecPool: Got brand-new compressor'?
	因为我们没有使用本地的压缩类库。参见 HBASE-1900 Put back native support when hadoop 0.21 is released .将Hadoop的本地类库拷贝到Hbase下面(或者做软链接)就可以了
C.2. EC2
为什么我的连接EC2上的集群的远程Java连接不能工作?
	为什么我的连接EC2上的集群的远程Java连接不能工作?
	根据用户列表，参见: Remote Java client connection into EC2 instance .
C.3. 构建 HBase
当我build的时候，为什么遇到 Unable to find resource 'VM_global_library.vm'?
	当我build的时候，为什么遇到 `Unable to find resource 'VM_global_library.vm'` ?
	忽略他。这不是一个错误。这是officially ugly .
C.4. Runtime
为什么我在Hbase loading的是看到了停顿为什么我的RegionServer会突然挂住？为什么我看到RegionServer的数量是实际的两倍。一半使用域名，一半使用IP。
	为什么我在Hbase loading的是看到了停顿
	如果启用了压缩，参见用户列表 Long client pauses with compression .
	为什么我的RegionServer会突然挂住？
	如果你使用了一个老式的JVM (< 1.6.0_u21?)?你可以看看thread dump,是不是线程都BLOCKED但是没有一个hold着锁。参见 HBASE 3622 Deadlock in HBaseServer (JVM bug?) . 在Hbase的`conf/hbase-env.sh` 中的 `HBASE_OPTS` 加上 `-XX:+UseMembar` 来修复它。
	为什么我看到RegionServer的数量是实际的两倍。一半使用域名，一半使用IP。
	修正你的DNS。在Hbase 0.92.x之前的版本，反向DNS和正向DNS需要返回一致。参见 HBASE 3431 Regionserver is not using the name given it by the master; double entry in master listing of servers 获得详细信息.
C.5. 我如何在Hbase中建立
二级索引?
	二级索引?
	对于在Hbase中维护一个二级索引的问题，有一个用户的指导。参见David Butler在 HBase, mail # user - Stargate+hbase 的信息。

Revision 0.90.4
配置，数据模型使用入门

HBase官方文档

HBase 官方文档

序

最前面的话

Chapter 1. 入门

1.1. 介绍

1.2. 快速开始

1.2.1. 下载解压最新版本

1.2.2. 启动 HBase

是否安装了 java ?

1.2.3. Shell 练习

1.2.4. 停止 HBase

1.2.5. 下一步该做什么

1.3. 慢速开始(相对快速开始)

1.3.1. 需要的软件

1.3.1.1. java

1.3.1.2. hadoop

我可以用Hbase里面的支持sync 的hadoop.jar替代Hadoop里面的那个吗?

Hadoop 安全性

1.3.1.3. ssh

1.3.1.4. DNS

1.3.1.5. NTP

1.3.1.6. ulimit 和 nproc

1.3.1.6.1. 在Ubuntu上设置ulimit

1.3.1.7. dfs.datanode.max.xcievers

1.3.1.8. Windows

1.3.2. HBase运行模式:单机和分布式

1.3.2.1. 单机模式

1.3.2.2. 分布式模式

1.3.2.2.1. 伪分布式模式

Note

Note

1.3.2.2.2. 完全分布式模式

1.3.2.2.2.1. regionservers

1.3.2.2.2.2. ZooKeeper

我需要运行几个zookeeper?

1.3.2.2.2.2.1. 使用现有的ZooKeeper例子

1.3.2.2.2.3. HDFS客户端配置

1.3.2.3. 运行和确认你的安装

1.3.3. 配置例子

1.3.3.1. 简单的分布式Hbase安装

1.3.3.1.1. hbase-site.xml

1.3.3.1.2. regionservers

1.3.3.1.3. hbase-env.sh

Chapter 2. 升级

2.1. 从HBase 0.20.x or 0.89.x 升级到 HBase 0.90.x

Chapter 3. 配置

3.1. hbase-site.xml 和 hbase-default.xml

3.1.1. HBase 默认配置

HBase 默认配置

3.2. hbase-env.sh

3.3. log4j.properties

3.4. 重要的配置

3.5. 必须的配置

3.6. 推荐的配置

3.6.1. zookeeper.session.timeout

3.6.2. hbase.regionserver.handler.count

3.6.3. 大内存机器的配置

3.6.4. LZO 压缩

3.6.5. 更大的 Regions

3.6.6. 管理 Splitting

3.7. 连接Hbase集群的客户端配置和依赖

3.7.1. Java客户端配置

Java是如何读到hbase-site.xml 的内容的

Chapter 4. The HBase Shell

4.1. 使用脚本

4.2. Shell 技巧

4.2.1. irbrc

4.2.2. LOG 时间转换

4.2.3. Debug

4.2.3.1. Shell 切换成debug 模式

4.2.3.2. DEBUG log level

Chapter 5. 构建 HBase

5.1. 将一个 HBase release 加入到 Apache's Maven Repository

Chapter 6. Developers

6.1. IDEs

6.1.1. Eclipse

6.2. 单元测试

6.2.1. Mocito

Chapter 7. HBase 和 MapReduce

1.3.1.6. `ulimit` 和 `nproc`

1.3.1.6.1. 在Ubuntu上设置`ulimit`

1.3.1.7. `dfs.datanode.max.xcievers`

1.3.2.2.2.1. `regionservers`

1.3.3.1.1. `hbase-site.xml`

1.3.3.1.2. `regionservers`

1.3.3.1.3. `hbase-env.sh`

3.1. `hbase-site.xml` 和 `hbase-default.xml`

3.2. `hbase-env.sh`

3.3. `log4j.properties`

3.6.1. `zookeeper.session.timeout`

3.6.2. `hbase.regionserver.handler.count`

Java是如何读到`hbase-site.xml` 的内容的

4.2.1. `irbrc`

9.2.1. `hbase.regionserver.blockCacheCount`

9.2.2. `hbase.regionserver.blockCacheFree`

9.2.3. `hbase.regionserver.blockCacheHitRatio`

9.2.4. `hbase.regionserver.blockCacheSize`

9.2.5. `hbase.regionserver.compactionQueueSize`

9.2.6. `hbase.regionserver.fsReadLatency_avg_time`

9.2.7. `hbase.regionserver.fsReadLatency_num_ops`

9.2.8. `hbase.regionserver.fsSyncLatency_avg_time`

9.2.9. `hbase.regionserver.fsSyncLatency_num_ops`

9.2.10. `hbase.regionserver.fsWriteLatency_avg_time`

9.2.11. `hbase.regionserver.fsWriteLatency_num_ops`

9.2.12. `hbase.regionserver.memstoreSizeMB`

9.2.13. `hbase.regionserver.regions`

9.2.14. `hbase.regionserver.requests`

9.2.15. `hbase.regionserver.storeFileIndexSizeMB`

9.2.16. `hbase.regionserver.stores`

9.2.17. `hbase.regionserver.storeFiles`