HBase写性能调优

HBase服务器端优化

  1. Region是否太少?

优化原理:当前集群中表的Region个数如果小于RegionServer个数,即Num(Region of Table) < Num (RegionServer),可以考虑切分Region并尽可能分布到不同的RegionServer上以提高系统请求并发度。

优化建议:在Num (Region of Table) < Num (RegionServer)的场景下切分部分请求负载高的Region,并迁移到其他RegionServer。

  1. 写入请求是否均衡?

优化原理:写入请求如果不均衡,会导致系统并发度较低,还有可能造成部分节点负载很高,进而影响其他业务。分布式系统中特别需要注意单个节点负载很高的情况,单个节点负载很高可能会拖慢整个集群,这是因为很多业务会使用Mutli批量提交读写请求,一旦其中一部分请求落到慢节点无法得到及时响应,会导致整个批量请求超时。

优化建议:检查Rowkey设计以及预分区策略,保证写入请求均衡。

HBase客户端优化

  1. 是否可以使用Bulkload方案写入?

Bulkload是一个MapReduce程序,运行在Hadoop集群。程序的输入是指定数据源,输出是HFile文件。HFile文件生成之后再通过LoadIncrementalHFiles工具将HFile中相关元数据加载到HBase中。Bulkload方案适合将已经存在于HDFS上的数据批量导入HBase集群。相比调用API的写入方案,Bulkload方案可以更加高效、快速地导入数据,而且对HBase集群几乎不产生任何影响。

  1. 是否需要写WAL? WAL是否需要同步写入?

优化原理:数据写入流程可以理解为一次顺序写WAL+一次写缓存,通常情况下写缓存延迟很低,因此提升写性能只能从WAL入手。HBase中可以通过设置WAL的持久化等级决定是否开启WAL机制以及HLog的落盘方式。WAL的持久化分为四个等级:SKIP_WAL,ASYNC_WAL,SYNC_WAL以及FSYNC_WAL。如果用户没有指定持久化等级,HBase默认使用SYNC_WAL等级持久化数据。在实际生产线环境中,部分业务可能并不特别关心异常情况下少量数据的丢失,而更关心数据写入吞吐量。比如某些推荐业务,这类业务即使丢失一部分用户行为数据可能对推荐结果也不会构成很大影响,但是对于写入吞吐量要求很高,不能造成队列阻塞。这种场景下可以考虑关闭WAL写入。退而求其次,有些业务必须写WAL,但可以接受WAL异步写入,这是可以考虑优化的,通常也会带来一定的性能提升。

优化推荐:根据业务关注点在WAL机制与写入吞吐量之间做出选择,用户可以通过客户端设置WAL持久化等级。

  1. Put是否可以同步批量提交?

优化原理:HBase分别提供了单条put以及批量put的API接口,使用批量put接口可以减少客户端到RegionServer之间的RPC连接数,提高写入吞吐量。另外需要注意的是,批量put请求要么全部成功返回,要么抛出异常。

优化建议:使用批量put写入请求。

  1. Put是否可以异步批量提交?

优化原理:如果业务可以接受异常情况下少量数据丢失,可以使用异步批量提交的方式提交请求。提交分两阶段执行:用户提交写请求,数据写入客户端缓存,并返回用户写入成功;当客户端缓存达到阈值(默认2M)后批量提交给RegionServer。需要注意的是,在某些客户端异常的情况下,缓存数据有可能丢失。

优化建议:在业务可以接受的情况下开启异步批量提交,用户可以设置setAutoFlush (false)

  1. 写入KeyValue数据是否太大?

KeyValue大小对写入性能的影响巨大。一旦遇到写入性能比较差的情况,需要分析写入性能下降是否因为写入KeyValue的数据太大。KeyValue大小对写入性能影响曲线如图


性能曲线变化

横坐标是写入的一行数据(每行数据10列)大小,左纵坐标是写入吞吐量,右纵坐标是写入平均延迟(ms)。可以看出,随着单行数据不断变大,写入吞吐量急剧下降,写入延迟在100K之后急剧增大。

你可能感兴趣的:(HBase写性能调优)