如何优雅地使用 java 连接 HBase 客户端

点击上方蓝色“大数据实战演练”,选择“设为星标”或“置顶”

回复“资源”领取独家整理的学习资料!

每一个成功人士的背后,必定曾经做出过勇敢而又孤独的决定。

放弃不难,但坚持很酷~

HBase 版本:1.2.0-cdh5.7.0

一、客户端的长短连接

java 远程连接 HBase 客户端,大体分为两种方式。一种是长连接,一种是短连接。

短链接,顾名思义,就是客户端执行完某个操作之后,就关闭连接的这种方式,就是短链接。

而长连接就是有且连接一次,后续的所有操作都是基于这次连接做的操作,操作完成后,不关闭连接。长连接适用于频繁交互的场景,今天我们就来着重说一下它。

二、使用单例模式来初始化 HBase 客户端

以 HBase 为例,如果使用长连接,那就得需要确保 connection 唯一(不唯一的话,有可能造成资源浪费或者连接数过多报错),所有的操作都使用这一个 connection 。实现方法有很多,比如双重校验,加锁等方法。

但我们也可以使用静态内部类的形式实现上述场景。静态内部类也是实现单例模式的一种,保证只加载一次,懒加载并且线程安全。

/**
 * HBase客户端操作(长连接)
 */
public class HBaseUtil {

    private static final Logger log = LoggerFactory.getLogger(HBaseUtil.class);

    private Connection connection;
    private static Configuration configuration;

    /**
     * 私有构造器
     * 初始化 HBase Connection
     */
    private HBaseUtil() {
        configuration = initHBaseEnv();
        try {
            connection = ConnectionFactory.createConnection(configuration);
        } catch (IOException e) {
            log.error("HBase Client connect abnormal: ", e);
            System.exit(-1);
        }
    }

    /**
     * 静态内部类
     */
    private static class InstanceHolder {
        // 不会在外部类初始化时就直接加载,只有当调用了getInstance方法时才会静态加载,线程安全。
        private static final HBaseUtil instance = new HBaseUtil();
    }

    /**
     * 单例模式,获取HBase实例
     */
    public static HBaseUtil getInstance() {
        return InstanceHolder.instance;
    }

    /**
     * 初始化 HBase 配置
     */
    public static Configuration initHBaseEnv() {

        try {
            configuration = HBaseConfiguration.create();
            configuration.set("hbase.zookeeper.quorum", "cdh-worker-1,cdh-worker-2,cdh-worker-3");
            configuration.set("hbase.zookeeper.property.clientPort", 2181);
            configuration.set("zookeeper.znode.parent", "/hbase");
        } catch (Exception e) {
            log.error("HBase Client Configuration Initialization exception: ", e);
        }
        return configuration;
    }

    /**
     * 获取namespace中所有的表名
     *
     * @param namespace
     */
    public List listTables(String namespace) throws IOException {
        List tableNameList = new ArrayList<>();
        // 获取namespace中所有的表名
        TableName[] tbs = connection.getAdmin().listTableNamesByNamespace(namespace);

        for (TableName tableName : tbs) {
            tableNameList.add(tableName.toString());
        }
        return tableNameList;
    }
}

上述代码,只有当触发 getInstance() 方法时,才会初始化 connection ,且 connection 只会被加载一次。

比如我们要执行 HBase 客户端操作的话,可以执行:HBaseUtil.getInstance().listTables("xxx") 。

三、总结

1、为什么这样实现就是单例的?

因为 HBaseUtil.java 的实例化是靠静态内部类的静态常量 instance 实例化的。instance 是常量,因此只能赋值一次;它还是静态的,因此随着内部类一起加载。

2、这样实现有什么好处?

我记得以前接触的懒汉式的代码好像有线程安全问题,需要加同步锁才能解决。采用静态内部类实现的代码也是懒加载的,只有触发静态内部类的静态常量 instance 的时候才加载;同时也不会有线程安全问题。

3、不只是 HBase 可以这样初始化客户端,Elasticsearch 等等的长连接也都可以,这样,你学会了吗?

还有哪些写法?一起来讨论吧

???? ???? ????

往期推荐

HBase二次开发之搭建HBase调试环境,如何远程debug HBase源代码

【生活现场】从洗袜子到HBase存储原理解析

HBase的ACL说明

HBase配置AES加密

HBase原理(一):架构理解

如何将Hive与HBase整合联用

Python生成HBase 10w+ 条数据说明

HBase应用(一):数据批量导入说明

HBase 集成 Phoenix 构建二级索引实践

HBase漫谈 | HBase分区过多影响&合理分区数量

HBase 性能调优第一弹:内存篇

扫一扫,我们的故事就开始了。

如果这篇文章对你有所启发,点赞、转发都是一种支持!

另外公众号改变了推送规则,大家看文章不要忘记点击最下方的在看,点赞按钮,这样微信自动识别为常看公众号,否则很可能推送的文章可能淹没在别的文章找不到,谢谢大家

让我知道你在看

你可能感兴趣的:(java,hive,设计模式,redis,epoll)