如何用java操作hbase数据库(增,删,改,查操作)

相信大家在开发大数据平台的时候都涉及到数据的导入导出,而hbase作为hadoop上的一个数据库,如何连接和操作则成为了不得不学的一个东西,那么今天这篇文章就教大家如何操作hbase数据库。

1.新建工程

1.新建一个普通的java工程:
如何用java操作hbase数据库(增,删,改,查操作)_第1张图片

2.在工程文件目录下创建一个lib文件夹,导入相对应的jar文件,并通过build-path导入

具体需要的jar如下:
如何用java操作hbase数据库(增,删,改,查操作)_第2张图片

如需要下载可在下面链接:
hbase-1.1.2-bin.tar.gz

3.在工程文件目录下创建一个conf文件夹(需通过buildpath注入)并导入hbase的配置文件,这个配置文件需在hbase的conf目录下寻找:
如何用java操作hbase数据库(增,删,改,查操作)_第3张图片

如何用java操作hbase数据库(增,删,改,查操作)_第4张图片

做到这里基本的工程创建就完成了,现在需要下一步了哦

2.配置hosts文件

在你java工程所在电脑配置你的hadoop集群信息,所以需要找到并修改hosts文件:
因为hadoop的分布式hbase可能存储在一个slaver里,所有要先确定那个是hbase的安装机,或者全部导入,我就是哈哈

hosts的目录:
C:\Windows\System32\drivers\etc

写入集群信息:
如何用java操作hbase数据库(增,删,改,查操作)_第5张图片

需要注意的是,我这里已经默认你配置好集群,配置好后其他集群机器的hosts文件应该也含有这些内容

3.编写java代码,这里有各种方法,欢迎使用交流

如何用java操作hbase数据库(增,删,改,查操作)_第6张图片

代码

package hbase;

import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.Cell;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.HColumnDescriptor;
import org.apache.hadoop.hbase.HTableDescriptor;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.Admin;
import org.apache.hadoop.hbase.client.Connection;
import org.apache.hadoop.hbase.client.ConnectionFactory;
import org.apache.hadoop.hbase.client.Delete;
import org.apache.hadoop.hbase.client.Get;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.client.ResultScanner;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.client.Table;
import org.apache.hadoop.hbase.exceptions.DeserializationException;
import org.apache.hadoop.hbase.filter.Filter;
import org.apache.hadoop.hbase.filter.SingleColumnValueFilter;
import org.apache.hadoop.hbase.protobuf.generated.MasterProcedureProtos.DeleteColumnFamilyState;
import org.apache.hadoop.hbase.filter.CompareFilter.CompareOp;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.htrace.fasterxml.jackson.databind.Module.SetupContext;
import org.junit.Before;
import org.junit.Test;

import com.sun.java_cup.internal.runtime.Symbol;


public class HBaseDemo {

    //与HBase数据库的连接对象
    public static Connection connection;

    //数据库元数操作对象
    public static Admin admin;


    public static void main(String[] args) {
        try {
            System.out.println("开始执行本程序");
            System.out.println("HBaseDemo.main()->admin1:" + admin);
            setUp();

            //这里调用下面的方法来操作hbase
            createTable("helloWorld");


        } catch (Exception e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }

    }


    public static void setUp() throws Exception {
        //取得一个数据库配置参数对象
        Configuration conf =HBaseConfiguration.create();


        //设置连接参数:hbase数据库所在的主机IP
        conf.set("hbase.zookeeper.quorum", "master2");
        //设置连接参数:hbase数据库使用的接口
        conf.set("hbase.zookeeper.property.clientPort", "2181");

        //取得一个数据库连接对象
        connection=ConnectionFactory.createConnection(conf);

        //取得一个数据库元数据操作对象
        admin=connection.getAdmin();
        System.out.println("HBaseDemo.setUp()->admin:" + admin);
    }



    /**
     * 创建表的方法,输入参数为表名
     * @param tabelNameString
     * @throws IOException
     */
    public static void createTable(String tableNameString) throws IOException {
        System.out.println("-------------------创建表开始了哦------------------------");


        //新建一个数据表表名对象
        TableName tableName=TableName.valueOf(tableNameString);
        System.out.println("HBaseDemo.createTable()->tabelName:" + tableName);
        //if新建的表存在
        if(admin.tableExists(tableName)) {
            System.out.println("表已经存在!");
        }

        //if需要新建的表不存在
        else {

            //数据表描述对象
            HTableDescriptor hTableDescriptor = new HTableDescriptor(tableName);
            System.out.println("HBaseDemo.createTable()->hTableDescriptor:" + hTableDescriptor);

            //数据簇描述对象
            HColumnDescriptor family = new HColumnDescriptor("base");
            System.out.println("HBaseDemo.createTable()->family:" + family);
            //在数据表中新建一个列簇
            hTableDescriptor.addFamily(family);

            //新建数据表
            admin.createTable(hTableDescriptor);
            System.out.println("HBaseDemo.createTable()->admin3:" + admin);
        }
        System.out.println("-----------------创建表结束 ---------------");
    }


    /**
     * 查询表中的数据
     */
    public static void queryTable(String tableNameString) throws IOException {
        System.out.println("--------------------查询整表的数据--------");

        //获取数据表对象
        Table table = connection.getTable(TableName.valueOf(tableNameString));

        //获取表中的数据
        ResultScanner scanner = table.getScanner(new Scan());

        //循环输出表中的数据
        for (Result result : scanner) {

            byte[] row = result.getRow();
            System.out.println("row key is:"+new String(row));

            List listCells = result.listCells();
            for (Cell cell : listCells) {

                byte[] familyArray = cell.getFamilyArray();
                byte[] qualifierArray = cell.getQualifierArray();
                byte[] valueArray = cell.getValueArray();

                System.out.println("row value is:"+ new String(familyArray) +
                        new String(qualifierArray) + new String(valueArray));
            }
        }
        System.out.println("---------------查询整表数据结束----------");
    }

    /**
     * 输入行键的名字
     * @param rowName
     * @throws IOException
     */
    public static void queryTableByRowKey(String tableNameString,String rowNameString) throws IOException {
        System.out.println("---------------按行建查询表中数据--------");

        //取得数据表对象
        Table table=connection.getTable(TableName.valueOf(tableNameString));

        //新建一个查询对象作为查询条件
        Get get = new Get(rowNameString.getBytes());

        //按行查询数据
        Result result = table.get(get);

        byte[] row = result.getRow();
        System.out.println("row key is:" +new String(row));

        List listCells = result.listCells();
        for (Cell cell : listCells) {
            byte[] familyArray = cell.getFamilyArray();
            byte[] qualifierArray = cell.getQualifierArray();
            byte[] valueArray = cell.getValueArray();

            System.out.println("row value is:"+ new String(familyArray) +
                    new String(qualifierArray) + new String(valueArray));
        }
        System.out.println("---------------查行键数据结束----------");
    }


    public static void queryTableCondition(String tableNameString) throws IOException {

        System.out.println("------------------按条件查询---------------");

        //取得数据表对象
        Table table = connection.getTable(TableName.valueOf(tableNameString));

        //创建查询器

        Filter filter = new SingleColumnValueFilter(Bytes.toBytes("base"), 
                Bytes.toBytes("name"), CompareOp.EQUAL, Bytes.toBytes("bookName"));

        //创建扫描器
        Scan scan = new Scan();

        //将查询过滤器的加入到数据表扫描器对象
        scan.setFilter(filter);

        //执行查询操作,并获取查询结果

        ResultScanner scanner =table.getScanner(scan);

        //输出结果

        for (Result result : scanner) {
            byte[] row = result.getRow();
            System.out.println("row key is:" + new String(row));

            List listCells = result.listCells();
            for (Cell cell : listCells) {

                byte[] familyArray = cell.getFamilyArray();
                byte[] qualifierArray = cell.getQualifierArray();
                byte[] valueArray = cell.getValueArray();

                System.out.println("row value is:" + new String(familyArray) 
                        + new String(qualifierArray) + new String(valueArray));
            }

        }

        System.out.println("------------------------按条件查询结束--------------------");

    }


    /**
     * 这是清空表的函数,用以使表变得无效
     * @param tableNameString
     * @throws IOException
     */
    public static void truncateTable(String tableNameString) throws IOException {

        System.out.println("-------------------------清空表开始------------------");

        //取得目标数据表的表明对象
        TableName tableName = TableName.valueOf(tableNameString);

        //设置表状态为无效
        admin.disableTable(tableName);
        //清空指定表的数据
        admin.truncateTable(tableName, true);

        System.out.println("-------------------------清空表结束-----------------");
    }

    /**
     * 删除指定的表,输入值为表名
     * @param tableNameString
     * @throws IOException
     */
    public static void deleteTable(String tableNameString) throws IOException {
        System.out.println("-----------------------删除表---------------");

        // 设置表的状态为无效
        admin.disableTable(TableName.valueOf(tableNameString));

        //删除指定的表
        admin.deleteTable(TableName.valueOf(tableNameString));

        System.out.println("-------------------------删除表-----------------------");

    }

    /**
     * rowkey 是第二层,一行有很多的数据
     * 
     * @throws IOException
     */
    public static void deleteByRowKey(String tableNameString, String rowKey) throws IOException {
        System.out.println("删除行开始");

        //获取待操作的数据表对象
        Table table =connection.getTable(TableName.valueOf(tableNameString));

        //创建删除条件对象
        Delete delete = new Delete(Bytes.toBytes(rowKey));

        table.delete(delete);

        System.out.println("删除行结束");
    }

    /**
     * 新建一个列簇,第一个是表名,第二个是列簇名
     * @param tableNameString
     * @param columnFamily
     * @throws IOException
     */
    public static void addColumnFamily(String tableNameString, String columnFamily) throws IOException {
        System.out.println("新建列簇开始");

        //取得目标数据表的标明对象
        TableName tableName = TableName.valueOf(tableNameString);

        //创建列簇对象
        HColumnDescriptor columnDescriptor = new HColumnDescriptor(columnFamily);

        //将新建的加入到指定的数据表
        admin.addColumn(tableName, columnDescriptor);

        System.out.println("新建列簇结束");
    }

    /**
     * 删除列簇的函数,第一个是表名,第二个是列簇名
     * @param tableNameString
     * @param columnFamily
     * @throws IOException
     */
    public static void DeleteColumnFamily(String tableNameString, String columnFamily) throws IOException {
        System.out.println("删除列簇开始");

        //取得目标数据表的表明对象
        TableName tableName = TableName.valueOf(tableNameString);

        //删除指定数据表中的指定列簇

        admin.deleteColumn(tableName, columnFamily.getBytes());

        System.out.println("删除列簇成功");
    }

    /**
     * 是插入的一个函数,插入的是一个put的list。具体创建方法
     * List putList = new ArrayList();
     * Put put;
     * for(int i = 0; i < 10; i++){
     *  put = new Put(Bytes.toBytes("row" + i));
     *  put.addColumn(Bytes.toBytes("Base")//列簇,Bytes.toBytes("name")//列名,Bytes.toBytes("bookName")//值);
     *  putList.ad(put);
     * }
     * 
     * @param tableNameString
     * @param putList
     * @throws IOException
     */
    public static void insert(String tableNameString, List putList) throws IOException {
        System.out.println("开始执行插入操作");

        //取得一个数据表对象
        Table table = connection.getTable(TableName.valueOf(tableNameString));

        //将数据插入到数据库中
        table.put(putList);

        System.out.println("插入成功");

    }   
}

4.成功页面截图

如何用java操作hbase数据库(增,删,改,查操作)_第7张图片

如何用java操作hbase数据库(增,删,改,查操作)_第8张图片

你可能感兴趣的:(大数据)