Hbase之一月速成:Hbase的JavaAPI操作

目录

一、需求与数据集

二、准备工作

1、创建一个maven工程 

2、修改prom文件,添加依赖

3、复制Hadoop的配置文件core-site.xml和HBase的配置文件hbase-site.xml到resources目录

 4、查看目录

5、创建基本的包结构与类

6、创建类 

7、结果 

三、案例一、使用javaapi创建hbase的表

1、编写代码

2、运行

1)开启集群

2)运行结果

3、查看创建的表

四、案例二、使用javaapi删除表

1、编写删除表的方法代码

2、调用方法

 3、getAdmin方法

4、运行

5、查看结果

五、案例三、往创建的表中插入数据

1、编写添加数据的方法

2、调用方法

 3、getAdmin方法

4、运行

 5、查看结果

 六、案例四、查看一条数据

1、编写方法

2、调用方法

3、查看结果

七、案例五、删除一条数据、

1、编写方法

2、调用

​ 3、运行

 4、查看结果

八、案例六、导入数据 

1、需求

2、Import JOB导入大量的数据

3、上传数据至hdfs

4、导入数据

1)启动yarn

2)创建表

 3)运行导入命令

4)运行结果 

5、查看数据

6、count计数

7、 Mapreduce计数 

 九、案例六、查询2020年6月份所有用户的用水量

1、需求分析

2、编写代码

3、调用方法

 4、查看结果

5、输出代码的改进

 6、解决数值型数据显示乱码的问题

十、Export Job 导出数据

1、导出数据

2、查看结果


一、需求与数据集

某自来水公司,需要存储大量的缴费明细数据,以下截取了缴费明细的一部分内容:

用户id姓地址性缴费时间表示表示用量合查表日期最迟缴费

因为缴费明细的数据记录非常庞大,该公司的信息部门决定使用hbase来存储这些数据,并

且可以使用java来访问这些数据。

二、准备工作

idea的maven环境搭建成功

1、创建一个maven工程 

Hbase之一月速成:Hbase的JavaAPI操作_第1张图片

Hbase之一月速成:Hbase的JavaAPI操作_第2张图片

2、修改prom文件,添加依赖

Hbase之一月速成:Hbase的JavaAPI操作_第3张图片

3、复制Hadoop的配置文件core-site.xml和HBase的配置文件hbase-site.xml到resources目录

Hbase之一月速成:Hbase的JavaAPI操作_第4张图片 复制到项目中

Hbase之一月速成:Hbase的JavaAPI操作_第5张图片

 4、查看目录

Hbase之一月速成:Hbase的JavaAPI操作_第6张图片

5、创建基本的包结构与类

Hbase之一月速成:Hbase的JavaAPI操作_第7张图片

6、创建类 

Hbase之一月速成:Hbase的JavaAPI操作_第8张图片

7、结果 

三、案例一、使用javaapi创建hbase的表

使用java-api创建hbase的表

创建一个名为water_bill的表,包含一个列簇

1、编写代码

Hbase之一月速成:Hbase的JavaAPI操作_第9张图片

2、运行

1)开启集群

Hbase之一月速成:Hbase的JavaAPI操作_第10张图片

2)运行结果

3、查看创建的表

Hbase之一月速成:Hbase的JavaAPI操作_第11张图片

四、案例二、使用javaapi删除表

删除刚刚创建的表

1、编写删除表的方法代码

Hbase之一月速成:Hbase的JavaAPI操作_第12张图片

2、调用方法

 3、getAdmin方法

4、运行

5、查看结果

Hbase之一月速成:Hbase的JavaAPI操作_第13张图片

五、案例三、往创建的表中插入数据

1、编写添加数据的方法

 

2、调用方法

Hbase之一月速成:Hbase的JavaAPI操作_第14张图片

 3、getAdmin方法

Hbase之一月速成:Hbase的JavaAPI操作_第15张图片

4、运行

 5、查看结果

Hbase之一月速成:Hbase的JavaAPI操作_第16张图片

 六、案例四、查看一条数据

查看显示rowkey是49441091的数据

1、编写方法

获取某列的值

Hbase之一月速成:Hbase的JavaAPI操作_第17张图片

获取某行的值

Hbase之一月速成:Hbase的JavaAPI操作_第18张图片

2、调用方法

getTable调用

getone调用

Hbase之一月速成:Hbase的JavaAPI操作_第19张图片

3、查看结果

gettable

Hbase之一月速成:Hbase的JavaAPI操作_第20张图片

getone

Hbase之一月速成:Hbase的JavaAPI操作_第21张图片

七、案例五、删除一条数据、

1、编写方法

Hbase之一月速成:Hbase的JavaAPI操作_第22张图片

2、调用

Hbase之一月速成:Hbase的JavaAPI操作_第23张图片 3、运行

Hbase之一月速成:Hbase的JavaAPI操作_第24张图片

 4、查看结果

Hbase之一月速成:Hbase的JavaAPI操作_第25张图片

八、案例六、导入数据 

1、需求

有一份10W条记录的抄表数据文件,需求将其导入hbase中

2、Import JOB导入大量的数据

在hbase中,有一个import的MR作业,可以专门用来将数据导入到hbase中

用法

Hbase org.apache.hadoop.hbase.mapreduce.Import表名hdfs数据文件路径

3、上传数据至hdfs

Hbase之一月速成:Hbase的JavaAPI操作_第26张图片

4、导入数据

1)启动yarn

2)创建表

Hbase之一月速成:Hbase的JavaAPI操作_第27张图片

Hbase之一月速成:Hbase的JavaAPI操作_第28张图片

 3)运行导入命令

hbase org.apache.hadoop.hbase.mapreduce.Import WATER_BILL /water_bill/

Hbase之一月速成:Hbase的JavaAPI操作_第29张图片

4)运行结果 

5、查看数据

Hbase之一月速成:Hbase的JavaAPI操作_第30张图片

6、count计数

Hbase之一月速成:Hbase的JavaAPI操作_第31张图片

7、 Mapreduce计数 

Hbase之一月速成:Hbase的JavaAPI操作_第32张图片

 九、案例六、查询2020年6月份所有用户的用水量

1、需求分析

在hbase中用scan+filter实现过滤查询。2020年6月份其实就是从2020年6月1号到2020

年6月30日的所有抄表数据

2、编写代码

Hbase之一月速成:Hbase的JavaAPI操作_第33张图片

3、调用方法

Hbase之一月速成:Hbase的JavaAPI操作_第34张图片

 4、查看结果

Hbase之一月速成:Hbase的JavaAPI操作_第35张图片

5、输出代码的改进

Hbase之一月速成:Hbase的JavaAPI操作_第36张图片

Hbase之一月速成:Hbase的JavaAPI操作_第37张图片

 6、解决数值型数据显示乱码的问题

打印显示字符串数据正常

Hbase之一月速成:Hbase的JavaAPI操作_第38张图片

显示结果

Hbase之一月速成:Hbase的JavaAPI操作_第39张图片

十、Export Job 导出数据

用法:

hbase org.apache.hadoop.hbase.mapreduce.Export 表名 路径

1、导出数据

Hbase之一月速成:Hbase的JavaAPI操作_第40张图片

2、查看结果

Hbase之一月速成:Hbase的JavaAPI操作_第41张图片

Hbase之一月速成:Hbase的JavaAPI操作_第42张图片

你可能感兴趣的:(Hbase速成,java,hbase,mapreduce)