趣学程序

HBase部署与使用

概述

HBase的角色

HMaster

功能：

监控RegionServer
处理RegionServer故障转移
处理元数据的变更
处理region的分配或移除
在空闲时间进行数据的负载均衡
通过Zookeeper发布自己的位置给客户端

RegionServer

功能：

负责存储HBase的实际数据
处理分配个他的Region
刷新缓存到HDFS
维护HLog
执行压缩
负责处理Region分片

组件：

Write-Ahead logs

HBase 的修改记录，当对 HBase 读写数据的时候，数据不是直接写进磁盘，它会在内存中
保留一段时间（时间以及数据量阈值可以设定）。但把数据保存在内存中可能有更高的概率
引起数据丢失，为了解决这个问题，数据会先写在一个叫做 Write-Ahead logfile 的文件中，
然后再写入内存中。所以在系统出现故障的时候，数据可以通过这个日志文件重建。

HFile

这是在磁盘上保存原始数据的实际的物理文件，是实际的存储文件。

Store

HFile 存储在 Store 中，一个 Store 对应 HBase 表中的一个列族。

MemStore

顾名思义，就是内存存储，位于内存中，用来保存当前的数据操作，所以当数据保存在 WAL
中之后，RegsionServer 会在内存中存储键值对

Region

Hbase 表的分片，HBase 表会根据 RowKey 值被切分成不同的 region 存储在 RegionServer 中，
在一个 RegionServer 中可以有多个不同的 region。

HBase的架构

HBase 一种是作为存储的分布式文件系统，另一种是作为数据处理模型的 MR 框架。因为日
常开发人员比较熟练的是结构化的数据进行处理，但是在 HDFS 直接存储的文件往往不具
有结构化，所以催生出了 HBase 在 HDFS 上的操作。如果需要查询数据，只需要通过键值
便可以成功访问。

架构图如下图所示：

HBase 内置有 Zookeeper，但一般我们会有其他的 Zookeeper 集群来监管 master 和
regionserver，Zookeeper 通过选举，保证任何时候，集群中只有一个活跃的 HMaster，HMaster
与 HRegionServer 启动时会向 ZooKeeper 注册，存储所有 HRegion 的寻址入口，实时监控
HRegionserver 的上线和下线信息。并实时通知给 HMaster，存储 HBase 的 schema 和 table
元数据，默认情况下，HBase 管理 ZooKeeper 实例，Zookeeper 的引入使得 HMaster 不再是
单点故障。一般情况下会启动两个 HMaster，非 Active 的 HMaster 会定期的和 Active HMaster
通信以获取其最新状态，从而保证它是实时更新的，因而如果启动了多个 HMaster 反而增加
了 Active HMaster 的负担。
一个 RegionServer 可以包含多个 HRegion，每个 RegionServer 维护一个 HLog，和多个 HFiles
以及其对应的 MemStore。RegionServer 运行于 DataNode 上，数量可以与 DatNode 数量一致，

架构图：

HBase部署与使用

部署

前提：
zookeeper正常部署
hadoop正常部署

1.解压HBase程序包
2.修改配置文件
hbase-env.sh

export JAVA_HOME=/home/admin/modules/jdk1.8.0_121
export HBASE_MANAGES_ZK=false

hbase-site.xml


	
		hbase.rootdir
		hdfs://linux01:8020/hbase
	
	
		hbase.cluster.distributed
		true
	
	
	
		hbase.master.port
		16000
	
	
		hbase.zookeeper.quorum
		linux01:2181,linux02:2181,linux03:2181
	
	
		hbase.zookeeper.property.dataDir
		/home/admin/modules/zookeeper-3.4.5/zkData

regionservers:

hadoop102
hadoop103
hadoop104

3.jar包问题

由于 HBase 需要依赖 Hadoop，所以替换 HBase 的 lib 目录下的 jar 包，以解决兼容问题：

3.1 删除原有的 jar

$ rm -rf /home/admin/modules/hbase-1.3.1/lib/hadoop-*
$ rm -rf /home/admin/modules/hbase-1.3.1/lib/zookeeper-3.4.6.jar

3.2 拷贝新 jar，涉及的 jar 有：

hadoop-annotations-2.7.2.jar
hadoop-auth-2.7.2.jar
hadoop-client-2.7.2.jar
hadoop-common-2.7.2.jar
hadoop-hdfs-2.7.2.jar
hadoop-mapreduce-client-app-2.7.2.jar
hadoop-mapreduce-client-common-2.7.2.jar
hadoop-mapreduce-client-core-2.7.2.jar
hadoop-mapreduce-client-hs-2.7.2.jar
hadoop-mapreduce-client-hs-plugins-2.7.2.jar
hadoop-mapreduce-client-jobclient-2.7.2.jar
hadoop-mapreduce-client-jobclient-2.7.2-tests.jar
hadoop-mapreduce-client-shuffle-2.7.2.jar
hadoop-yarn-api-2.7.2.jar
hadoop-yarn-applications-distributedshell-2.7.2.jar
hadoop-yarn-applications-unmanaged-am-launcher-2.7.2.jar
hadoop-yarn-client-2.7.2.jar
hadoop-yarn-common-2.7.2.jar
hadoop-yarn-server-applicationhistoryservice-2.7.2.jar
hadoop-yarn-server-common-2.7.2.jar
hadoop-yarn-server-nodemanager-2.7.2.jar
hadoop-yarn-server-resourcemanager-2.7.2.jar
hadoop-yarn-server-tests-2.7.2.jar
hadoop-yarn-server-web-proxy-2.7.2.jar
zookeeper-3.4.5.jar

这些 jar 包的对应版本应替换成你目前使用的 hadoop 版本，具体情况具体分析。

查找 jar 包举例：

$ find /home/admin/modules/hadoop-2.7.2/ -name hadoop-annotations*

4.HBase 软连接 Hadoop 配置

$ ln -s ~/modules/hadoop-2.7.2/etc/hadoop/core-site.xml
~/modules/hbase-1.3.1/conf/core-site.xml
$ ln -s ~/modules/hadoop-2.7.2/etc/hadoop/hdfs-site.xml
~/modules/hbase-1.3.1/conf/hdfs-site.xml

5.HBase 服务的启动
5.1 启动方式 1

$ bin/hbase-daemon.sh start master
$ bin/hbase-daemon.sh start regionserver

如果集群之间的节点时间不同步，会导致 regionserver 无法启动，抛出ClockOutOfSyncException 异常

5.1 启动方式 2

$ bin/start-hbase.sh

对应的停止服务：

$ bin/stop-hbase.sh

如 果 使 用 的 是 JDK8 以 上 版 本 ， 则 应 在 hbase-evn.sh 中 移 除
“HBASE_MASTER_OPTS”和“HBASE_REGIONSERVER_OPTS”配置

6.查看HBASE页面
http://hadoop102:16010

简单使用

1.基本操作
（1）进入HBase客户端命令行

	$ bin/hbase shell

（2）查看帮助命令

	hbase(main)> help

（3）查看当前数据库中有哪些表

	hbase(main)> list

2.表的操作
（1）创建表

create 'student','info'

（2）插入数据到表

hbase(main) > put 'student','1001','info:name','Thomas'
hbase(main) > put 'student','1001','info:sex','male'
hbase(main) > put 'student','1001','info:age','18'
hbase(main) > put 'student','1002','info:name','Janna'
hbase(main) > put 'student','1002','info:sex','female'
hbase(main) > put 'student','1002','info:age','20'

（3）扫描查看数据

hbase(main) > scan 'student'
hbase(main) > scan 'student',{STARTROW => '1001', STOPROW => '1001'}
hbase(main) > scan 'student',{STARTROW => '1001'}

（4）查看表结构

hbase(main):012:0> describe ‘student’

（5）更新指定字段数据

hbase(main) > put 'student','1001','info:name','Nick'
hbase(main) > put 'student','1001','info:age','100'

（6）查看“指定行”或“指定列族：列”的数据

hbase(main) > get 'student','1001'
hbase(main) > get 'student','1001','info:name'

（7）删除数据

删除某 某 rowkey 的 的 全部 数据
hbase(main) > deleteall 'student','1001'

删除某 rowkey  的某一列 数据
hbase(main) > delete 'student','1002','info:sex'

（8）清空表数据

hbase(main) > truncate 'student'
清空表的操作顺序为先 disable，然后再 truncating。

（9）删除表

hbase(main) > disable 'student'
hbase(main) > drop 'student'

（10）统计数据行数

hbase(main) > count 'student'

（11）变更表信息

将 info 列族中的数据存放 3 个版本
hbase(main) > alter 'student',{NAME=>'info',VERSIONS=>3}

读写流程

HBase读数据流程

1) HRegionServer 保存着 meta 表以及表数据，要访问表数据，首先 Client 先去访问
zookeeper，从 zookeeper 里面获取 meta 表所在的位置信息，即找到这个 meta 表在哪个
HRegionServer 上保存着。
2) 接着 Client 通过刚才获取到的 HRegionServer 的 IP 来访问 Meta 表所在的HRegionServer，从而读取到 Meta，进而获取到 Meta 表中存放的元数据。
3) Client 通过元数据中存储的信息，访问对应的 HRegionServer，然后扫描所在
HRegionServer 的 Memstore 和 Storefile 来查询数据。
4) 最后 HRegionServer 把查询到的数据响应给 Client。

HBase写数据流程

1) Client 也是先访问 zookeeper，找到 Meta 表，并获取 Meta 表信息。
2) 确定当前将要写入的数据所对应的 RegionServer 服务器和 Region。
3) Client 向该 RegionServer 服务器发起写入数据请求，然后 RegionServer 收到请求并响应。
4) Client 先把数据写入到 HLog，以防止数据丢失。
5) 然后将数据写入到 Memstore。
6) 如果 Hlog 和 Memstore 均写入成功，则这条数据写入成功。在此过程中，如果 Memstore达到阈值，
会把 Memstore 中的数据 flush 到 StoreFile 中。
7) 当 Storefile 越来越多，会触发 Compact 合并操作，把过多的 Storefile 合并成一个大的Storefile。
当 Storefile 越来越大，Region 也会越来越大，达到阈值后，会触发 Split 操作，将 Region 一分为二。

尖叫提示：因为内存空间是有限的，所以说溢写过程必定伴随着大量的小文件产生。

JAVAAPI

新建Maven工程
pom.xml


    
        
        
            org.apache.hbase
            hbase-client
            1.3.1
        

        
        
            org.apache.hbase
            hbase-server
            1.3.1

编写HBaseAPI

package top.wintp.hbasetest;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.Cell;
import org.apache.hadoop.hbase.CellUtil;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.HColumnDescriptor;
import org.apache.hadoop.hbase.HTableDescriptor;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.Admin;
import org.apache.hadoop.hbase.client.Connection;
import org.apache.hadoop.hbase.client.ConnectionFactory;
import org.apache.hadoop.hbase.client.Delete;
import org.apache.hadoop.hbase.client.Get;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.client.ResultScanner;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.client.Table;
import org.apache.hadoop.hbase.util.Bytes;
import org.junit.Test;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import java.io.IOException;

import javafx.scene.control.Tab;

/**
 * @description: description:
 * 
 * @author: upuptop
 * 

 * @qq: 337081267
 * 

 * @CSDN: http://blog.csdn.net/pyfysf
 * 

 * @cnblogs: http://www.cnblogs.com/upuptop
 * 

 * @blog: http://wintp.top
 * 

 * @email: [email protected]
 * 

 * @time: 2019/04/2019/4/23
 * 
 */
public class HBaseDemo {
    private static Logger logger = LoggerFactory.getLogger(HBaseDemo.class);

    private static Configuration sConf;

    static {
        //    加载配置
        sConf = HBaseConfiguration.create();
    }


    @Test
    public void testAllFun() throws Exception {
        //    判断表是否存在
        //System.out.println(tableExists("ns_ct:calllog"));
        //创建表
        //createTable("upuptop2", "info");
        //删除表
        dropTable("ns_ct:calllog");

        dropNamespace("ns_ct");

        //    插入数据
        //insertData("upuptop", "1004", "info", "name", "upuptop");
        //insertData("upuptop", "1003", "info", "name", "pyfysf");
        //insertData("upuptop", "1002", "info", "name", "wintp.top");
        //insertData("upuptop", "1001", "info", "name", "sfok.top");

        //    删除数据
        //deleteData("upuptop","1004");

        //    查询所有数据
        //getAllRow("ns_ct:calllog");

        //    查询单条数据
        //getRow("upuptop", "1001");
    }

    /**
     * 获取一行数据
     *
     * @param tableName 表名
     * @param rowKey
     * @throws IOException
     */
    private void getRow(String tableName, String rowKey) throws IOException {
        Connection connection = ConnectionFactory.createConnection(sConf);
        Table table = connection.getTable(TableName.valueOf(tableName));
        Get get = new Get(Bytes.toBytes(rowKey));
        Result result = table.get(get);
        Cell[] cells = result.rawCells();

        for (Cell cell : cells) {
            byte[] rowArray = CellUtil.cloneRow(cell);
            logger.info("HBaseDemo  getAllRow()   rowArray   " + Bytes.toString(rowArray));

            byte[] familyArray = CellUtil.cloneFamily(cell);
            logger.info("HBaseDemo  getAllRow()   familyStr   " + Bytes.toString(familyArray));

            byte[] valueArray = CellUtil.cloneValue(cell);
            logger.info("HBaseDemo  getAllRow()   valueArray   " + Bytes.toString(valueArray));

        }
        table.close();
        connection.close();
    }

    /**
     * 获取所有的数据
     *
     * @param tableName 表名
     */
    private void getAllRow(String tableName) throws IOException {
        //    获取连接
        Connection connection = ConnectionFactory.createConnection(sConf);
        Table table = connection.getTable(TableName.valueOf(tableName));
        Scan scan = new Scan();
        //可以在这里给scan加过滤条件 类似于addQuery() addWhere()
        ResultScanner scanner = table.getScanner(scan);

        for (Result result : scanner) {
            Cell[] cells = result.rawCells();

            for (Cell cell : cells) {
                byte[] rowArray = CellUtil.cloneRow(cell);
                logger.info("HBaseDemo  getAllRow()   rowArray   " + Bytes.toString(rowArray));

                byte[] familyArray = CellUtil.cloneFamily(cell);
                logger.info("HBaseDemo  getAllRow()   familyStr   " + Bytes.toString(familyArray));

                byte[] valueArray = CellUtil.cloneValue(cell);
                logger.info("HBaseDemo  getAllRow()   valueArray   " + Bytes.toString(valueArray));

            }
        }

        table.close();
        connection.close();

    }

    /**
     * 删除数据
     *
     * @param tableName 表名
     * @param rowKey    rowkey
     * @throws IOException
     */
    private void deleteData(String tableName, String rowKey) throws IOException {
        Connection connection = ConnectionFactory.createConnection(sConf);
        Table table = connection.getTable(TableName.valueOf(tableName));
        Delete delete = new Delete(Bytes.toBytes(rowKey));
        table.delete(delete);
        table.close();
        connection.close();
    }

    /**
     * 插入数据
     *
     * @param tableName 表名
     * @param rowKey    行
     * @param family    列族
     * @param qualifier 具体的列名称
     * @param value     值
     * @throws IOException
     */
    private void insertData(String tableName, String rowKey, String family, String qualifier, String value) throws IOException {
        //    所有表的操作均为table对象
        Connection connection = ConnectionFactory.createConnection(sConf);
        //获取table对象
        Table table = connection.getTable(TableName.valueOf(tableName));
        //创建put对象 只要是添加一行的操作都是用put进行的
        Put put = new Put(Bytes.toBytes(rowKey));

        //列族 列名 值
        put.addColumn(Bytes.toBytes(family), Bytes.toBytes(qualifier), Bytes.toBytes(value));

        table.put(put);


        table.close();
        connection.close();
    }

    /**
     * 删除表
     *
     * @param tableName 表名称
     */
    private void dropTable(String tableName) throws IOException {
        //    获取连接
        Connection connection = ConnectionFactory.createConnection(sConf);
        Admin admin = connection.getAdmin();

        if (!tableExists(tableName)) {
            //    表不存在
            logger.info("HBaseDemo  dropTable()   数据表【{}】不存在   ", tableName);
            return;
        }

        //判断表是否禁用了
        if (!admin.isTableDisabled(TableName.valueOf(tableName))) {
            //   未禁用
            admin.disableTable(TableName.valueOf(tableName));
        }

        //删除表 必须要将表进行禁用 TableNotDisabledException
        admin.deleteTable(TableName.valueOf(tableName));

        admin.close();
        connection.close();
    }

    /**
     * 删除命名空间
     *
     * @param spaceName
     * @throws IOException
     */
    private void dropNamespace(String spaceName) throws IOException {
        //    获取连接
        Connection connection = ConnectionFactory.createConnection(sConf);
        Admin admin = connection.getAdmin();

        admin.deleteNamespace(spaceName);

        admin.close();
        connection.close();
    }


    /**
     * 创建表
     *
     * @param tableName  表名
     * @param familyName 列族名  可以有多个
     * @throws IOException
     */
    public void createTable(String tableName, String... familyName) throws IOException {
        //通过工厂类获取到连接对象
        Connection connection = ConnectionFactory.createConnection(sConf);
        //通过连接对象获取到操作表的admin对象
        Admin admin = connection.getAdmin();
        //创建表的描述对象
        HTableDescriptor hTableDescriptor = new HTableDescriptor(TableName.valueOf(tableName));

        for (String cf : familyName) {
            //创建列族对象
            HColumnDescriptor family = new HColumnDescriptor(cf);
            //为表的描述对象添加列族对象
            hTableDescriptor.addFamily(family);
        }

        //判断表是否存在
        if (tableExists(tableName)) {
            //    存在即不创建
            logger.info("HBaseDemo  createTable()   数据表已存在   ");
            return;
        }
        //创建表
        admin.createTable(hTableDescriptor);
        logger.info("HBaseDemo  createTable()   创建表【{}】成功   ", tableName);

        admin.close();
        connection.close();
    }


    /**
     * 判断表是否存在
     *
     * @param tableName
     */
    public boolean tableExists(String tableName) throws IOException {
        //获得连接
        Connection connection = ConnectionFactory.createConnection(sConf);
        //获取操作表的admin对象
        Admin admin = connection.getAdmin();
        //判断表是否存在
        boolean result = admin.tableExists(TableName.valueOf(tableName));


        admin.close();
        connection.close();

        return result;
    }


}

MapReduce

通过 HBase 的相关 JavaAPI，我们可以实现伴随 HBase 操作的 MapReduce 过程，比如使用
MapReduce 将数据从本地文件系统导入到 HBase 的表中，比如我们从 HBase 中读取一些原
始数据后使用 MapReduce 做数据分析。

官方的HBASE-MapReduce执行

$ bin/hbase mapredcp

执行环境变量的导入

$ export HBASE_HOME=/home/admin/modules/hbase-1.3.1
$ export HADOOP_HOME=/home/admin/modules/hadoop-2.7.2
$ export HADOOP_CLASSPATH=`${HBASE_HOME}/bin/hbase mapredcp`

运行官方的 MapReduce 任务

– 案例一：统计 Student

$ ~/modules/hadoop-2.7.2/bin/yarn jar lib/hbase-server-1.3.1.jar rowcounter student

– 案例二：用使用 MapReduce 将本地数据导入到 HBase

(1) 在本地创建一个 tsv 格式的文件：fruit.tsv

1001  Apple  Red
1002  Pear Yellow
1003  Pineapple Yellow

(2) 创建 HBase 表

hbase(main):001:0> create 'fruit','info'

(3) 在在 HDFS 中创建 input_fruit 文件夹并上传 fruit.tsv 文件

$ ~/modules/hadoop-2.7.2/bin/hdfs dfs -mkdir /input_fruit/
$ ~/modules/hadoop-2.7.2/bin/hdfs dfs -put fruit.tsv /input_fruit/

(4) 执行 MapReduce 到到 HBase 的的 fruit

$ ~/modules/hadoop-2.7.2/bin/yarn jar lib/hbase-server-1.3.1.jar importtsv \
-Dimporttsv.columns=HBASE_ROW_KEY,info:name,info:color fruit \
hdfs://linux01:8020/input_fruit

（5）使用 scan 命令查看导入后的结果

hbase(main):001:0> scan ‘fruit’

自定义 HBase-MapReduce1

目标：将 fruit 表中的一部分数据，通过 MR 迁入到 fruit_mr 表中

构建 ReadFruitMapper 类，用于读取 fruit 表中的数据


public class ReadFruitMapper extends TableMapper {
    @Override
    protected void map(ImmutableBytesWritable key, Result value, Context context)
            throws IOException, InterruptedException {
//将 fruit 的 name 和 color 提取出来，相当于将每一行数据读取出来放入到 Put 对象中。
        Put put = new Put(key.get());
//遍历添加 column 行
        for (Cell cell : value.rawCells()) {
//添加/克隆列族:info
            if ("info".equals(Bytes.toString(CellUtil.cloneFamily(cell)))) {
//添加/克隆列：name
                if ("name".equals(Bytes.toString(CellUtil.cloneQualifier(cell)))) {
//将该列 cell 加入到 put 对象中
                    put.add(cell);
//添加/克隆列:color
                } else if ("color".equals(Bytes.toString(CellUtil.cloneQualifier(cell)))) {
//向该列 cell 加入到 put 对象中
                    put.add(cell);
                }
            }
        }//将从 fruit 读取到的每行数据写入到 context 中作为 map 的输出
        context.write(key, put);
    }
}

构建 WriteFruitMRReducer 类，用于将读取到的 fruit 表中的数据写入到 fruit_mr 表中


public class WriteFruitMRReducer extends TableReducer {
    @Override
    protected void reduce(ImmutableBytesWritable key, Iterable values, Context context)
            throws IOException, InterruptedException {
//读出来的每一行数据写入到 fruit_mr 表中
        for (Put put : values) {
            context.write(NullWritable.get(), put);
        }
    }
}

构建 Fruit2FruitMRRunner extends Configured implements Tool 用于组装运行 Job 任务

//组装 Job
    public int run(String[] args) throws Exception {
        //得到 Configuration
        Configuration conf = this.getConf();
        //创建 Job 任务
        Job job = Job.getInstance(conf, this.getClass().getSimpleName());
        job.setJarByClass(Fruit2FruitMRRunner.class);
        //配置 Job
        Scan scan = new Scan();
        scan.setCacheBlocks(false);
        scan.setCaching(500);
        //设置 Mapper，注意导入的是 mapreduce 包下的，不是 mapred 包下的，后者是老 版本
        TableMapReduceUtil.initTableMapperJob(
                "fruit", //数据源的表名
                scan, //scan 扫描控制器
                ReadFruitMapper.class,//设置 Mapper 类
                ImmutableBytesWritable.class,//设置 Mapper 输出 key 类型
                Put.class,//设置 Mapper 输出 value 值类型
                job//设置给哪个 JOB
        );
        //设置 Reducer
        TableMapReduceUtil.initTableReducerJob("fruit_mr", WriteFruitMRReducer.class,
                job);
        //设置 Reduce 数量，最少 1 个
        job.setNumReduceTasks(1);
        boolean isSuccess = job.waitForCompletion(true);
        if (!isSuccess) {
            throw new IOException("Job running with error");
        }
        return isSuccess ? 0 : 1;
    }
    
	public static void main( String[] args ) throws Exception{
		Configuration conf = HBaseConfiguration.create();
		int status = ToolRunner.run(conf, new Fruit2FruitMRRunner(), args);
		System.exit(status);
	}

打包运行

$ ~/modules/hadoop-2.7.2/bin/yarn jar ~/softwares/jars/hbase-0.0.1-SNAPSHOT.jar
com.z.hbase.mr1.Fruit2FruitMRRunner

自定义 HBase-MapReduce2

目标：实现将 HDFS 中的数据写入到 HBase 表中

构建 ReadFruitFromHDFSMapper 于读取 HDFS 中的文件数据

public class ReadFruitFromHDFSMapper extends Mapper {
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException,
            InterruptedException {
//从 HDFS 中读取的数据
        String lineValue = value.toString();
//读取出来的每行数据使用\t 进行分割，存于 String 数组
        String[] values = lineValue.split("\t");
//根据数据中值的含义取值
        String rowKey = values[0];
        String name = values[1];
        String color = values[2];
//初始化 rowKey
        ImmutableBytesWritable rowKeyWritable = new
                ImmutableBytesWritable(Bytes.toBytes(rowKey));
//初始化 put 对象
        Put put = new Put(Bytes.toBytes(rowKey));
//参数分别:列族、列、值
        put.add(Bytes.toBytes("info"), Bytes.toBytes("name"), Bytes.toBytes(name));
        put.add(Bytes.toBytes("info"), Bytes.toBytes("color"), Bytes.toBytes(color));
        context.write(rowKeyWritable, put);
    }
}

构建 WriteFruitMRFromTxtReducer


public class WriteFruitMRFromTxtReducer extends TableReducer {
    @Override
    protected void reduce(ImmutableBytesWritable key, Iterable values, Context context)
            throws IOException, InterruptedException {
//读出来的每一行数据写入到 fruit_hdfs 表中
        for(Put put: values){
            context.write(NullWritable.get(), put);
        }
    }
}

创建 Txt2FruitRunner 组装 Job

 public int run(String[] args) throws Exception {
//得到 Configuration
        Configuration conf = this.getConf();
//创建 Job 任务
        Job job = Job.getInstance(conf, this.getClass().getSimpleName());
        job.setJarByClass(Txt2FruitRunner.class);
        Path inPath = new Path("hdfs://linux01:8020/input_fruit/fruit.tsv");
        FileInputFormat.addInputPath(job, inPath);
//设置 Mapper
        job.setMapperClass(ReadFruitFromHDFSMapper.class);
        job.setMapOutputKeyClass(ImmutableBytesWritable.class);
        job.setMapOutputValueClass(Put.class);
//设置 Reducer
        TableMapReduceUtil.initTableReducerJob("fruit_mr", WriteFruitMRFromTxtReducer.class, job);
//设置 Reduce 数量，最少 1 个
        job.setNumReduceTasks(1);
        boolean isSuccess = job.waitForCompletion(true);
        if(!isSuccess){
            throw new IOException("Job running with error");
        }
        return isSuccess ? 0 : 1;
    }

与hive的集成

环境准备

因为我们后续可能会在操作 Hive 的同时对 HBase 也会产生影响，所以 Hive 需要持有操作
HBase 的 Jar，那么接下来拷贝 Hive 所依赖的 Jar 包（或者使用软连接的形式）

$ export HBASE_HOME=/home/admin/modules/hbase-1.3.1
$ export HIVE_HOME=/home/admin/modules/apache-hive-1.2.2-bin
$ ln -s $HBASE_HOME/lib/hbase-common-1.3.1.jar
$HIVE_HOME/lib/hbase-common-1.3.1.jar
$ ln -s $HBASE_HOME/lib/hbase-server-1.3.1.jar $HIVE_HOME/lib/hbase-server-1.3.1.jar
$ ln -s $HBASE_HOME/lib/hbase-client-1.3.1.jar $HIVE_HOME/lib/hbase-client-1.3.1.jar
$ ln -s $HBASE_HOME/lib/hbase-protocol-1.3.1.jar $HIVE_HOME/lib/hbase-protocol-1.3.1.jar
$ ln -s $HBASE_HOME/lib/hbase-it-1.3.1.jar $HIVE_HOME/lib/hbase-it-1.3.1.jar
$ ln -s $HBASE_HOME/lib/htrace-core-3.1.0-incubating.jar
$HIVE_HOME/lib/htrace-core-3.1.0-incubating.jar
$ ln -s $HBASE_HOME/lib/hbase-hadoop2-compat-1.3.1.jar
$HIVE_HOME/lib/hbase-hadoop2-compat-1.3.1.jar
$ ln -s $HBASE_HOME/lib/hbase-hadoop-compat-1.3.1.jar
$HIVE_HOME/lib/hbase-hadoop-compat-1.3.1.jar

同时在 hive-site.xml 中修改 zookeeper 的属性，如下：


	hive.zookeeper.quorum
	linux01,linux02,linux03
	The list of ZooKeeper servers to talk to. This is only needed for read/write
	locks.


	hive.zookeeper.client.port
	2181
	The port of ZooKeeper servers to talk to. This is only needed for read/write
	locks.

案例一一
目标：建立 Hive 表，关联 HBase 表，插入数据到 Hive 表的同时能够影响 HBase 表。
分步实现：

(1) 在在 Hive 中创建表同时关联 HBase

CREATE TABLE hive_hbase_emp_table(
empno int,
ename string,
job string,
mgr int,
hiredate string,
sal double,
comm double,
deptno int)STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" =
":key,info:ename,info:job,info:mgr,info:hiredate,info:sal,info:comm,info:deptno")
TBLPROPERTIES ("hbase.table.name" = "hbase_emp_table");

完成之后，可以分别进入 Hive 和 HBase 查看，都生成了对应的表

(2) 在在 Hive 中创建临时中间表，用于 load 文件中的数据

不能将数据直接 load 进 Hive 所关联 HBase 的那张表中

CREATE TABLE emp(
empno int,
ename string,
job string,
mgr int,
hiredate string,
sal double,
comm double,
deptno int)
row format delimited fields terminated by '\t';

(3) 向向 Hive 中间表中 load 数据

hive> load data local inpath '/home/admin/softwares/data/emp.txt' into table emp;

(4) 通过 insert 命令将中间表中的数据导入到 Hive 关联 HBase

hive> insert into table hive_hbase_emp_table select * from emp;

(5) 查看 Hive 以及关联的 HBase
Hive

hive> select * from hive_hbase_emp_table;

HBase ：

hbase> scan ‘hbase_emp_table’

案例二

目标：在 HBase 中已经存储了某一张表 hbase_emp_table，然后在 Hive 中创建一个外部表来
关联 HBase 中的 hbase_emp_table 这张表，使之可以借助 Hive 来分析 HBase 这张表中的数
据。
注：该案例 2 紧跟案例 1 的脚步，所以完成此案例前，请先完成案例 1。

(1) 在在 Hive 中创建外部表

CREATE EXTERNAL TABLE relevance_hbase_emp(
empno int,
ename string,
job string,
mgr int,
hiredate string,
sal double,
comm double,
deptno int)
STORED BY
'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" =
":key,info:ename,info:job,info:mgr,info:hiredate,info:sal,info:comm,info:deptno")
TBLPROPERTIES ("hbase.table.name" = "hbase_emp_table");

关联后就可以使用 Hive 函数进行一些分析操作了

hive (default)> select * from relevance_hbase_emp;

与sqoop的集成

参数	描述
–column-family	Sets the target column family for the import设置导入的目标列族。
–hbase-create-table	If specified, create missing HBase tables是否自动创建不存在的 HBase 表（这就意味着，不需要手动提前在 HBase 中先建立表）
–hbase-row-key
Specifies which input column to use as the rowkey.In case, if input table contains compositekey, then
–hbase-table	Specifies an HBase table to use as the targetinstead of HDFS.指定数据将要导入到 HBase 中的哪张表中。
–hbase-bulkload	Enables bulk loading.是否允许 bulk 形式的导入。

常用的shell操作

satus 显示服务器状态

hbase> status ‘linux01’

whoami 显示 HBase 当前用户

    hbase> whoami

list 显示当前所有的表

    hbase> list

count统计指定表的记录数

    hbase> count 'hbase_book'

describe 展示表结构信息

    hbase> describe 'hbase_book'

exist 检查表是否存在，适用于表量特别多的情况

    hbase> exist 'hbase_book'

is_enabled/is_disabled 检查表是否启用或禁用

    hbase> is_enabled 'hbase_book'
    hbase> is_disabled 'hbase_book'

alter 该命令可以改变表和列族的模式

    为当前表增加列族：
    hbase> alter 'hbase_book', NAME => 'CF2', VERSIONS => 2
    为当前表删除列族：
    hbase> alter 'hbase_book', 'delete' => ’CF2’

disable 禁用一张表

hbase> disable 'hbase_book'

drop 删除一张表，记得在删除表之前必须先禁用

hbase> drop 'hbase_book'

delete 删除一行中一个单元格的值

hbase> delete ‘hbase_book’, ‘rowKey’, ‘CF:C’

truncate 清空表数据，即禁用表-删除表-创建表

hbase> truncate 'hbase_book'

create 创建表

hbase> create ‘table’, ‘cf’

创建多个列族：

hbase> create 't1', {NAME => 'f1'}, {NAME => 'f2'}, {NAME => 'f3'}

数据的备份与操作

备份

停止 HBase 服务后，使用 distcp 命令运行 MapReduce 任务进行备份，将数据备份到另一个
地方，可以是同一个集群，也可以是专用的备份集群。
即，把数据转移到当前集群的其他目录下（也可以不在同一个集群中）:

$ bin/hadoop distcp \
hdfs://linux01:8020/hbase \
hdfs://linux01:8020/HbaseBackup/backup20171009

执行该操作，一定要开启 Yarn 服务

恢复

$ bin/hadoop distcp \
hdfs://linux01:8020/HbaseBackup/backup20170930 \
hdfs://linux01:8020/hbase

节点的管理

服役（（commissioning ）

当启动 regionserver 时，regionserver 会向 HMaster 注册并开始接收本地数据，开始的时候，
新加入的节点不会有任何数据，平衡器开启的情况下，将会有新的 region 移动到开启的
RegionServer 上。如果启动和停止进程是使用 ssh 和 HBase 脚本，那么会将新添加的节点的
主机名加入到 conf/regionservers 文件中。

退役（（decommissioning ）

顾名思义，就是从当前 HBase 集群中删除某个 RegionServer，这个过程分为如下几个过程：

停止负载平衡器

hbase> balance_switch false

在退役止节点上停止 RegionServer

hbase> hbase-daemon.sh stop regionserver

RegionServer 一旦停止，会关闭维护的所有 region
Zookeeper 上的该 RegionServer 节点消失
Master 节点检测到该 RegionServer 下线
RegionServer 的的 region 服务得到重新分配
该关闭方法比较传统，需要花费一定的时间，而且会造成部分 region 短暂的不可用。

另一种方案：

RegionServer 先卸载所管理的 region

$ bin/graceful_stop.sh

自动平衡数据
和之前的 2~6

版本的确界

版本的下界
默认的版本下界是 0，即禁用。row 版本使用的最小数目是与生存时间（TTL Time To Live）
相结合的，并且我们根据实际需求可以有 0 或更多的版本，使用 0，即只有 1 个版本的值写
入 cell。
版本的上界
之前默认的版本上界是 3，也就是一个 row 保留 3 个副本（基于时间戳的插入）。该值不要
设计的过大，一般的业务不会超过 100。如果 cell 中存储的数据版本号超过了 3 个，再次插
入数据时，最新的值会将最老的值覆盖。（现版本已默认为 1）

本博客仅为博主学习总结，感谢各大网络平台的资料。蟹蟹!!

你可能感兴趣的:(HBase部署与使用)

Android Room使用方法与底层原理详解你过来啊你 android room
Room是一个强大的SQLite对象映射库，旨在提供更健壮、更简洁、更符合现代开发模式的数据库访问方式。核心价值：消除大量样板代码，提供编译时SQL验证，强制结构化数据访问，并流畅集成LiveData、Flow和RxJava以实现响应式UI。一、使用流程(Step-by-StepWorkflow)Room的使用遵循一个清晰的结构化流程：添加依赖：//build.gradle(Module)depe
2023-05-09 论文小天才
2023年社会科学、人文艺术与文化国际会议（SSHAC2023)大会简介2023年社会科学、人文、艺术和文化国际会议（SSHAC2023）将在四川省成都市举行。会议旨在为从事“社会科学”和“人文艺术”研究的专家学者提供一个平台，分享科研成果和前沿技术，了解学术发展趋势，拓宽研究思路，加强学术研究和讨论，促进学术成果产业化合作。大会邀请了来自国内外高校和研究机构的专家、学者、企业家等相关人员。热忱欢
《自由人生》读书笔记 2 西红柿阿达
原文:问题：“人生有何意义？”其实这个问题是容易解答的。人生的意义全是各人自己寻出来，造出来的：高尚、卑劣、清贵、污浊、有用、无用……全靠自己的作为。生命本身不过是一件生物学的事实，有什么意义可说？生一个人与一只猫、一只狗，有什么分别？人生的意义不在于何以有生，而在于自己怎样生活。你若情愿把这六尺之躯葬送在白昼做梦之上，那就是你这一生的意义。你若发愤振作起来，决心去寻求生命的意义，去创造自己的生命
【Python】(三）面试题和Py基础题戏精亿点点菜面试职场和发展 python
1.技术面试题（1）解释Linux中的进程、线程和守护进程的概念，以及如何管理它们？答：进程（Process）：进程是操作系统中资源分配的基本单位，是正在运行的程序的实例。每个进程都有自己的内存空间、文件描述符和执行上下文。管理：①查看进程：使用ps、top、htop等命令查看当前运行的进程。②启动进程：通过命令行或脚本启动新进程。③终止进程：使用kill命令发送信号终止进程，例如kill-9PI
家庭服务具身智能机器人体系架构
硬件方面：差速移动机器人+六轴协作机械臂，软件方面选择ROS系统：底盘控制move_group，机械臂操纵MoveIt，大模型方面采用VLM+LLM：（1）视觉语言模型（VLM），用来实现环境理解与指令解析，候选模型为LLaVA和Qwen-VL。微调VLM需要2~4周，工作量主要是准备环境数据和标注期望输出。（2）大语言模型（LLM），用来实现任务分解与技能调用，候选工具有LangChain（任务
M3088NL是一款网络滤波器/变压器支持100M和1000M网络环境，适用于高速网络传输场景M3088 Shang13113048791 网络边缘计算图像处理信号处理
M3088NL是一款网络滤波器/变压器，主要特点如下：兼容性支持100M和1000M网络环境，适用于高速网络传输场景。‌封装形式采用SOP/SOIC封装，便于电路集成。‌应用场景常用于网络电话、开关电源等需要稳定电流的设备，符合IEEE802.3af标准。‌性能参数‌•电流能力‌：350mA•‌传输方式‌：需1:1的传输和收发器配合使用‌•‌安全标准‌：符合ROHS环保标准•标准‌：符合IEEE8
python小工具：测内网服务器网速和延迟秃了也弱了。 python大家庭服务器 python java
文章目录一、使用1、代码2、使用3、注意事项一、使用1、代码importargparseimportsocketimporttimeimportsubprocessimportreimportsysdefmeasure_latency(host):#使用ping命令测量延迟try:#根据操作系统选择ping参数ifsys.platform.startswith('win'):output=subp
学习与财富同行：大学生校园内的多元赚钱之路高省飞智导师
随着经济的发展和社会的进步，越来越多的人开始关注学校里的赚钱项目。这些项目不仅能为学校带来收益，同时也能为创业者提供很多商机。那么，学校里究竟有哪些赚钱项目呢？下面就为大家详细介绍一下。一、校园快递代领服务随着网购的普及，校园快递业务也日益繁忙。学生们常常因为上课、兼职等原因无法及时领取包裹，这时候校园快递代领服务应运而生。这个项目需要有一定的组织和协调能力，以及对校园环境的熟悉程度。通过与快递公
Haproxy七层代理陈小铃子学习运维 linux
一、负载均衡核心概念它本质上是一种反向代理技术，通过硬件或软件设备，将来自客户端的请求智能地分发到后端的多台服务器上。这样做的主要目的是：提高并发处理能力：避免单台服务器过载，提升整体服务的吞吐量。保证高可用性：当某台后端服务器发生故障时，负载均衡器可以将流量自动切换到健康的机器上，确保服务不中断。便于水平扩展：可以根据业务量增长，方便地增加后端服务器数量，实现弹性伸缩，且对用户透明。二、使用负载
JAVA学习-行为抽象和Lambda.Lambda表达式守护者170 java学习 java 学习开发语言
行为抽象和Lambda表达式是Java8引入的新特性，用于简化代码和提高代码的可读性。一、概述、特点、使用方法以及与其他比较和高级应用的说明：1.行为抽象：它是指将一段代码抽象为一种功能或行为，以便在需要时可以传递给其他方法或对象。行为抽象通常通过接口来定义，其中接口包含一个或多个抽象方法来表示不同的功能。2.Lambda表达式：Lambda表达式是一种简洁的语法，用于实现行为抽象。它可以替代匿名
Redis——BigKey A2274 Java 面试 #Redis redis java BigKey
BigKey1多大算BigKey？阿里云Redis开发规范：string类型的数据控制在10KB以内，hash,list,set,zset元素数量不要超过5000。非字符串的BigKey，不要使用del删除，而是使用hsacn,sscan,zscan方式渐进式删除。同时，要防止BigKey过期时自动删除，因为自动删除会使用del指令。2.BigKey有什么危害？如果没有配置Redis非阻塞删除，则
okhttp xxx Android10Platform, sslSocketFactory is class com.android.org.conscrypt.OpenSSLSocketFact mmsx Android 常用开发技术 okhttp android
问题分析这个错误通常表示在Android10平台上，OkHttp在处理SSL/TLS连接时，无法正确提取信任管理器（TrustManager）。sslSocketFactory显示为com.android.org.conscrypt.OpenSSLSocketFactoryImpl，这是Android系统默认的SSL套接字工厂。问题可能出在信任管理器的配置或者与Android10的兼容性上。可能原
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
android tabLayout 切换fragment fragment生命周期 mmsx Android 常用开发技术 android tab TabLayout fragment
1、TabLayout与Fragment结合使用的常见方式通常会使用FragmentPagerAdapter或FragmentStatePagerAdapter与ViewPager配合，再将TabLayout与ViewPager关联，实现通过TabLayout切换Fragment。以下是布局文件示例activity_main.xml：
【MoodVine】DeepSeek聊天持久化（2）：Spring AI + Redis实现对话记忆管理一只鱼吖【西瓜和晚霞】MoodVine spring redis java
在上一篇文章中，我们介绍了如何引入SpringAI，本文将深入探讨如何实现聊天记录的持久化存储。一、初始方案：内存存储的局限性在项目初期，我们使用简单的内存存储实现聊天记录管理：创建ChatController@RestController@RequestMapping("/chat")publicclassChatController{privatefinalOllamaChatModeloll
刘萍萍老师《基于新课标的情境活动与学习任务群设计策略》学习青箬笠0
刘萍萍新乡市基础教育教学研究室“让学生直接思考真实问题有助于激发和唤醒学生的理解。”（「美]格兰特·威金斯·「美」杰伊·麦克泰格《追求理解的教学设计》P44）所以要设计情境活动。一、情境活动与学习任务群概念从何而来“考试命题应以情境为载体，依据学生在真实情境下解决问题的过程和结果评定其素养水平。日常生活情境指向真实具体的社会生活，关注学生在生活场景中的语言实践，凸显语言交际活动的对象、目的和表述方
淘宝上的无门槛优惠券是什么意思?淘宝无门槛优惠券怎么抢好项目高省
淘宝上的无门槛优惠券是指消费者在购物时，不需要满足特定的消费金额、购买商品类别、消费次数等条件，就可以直接使用的优惠券，以享受一定的折扣或优惠。这种优惠券的使用限制较少，为消费者提供了更大的灵活性和实惠。具体来说，无门槛优惠券的特点包括：无消费金额限制：与有门槛优惠券（如满减券）不同，无门槛优惠券没有消费金额的要求，无论购买商品的金额多少都可以使用。适用范围可能较窄：虽然无门槛优惠券在使用上更为灵
来宾亲子鉴定准确度高吗？来宾上户口亲子鉴定怎么做【附最新办理流程】中正DNA鉴定中心
来宾亲子鉴定准确度高吗？在广西来宾做亲子鉴定准确度非常高，只要选择正规有资质的鉴定机构，出具结果是有保障的，不管是个人隐私还是司法用途，虽然办理流程和报告用途有区别，检测实验流程一样，准确度非常精准。有关来宾上户口亲子鉴定怎么做也是咨询比较多的话题，下面第四点详细解答。一、亲子鉴定的方法亲子鉴定是目前最科学、准确的判断亲子关系的方法，依赖DNA分析技术，对比测序样本DNA后，实验室内精确辨识个体与
Valentino耳饰怎么买便宜？便宜又好看女生耳钉在哪买直返APP拼多多优惠券
在时尚的世界里，Valentino耳饰以其独特的设计和精湛的工艺，成为了众多时尚爱好者追捧的焦点。今天，让我们一同来领略Valentino耳饰的魅力所在。Valentino耳饰是对优雅与时尚的完美诠释。每一款耳饰都仿佛是一件艺术品，精心雕琢，细节之处尽显匠心。从华丽的宝石镶嵌到精致的金属纹理，每一个元素都在诉说着品牌的奢华与独特。戴上Valentino耳饰，瞬间便能提升整体造型的档次与气质。无论是
京东618最省钱的攻略，超级大红包领取方法！氧惠好物
现在京东一年一度的购物节马上就要来了，就是京东618购物活动了。那么京东的618活动一般什么时候去买是最划算？有什么优惠活动？下面给大家讲述一下。京东将618的活动分为预热期-专场期-高潮期-返场期京东密令红包：最爱领红包828红包多多148购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超
唯品会如何免5元运费？唯品会无门槛优惠券免费领取是真的吗日常购物小技巧
揭秘唯品会免5元运费秘籍与无门槛优惠券使用方法在电商时代，优惠券和免运费活动层出不穷，吸引着广大消费者。唯品会作为一家知名的电商平台，也时常推出各种优惠活动。本文将为您揭秘如何在唯品会免5元运费以及无门槛优惠券免费领取的使用方法。一、唯品会免5元运费攻略1.会员专享：唯品会会员可享受免5元运费的优惠。而非会员则需支付5元运费。因此，建议用户在购物时优先考虑是否需要购买会员。2.活动参与：唯品会时常
怎样挑到一件好的高仿maxmara羽绒服？高端顶级奢侈品
怎样挑到一件好的高仿maxmara羽绒服？MaxMara是意大利风格的象征标志，其成衣系列独具高级定制女装的剪裁设计、奢华材质以及精致细节，彰显了这一品牌系列的优雅自信与现代品味。MaxMara由极富远见的AchilleMaramotti创立于1951年，以其时尚的外套、简约的单品、干练的西装和优雅的配饰而闻名。MaxMara系列如今远销90多个国家和地区，共有2254个销售网点，而且是MaxMa
Gson、Fastjson 和 Jackson 对比解析小张0.0 JavaWeb json
目录1.Gson(Google)基本介绍：核心功能：特点：使用场景：2.Fastjson(Alibaba)基本介绍：核心功能：特点：使用场景：3.Jackson基本介绍：核心功能：特点：使用场景：4.对比总结5.选择建议Gson、Fastjson和Jackson这三种都是Java生态中广泛使用的JSON处理库，用于实现Java对象与JSON数据之间的相互转换。在项目中使用不同的方法即可调用不同的J
redis-plus-plus安装与使用 Yu_Lijing redis 数据库缓存
目录一.安装hiredis二.接口三.使用四.总结C++操作redis的库有很多.咱们使用redis-plus-plus.这个库的功能强大,使用简单.Github地址:https://github.com/sewenew/redis-plus-plus一.安装hiredisredis-plus-plus是基于hiredis实现的.hiredis是一个C语言实现的redis客户端.因此需要先安装hi
如何丝滑地切换node版本 up阳光正好 node
背景由于有些比较老的系统，使用的node版本较低，本机装的node版本又比较高，不想降node版本，那么就需要考虑能不能在系统里管理多个node版本呢？由于我使用的操作系统是Mac，下面将主要讲解如何在Mac上快速切换不同的node版本。安装n模块sudonpminstall-gn升级node到最新版sudonlatest安装指定版本的node#可以带v，也可以不带vsudonv0.10.26su
MacOS 安装k8s MartinDai1993 macos kubernetes 容器
安装前准备确保本地已经安装并启动好了DockerDesktop拉取k8s镜像（如果本地网络好可以正常拉取到k8s官方镜像，可以跳过这一步）克隆git仓库到本地gitclonehttps://github.com/gotok8s/k8s-docker-desktop-for-mac.git进入项目目录，执行./load_images.sh等待所有镜像拉取完成部署k8s进入DockerDecktop的
10分钟搞定 MinIO 单节点多磁盘部署！打造稳定高可用对象存储【二】
MinIO是一个**高性能、开源的对象存储系统**，主要用于存储非结构化数据（如图片、视频、文档、备份等），与AmazonS3完全兼容。它被广泛用于云原生应用、大数据分析、AI模型存储、容器平台（如Kubernetes）等场景。MinIO支持多种部署模式，其中：单节点单磁盘（Single-NodeSingle-Drive）模式适用于开发测试、小规模应用或资源受限的场景。它的部署简单，不依赖集群、分
收视率怎么赚钱？这篇文章为你揭秘电视剧怎么赚钱的氧惠全网优惠
现在的人们几乎都是有刷剧的习惯，我们忙完了一天的工作以后都是会看上有些东西，也是成为了我们生活当中必不可少的一个娱乐项目，甚至好多人为了看电视剧可以熬一整个通宵，目的就是看到他们最后的大结局。氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。古
擦肩过往无名冬辰
图片发自App如果三年前没有与你擦肩，是否就永远无法相识？在喧哗的繁华都市里，在匆忙麻木的人群里，善良纯洁的你走入了我的世界。在每个思念浸满黑夜的岁月里，新的记忆循序萌发然后渐进死亡。沿路上你孤独的背影淹没了我的微笑。青春褪去了原来的色泽，黑白颠倒了我余下的年华。我脱离了你的世界，永远的活在你看不到的空间里关注你。而你忘记了我，与喜欢的人过着我们从前一直盼望的生活。从此你的世界没有了我。那个冗长的
顺丰速运怎么领取优惠券,顺丰快递优惠券如何领取及使用? 高省APP
顺丰速运作为我国知名的快递公司，一直以优质的服务和高效的配送赢得了广大用户的喜爱。为了让用户更好地享受寄件服务，顺丰速运推出了多种优惠券活动，那么如何领取和使用这些优惠券呢？本文将为您详细介绍。一、顺丰速运优惠券领取方式1.顺丰速运APP领取首先，用户需要下载并安装顺丰速运APP。在APP首页或者个人中心，您可以找到优惠券领取入口。点击进入后，您可以根据自己的需求选择不同的优惠券类型，如寄件优惠券
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

HBase部署与使用

HBase部署与使用

概述

HBase的角色

HMaster

RegionServer

HBase的架构

HBase部署与使用

部署

简单使用

读写流程

JAVAAPI

MapReduce

与hive的集成

与sqoop的集成

常用的shell操作

数据的备份与操作

备份

恢复

节点的管理

服役（ （commissioning ）

退役（ （decommissioning ）

版本的确界

你可能感兴趣的:(HBase部署与使用)

服役（（commissioning ）

退役（（decommissioning ）