奇妙的代码

HBase 基础

HBase
- 1. HBase简介
- - 1.1 HBase定义
  - 1.2 HBase数据模型
  - - 1.2.1 HBase逻辑结构
    - 1.2.2 HBase物理存储结构
    - 1.2.3 数据模型
  - 1.3 HBase基本架构
- 2. HBase环境安装
- - 2.1 HBase 安装部署
  - - 2.1.1 HBase 本地按照
    - 2.1.2 HBase 伪分布模式安装
    - 2.1.3 HBase 集群安装
  - 2.2 HBase Shell操作
  - - 2.2.1 DDL操作
    - 2.2.2 DML 操作
- 3. HBase 的 Java API

HBase

1. HBase简介

1.1 HBase定义

HBase 是一种分布式、可扩展、支持海量数据存储的 NOSQL 数据库。

1.2 HBase数据模型

逻辑上，HBase 的数据模型同关系型数据库很类似，数据存储在一张表中，有行有列。

但从HBase 的底层物理存储结构(K-V) 来看，HBase 更像是一个 multi-dimensionalmap。

HBase 的设计理念依据 Google 的 BigTable 论文，论文中对于数据模型的首句介绍。BigTable 是一个稀疏的、分布式的、持久的多维排序 map。
之后对于映射的解释如下:
该映射由行键、列键和时间戳索引；映射中的每个值都是一个未解释的字节数组。

最终 HBase 关于数据模型和 BigTable 的对应关系如下：

HBase 使用与 BigTable 非常相似的数据模型。用户将数据行存储在带标签的表中。数据行具有可排序的键和任意数量的列。该表存储稀疏，因此如果用户喜欢，同一表中的行可以具有疯狂变化的列。
最终理解 HBase 数据模型的关键在于稀疏、分布式、多维、排序的映射。其中映射 map指代非关系型数据库的 key-Value 结构。

1.2.1 HBase逻辑结构

1.2.2 HBase物理存储结构

1.2.3 数据模型

Name Space

命名空间，类似于关系型数据库的 database 概念，每个命名空间下有多个表。Hbase 有两个自带的命名空间，分别是 hbase 和 default；hbase 中存放的是 HBase 内置的表，default表是用户默认使用的命名空间。

Region

类似于关系型数据库的表概念。不同的是，HBase 定义表时只需要声明列族即可，不需要声明具体的列。这意味着，往 HBase 写入数据时，字段可以动态、按需指定。因此，和关系型数据库相比，HBase 能够轻松应对字段变更的场景。

HBase表中的每行数据都由一个 RowKey 和多个 Column (列)组成，数据是按照 RowKey的字典顺序存储的，并且查询数据时只能根据 RowKey 进行检索，所以 RowKey 的设计十分重要

Column

HBase 中的每个列都由 Column Family(列族)和 Column Qualifier (列限定符)进行限定，例如 info: name，info:age。建表时，只需指明列族，而列限定符无需预先定义。

Time Stamp

用于标识数据的不同版本 (version)，每条数据写入时，如果不指定时间戳，系统会自动为其加上该字段，其值为写入 HBase 的时间。

Cell

由{ rowkey, column Family: column Qualifier, time Stamp }唯一确定的单元。cell 中的数据是没有类型的，全部是字节码形式存贮。

1.3 HBase基本架构

2. HBase环境安装

我为各位提供了 env-hadoop-3.3.5-zookeeper-3.8.2.tar.gz 文件

这个压缩包内置了 Hadoop 和 Zookeeper 环境的一键部署指令，将这个压缩包放到 /root 下解压后，使用 launcher 指令可以实现一键部署并启动这个集群环境，具体执行命令如下，等待大概十分钟左右，脚本会自动启动 HDFS 和 Zookeeper 的集群环境，方便各位同学做后面的 HBase 的安装实验

[root@c7100 ~]# tar -zxvf env-hadoop-3.3.5-zookeeper-3.8.2.tar.gz
[root@c7100 ~]# /root/env/sh/launcher

需要注意的是：

本教程中给出的是完整的 HBase 的安装步骤，如果是使用我发的 env-hadoop-3.3.5-zookeeper-3.8.2.tar.gz 来进行一键部署 Hadoop 和 Zookeeper 的同学，使用 hstart 和 hstop 也可以实现 hdfs 的手动启动和停止，使用 zk start 和 zk stop 也可以实现 Zookeeper 的手动启动和停止
使用 launcher 指令的使用前提：应当确保三台 Linux 系统相互能免密登录。
使用 launcher 指令来进行一键部署的时候，只能使用一次，再次使用可能结果不是预期

2.1 HBase 安装部署

2.1.1 HBase 本地按照

将 hbase-2.4.17-bin.tar.gz 文件上传到 CentOS 并解压到 opt 目录

mkdir /opt/apache/
tar -zxvf hbase-2.4.17-bin.tar.gz -C /opt/apache/

使用 vim 修改 HBase 的配置文件 /opt/apache/hbase-2.4.17/conf/hbase-site.xml

configuration>  
  <property>
    <name>hbase.rootdirname>
    <value>file:///opt/apache/data/hbase/rootdirvalue>>
    <description>HBase 根目录，这里需要在地址前增加 file:// 协议description>
  property>
  <property>
    <name>hbase.cluster.distributedname>
    <value>falsevalue>
    <description>是否开启 HBase 分布式集群description>
  property>
  <property>
    <name>hbase.tmp.dirname>
    <value>/opt/apache/data/hbase/tmpvalue>
    <description>指定 HBase 临时目录description>
  property>
  <property>
    <name>hbase.unsafe.stream.capability.enforcename>
    <value>falsevalue>
    <description>控制 HBase 是否检查流功能（hflush/hsync）description>
  property>
configuration>

要注意，目录 /opt/apache/data/hbase 需要提前创建的

创建 HBase 的环境变量文件 /etc/profile.d/env-hbase.sh，内容如下：

HBASE_HOME=/opt/apache/hbase-2.4.17
PATH=$PATH:$HBASE_HOME/bin
export HBASE_HOME PATH

完成后，需要使用 source /etc/profile 使其立即生效

开放防火墙端口 16010

firewall-cmd --add-port=16010/tcp --permanent
firewall-cmd --reload

启动 HBase

start-hbase.sh

2.1.2 HBase 伪分布模式安装

强烈建议在学习 HBase 的初期采用伪分布模式来安装

启动 Zookeeper（前提是已经安装了 Zookeeper）

[root@c7100 ~]# zkServer.sh start
[root@c7101 ~]# zkServer.sh start

启动 Hadoop 的 HDFS（前提是已经安装了 Hadoop）

[root@c7100 ~]# start-dfs.sh

HBase的解压

[root@c7100 ~]# cd /opt/apache
[root@c7100 apache]# tar -zxvf hbase-2.5.5-bin.tar.gz

HBase的配置文件

① 修改 hbase-env.sh 文件，内容如下，修改完成之后需要使用 source 命令使其生效！

# Tell HBase whether it should manage it's own instance of ZooKeeper or not.
# export HBASE_MANAGES_ZK=true
export HBASE_MANAGES_ZK=false

② 修改配置文件 hbase-site.xml 文件，内容如下

<configuration>
  <property>
    <name>hbase.rootdirname>
    <value>hdfs://c7100.vm:9000/hbasevalue>
    <description>The directory shared by region servers and into which HBase persists.description>
  property>
  <property>
    <name>hbase.cluster.distributedname>
    <value>truevalue>
    <description>
      The mode the cluster will be in.
      Possible values are false for standalone mode and true for distributed mode. 
      If false, startup will run all HBase and ZooKeeper daemons together in the one JVM.
    description>
  property>
  <property>
    <name>hbase.tmp.dirname>
    <value>/opt/apache/data/hbase/tmp/hbase-${user.name}value>
    <description>
      Temporary directory on the local filesystem.
      Change this setting to point to a location more permanent than '/tmp',
      the usual resolve for java.io.tmpdir,
      as the '/tmp' directory is cleared on machine restart.
    description>
  property>
  <property>
    <name>hbase.unsafe.stream.capability.enforcename>
    <value>falsevalue>
  property>
  <property>
    <name>hbase.zookeeper.quorumname>
    <value>c7100.vm,c7101.vm,c7102.vmvalue>
    <description>
      Comma separated list of servers in the ZooKeeper ensemble
      (This config. should have been named hbase.zookeeper.ensemble).
      For example, "host1.mydomain.com,host2.mydomain.com,host3.mydomain.com".
    description>
  property>
  <property>
    <name>hbase.zookeeper.property.dataDirname>
    <value>/opt/apache/data/zookeepervalue>
    <description>
      Property from ZooKeeper's config zoo.cfg. The directory where the snapshot is stored.
    description>
  property>
  <property>
    <name>hbase.wal.providername>
    <value>filesystemvalue>
    <description>write ahead logdescription>
  property>
configuration>

③解决 log4j 的 jar 包冲突

mv /opt/apache/hbase-2.4.17/lib/client-facing-thirdparty/slf4j-reload4j-1.7.33.jar /opt/apache/hbase-2.4.17/lib/client-facing-thirdparty/slf4j-reload4j-1.7.33.jar.bak

开放防火墙端口

firewall-cmd --zone=public --add-port=2181/tcp --permanent
firewall-cmd --zone=public --add-port=2888/tcp --permanent
firewall-cmd --zone=public --add-port=3888/tcp --permanent
firewall-cmd --zone=public --add-port=16000/tcp --permanent
firewall-cmd --zone=public --add-port=16010/tcp --permanent
firewall-cmd --zone=public --add-port=16020/tcp --permanent
firewall-cmd --zone=public --add-port=16030/tcp --permanent
firewall-cmd --reload

HBase服务的启动

start-hbase.sh

查看HBase页面

使用浏览器打开 http://c7100:16010 即可

2.1.3 HBase 集群安装

启动 Zookeeper（前提是已经安装了 Zookeeper）

[root@c7100 ~]# zkServer.sh start
[root@c7101 ~]# zkServer.sh start

启动 Hadoop 的 HDFS（前提是已经安装了 Hadoop）

[root@c7100 ~]# start-dfs.sh

HBase的解压

[root@c7100 ~]# cd /opt/apache
[root@c7100 apache]# tar -zxvf hbase-2.5.5-bin.tar.gz

HBase的配置文件

① 修改 hbase-env.sh 文件，内容如下，修改完成之后需要使用 source 命令使其生效！

# The java implementation to use.  Java 1.8+ required.
# export JAVA_HOME=/usr/java/jdk1.8.0/
# export JAVA_HOME=/opt/java-se-8u41-ri/

# The directory where pid files are stored. /tmp by default.
# export HBASE_PID_DIR=/var/hadoop/pids
export HBASE_PID_DIR=/opt/apache/data/hbase/pids

# Tell HBase whether it should manage it's own instance of ZooKeeper or not.
# export HBASE_MANAGES_ZK=true
export HBASE_MANAGES_ZK=false

② 修改配置文件 hbase-site.xml 文件，内容如下

<configuration>
  <property>
    <name>hbase.rootdirname>
    <value>hdfs://c7100.vm:9000/hbasevalue>
    <description>The directory shared by region servers and into which HBase persists.description>
  property>
  <property>
    <name>hbase.cluster.distributedname>
    <value>truevalue>
    <description>
      The mode the cluster will be in.
      Possible values are false for standalone mode and true for distributed mode. 
      If false, startup will run all HBase and ZooKeeper daemons together in the one JVM.
    description>
  property>
  
  <property>
    <name>hbase.tmp.dirname>
    
    <value>/opt/apache/data/hbase/tmp/hbase-${user.name}value>
    <description>
      Temporary directory on the local filesystem.
      Change this setting to point to a location more permanent than '/tmp',
      the usual resolve for java.io.tmpdir,
      as the '/tmp' directory is cleared on machine restart.
    description>
  property>
  <property>
    <name>hbase.unsafe.stream.capability.enforcename>
    <value>falsevalue>
  property>
  <property>
    <name>hbase.zookeeper.quorumname>
    <value>c7100.vm,c7101.vm,c7102.vmvalue>
    <description>
      Comma separated list of servers in the ZooKeeper ensemble
      (This config. should have been named hbase.zookeeper.ensemble).
      For example, "host1.mydomain.com,host2.mydomain.com,host3.mydomain.com".
    description>
  property>
  <property>
    <name>hbase.zookeeper.property.dataDirname>
    <value>/opt/apache/data/zookeepervalue>
    <description>
      Property from ZooKeeper's config zoo.cfg. The directory where the snapshot is stored.
    description>
  property>
  <property>
    <name>hbase.wal.providername>
    <value>filesystemvalue>
    <description>write ahead logdescription>
  property>
configuration>

③ 修改 regionservers 文件

c7100.vm
c7101.vm
c7102.vm

④ 解决 log4j 的 jar 包冲突

mv /opt/apache/hbase-2.4.17/lib/client-facing-thirdparty/slf4j-reload4j-1.7.33.jar /opt/apache/hbase-2.4.17/lib/client-facing-thirdparty/slf4j-reload4j-1.7.33.jar.bak

HBase远程发送

xsync /opt/apache/hbase-2.5.5/

开放防火墙端口

firewall-cmd --zone=public --add-port=2181/tcp --permanent
firewall-cmd --zone=public --add-port=2888/tcp --permanent
firewall-cmd --zone=public --add-port=3888/tcp --permanent
firewall-cmd --zone=public --add-port=16000/tcp --permanent
firewall-cmd --zone=public --add-port=16010/tcp --permanent
firewall-cmd --zone=public --add-port=16020/tcp --permanent
firewall-cmd --zone=public --add-port=16030/tcp --permanent
firewall-cmd --reload

HBase服务的启动

start-hbase.sh

查看HBase页面

使用浏览器打开 http://c7100:16010 即可

2.2 HBase Shell操作

help：是HBase 中最基础的命令，能为需要执行的命令提供帮助

hbase:003:0> help
HBase Shell, version 2.4.17, r7fd096f39b4284da9a71da3ce67c48d259ffa79a, Fri Mar 31 18:10:45 UTC 2023
Type 'help "COMMAND"', (e.g. 'help "get"' -- the quotes are necessary) for help on a specific command.
Commands are grouped. Type 'help "COMMAND_GROUP"', (e.g. 'help "general"') for help on a command group.

COMMAND GROUPS:
  Group name: general
  Commands: processlist, status, table_help, version, whoami

  Group name: ddl
  Commands: alter, alter_async, alter_status, clone_table_schema, create, describe, disable, disable_all, drop, drop_all, enable, enable_all, exists, get_table, is_disabled, is_enabled, list, list_regions, locate_region, show_filters

  Group name: namespace
  Commands: alter_namespace, create_namespace, describe_namespace, drop_namespace, list_namespace, list_namespace_tables

  Group name: dml
  Commands: append, count, delete, deleteall, get, get_counter, get_splits, incr, put, scan, truncate, truncate_preserve

命名空间

# 创建新的命名空间
hbase:029:0>create_namespace 'hadoop'


# 列举所有的命名空间
hbase:030:0>list_namespace
NAMESPACE
default
hadoop
hbase
3row(s)

# 列举以特定字符开头的所有的命名空间，支持正则匹配
hbase:034:0>list_namespace 'h.*'
NAMESPACE
hadoop
hbase
2 row(s)

# 查看命名空间描述
hbase:037:0>describe_namespace 'hadoop'
DESCRIPTION
{NAME => 'hadoop'}
Quota is disabled

# 修改命名空间，为其增加一个附加属性 describe，其值为 'big data framework'
hbase:002:0> alter_namespace 'hadoop', {METHOD=>'set', 'describe'=>'big data framework'}

hbase:003:0> describe_namespace 'hadoop'
DESCRIPTION
{NAME => 'hadoop', describe => 'big data framework'}
Quota is disabled

# 修改命名空间，删除一个附加属性 describe
hbase:006:0> alter_namespace 'hadoop', {METHOD=>'unset', NAME=>'describe'}

hbase:007:0> describe_namespace 'hadoop'
DESCRIPTION
{NAME => 'hadoop'} 
Quota is disabled

# 删除一个的命名空间，该明明空间必须是空的
hbase:016:0>drop_namespace 'hadoop'
Took 0.1541 seconds

hbase:017:0>list_namespace
NAMESPACE
default
hbase
2row(s)

2.2.1 DDL操作

# 建表
# ------------------------------------------------------

# 在默认命名空间下创建表 t1
hbase:016:0> create 't1', {NAME => 'f1'}, {NAME => 'f2'}, {NAME => 'f3'}

# 上一行可以简写成如下形式
hbase:016:0> create 't2', 'f1', 'f2', 'f3'

# 创建表的时候为列族 f1 设置版本
hbase:016:0> create 't3', {NAME => 'f1', VERSIONS => 2}

# 在命名空间 nano 下创建表 stu
hbase:016:0> create 'nano:stu', 'basic', {NAME=>'advanced', VERSIONS=>'2'}

# 查看表信息
# ------------------------------------------------------

# 查看所有用户表
hbase:043:0> list
TABLE
t1 
t2 
t3
nano:stu
4 row(s)
=> ["t1", "t2", "t3", "nano:stu"]

# 查看某个表的信息
hbase:042:0> describe 't3'
Table t3 is ENABLED 
t3
COLUMN FAMILIES DESCRIPTION
{NAME => 'f1', BLOOMFILTER => 'ROW', IN_MEMORY => 'false', VERSIONS => '2', KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', COMPRESSION => 'NONE', TTL => 'FOREVER', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '65536', REPLICATION_SCOPE => '0'} 


# 查看某个表是否存在
hbase:044:0> exists 't1'
Table t1 does exist
=> true

hbase:045:0> exists 't4'
Table t4 does not exist
=> false

# 禁用表
# ------------------------------------------------------
hbase:050:0> is_disabled 't3'
false
hbase:051:0> disable 't3'
hbase:052:0> is_disabled 't3'
true
hbase:053:0> enable 't3'
hbase:054:0> is_enabled 't3'
true

# 删除表
# ------------------------------------------------------
hbase:004:0> drop 't3'

ERROR: Table t3 is enabled. Disable it first.

For usage try 'help "drop"'

hbase:005:0> disable 't3'
hbase:006:0> drop 't3'
hbase:007:0> exists 't3'
Table t3 does not exist
=> false

# 修改表
# ------------------------------------------------------

# 修改列族 t1 的最大版本为 5
hbase:014:0> alter 't1', NAME => 'f1', VERSIONS => 5
Updating all regions with the new schema...
1/1 regions updated.
Done.

# 支持同时多个列族，每个列族使用映射语法并用逗号隔开，
hbase:015:0> alter 't1', {NAME => 'f2', IN_MEMORY => true}, {NAME => 'f3', VERSIONS => 5}
Updating all regions with the new schema...
1/1 regions updated.
Done.

# 删除一个列族
hbase:018:0> alter 't1', NAME => 'f1', METHOD => 'delete'
Updating all regions with the new schema...
1/1 regions updated.
Done.

# 删除一个列族的简写形式【需要注意的是：仅剩余最后一个列族时，不可删除！】
hbase:019:0> alter 't1', 'delete' => 'f2'
Updating all regions with the new schema...
1/1 regions updated.
Done.

2.2.2 DML 操作

# 写入数据
# ------------------------------------------------------
hbase:005:0> put 'nano:stu', '1001', 'basic:name', 'tina'
Took 0.1454 seconds
hbase:006:0> put 'nano:stu', '1001', 'basic', 'this is basic information!'
Took 0.0296 seconds
hbase:007:0> put 'nano:stu', '1001', 'basic:age', '19'
Took 0.0328 seconds 
hbase:008:0> put 'nano:stu', '1001', 'basic:name', 'coco'
Took 0.0097 seconds
hbase:009:0> put 'nano:stu', '1001', 'basic:name', 'yoyo'
Took 0.0160 seconds
hbase:015:0> put 'nano:stu', '1002', 'basic:name', 'Jenkins'
Took 0.0431 seconds
hbase:016:0> put 'nano:stu', '1002', 'basic:age', '20'
Took 0.0254 seconds
hbase:017:0> put 'nano:stu', '1003', 'basic:name', 'Lucas'
Took 0.1106 seconds

# 读取数据
# ------------------------------------------------------

# 获取行键为 1001 的数据
hbase:010:0> get 'nano:stu', '1001'
COLUMN         CELL
 basic:        timestamp=2023-09-02T21:51:35.249, value=this is basic information!
 basic:age     timestamp=2023-09-02T21:51:49.318, value=19
 basic:name    timestamp=2023-09-02T21:52:02.590, value=yoyo
1 row(s)
Took 0.0285 seconds
# 获取行键为 1001 的数据的 name 列的数据
hbase:011:0> get 'nano:stu', '1001', {COLUMN => 'basic:name'}
COLUMN         CELL
 basic:name    timestamp=2023-09-02T21:52:02.590, value=yoyo
1 row(s)
Took 0.0557 seconds

# 获取 nano:stu 表所有行的数据
hbase:017:0> scan 'nano:stu'
ROW       COLUMN+CELL
 1001     column=basic:, timestamp=2023-09-02T21:51:35.249, value=this is basic information!
 1001     column=basic:age, timestamp=2023-09-02T21:51:49.318, value=19
 1001     column=basic:name, timestamp=2023-09-02T21:52:02.590, value=yoyo
 1002     column=basic:age, timestamp=2023-09-02T21:55:51.626, value=20
 1002     column=basic:name, timestamp=2023-09-02T21:55:32.903, value=Jenkins
 1003     column=basic:name, timestamp=2023-09-02T21:55:57.235, value=Lucas
3 row(s)
Took 0.0727 seconds

# 获取 nano:stu 表所有行的数据，过滤所有 name 列
hbase:005:0> scan 'nano:stu', {COLUMNS => 'basic:name'}
ROW                       COLUMN+CELL
 1001                     column=basic:name, timestamp=2023-09-02T23:13:44.212, value=yoyo
 1002                     column=basic:name, timestamp=2023-09-02T23:13:44.251, value=Jenkins
 1003                     column=basic:name, timestamp=2023-09-02T23:13:44.336, value=Lucas
3 row(s)

# 获取 nano:stu 表所有行的数据，过滤所有 name 列
hbase:005:0> scan 'nano:stu', {COLUMNS => 'basic:name'}
ROW                       COLUMN+CELL
 1001                     column=basic:name, timestamp=2023-09-02T23:13:44.212, value=yoyo
 1002                     column=basic:name, timestamp=2023-09-02T23:13:44.251, value=Jenkins
 1003                     column=basic:name, timestamp=2023-09-02T23:13:44.336, value=Lucas
3 row(s)

# 获取 nano:stu 表所有行的数据，从 1001 开始，只查询两行
hbase:008:0> scan 'nano:stu', {LIMIT => 2, STARTROW => '1001'}
ROW                       COLUMN+CELL
 1001                     column=basic:, timestamp=2023-09-02T23:13:43.967, value=this is basic
                          information!
 1001                     column=basic:age, timestamp=2023-09-02T23:13:44.031, value=19
 1001                     column=basic:name, timestamp=2023-09-02T23:13:44.212, value=yoyo
 1002                     column=basic:age, timestamp=2023-09-02T23:13:44.307, value=20
 1002                     column=basic:name, timestamp=2023-09-02T23:13:44.251, value=Jenkins
2 row(s)

# 删除数据，删除 1003 的 name，因为 1003 只有 name 这一列，如果它被删除，则意味着这一整行被删除
# ------------------------------------------------------
hbase:012:0> delete 'nano:stu', '1003', 'basic:name'
Took 0.0884 seconds
hbase:013:0> scan 'nano:stu'
ROW                       COLUMN+CELL
 1001                     column=basic:, timestamp=2023-09-02T23:13:43.967, value=this is basic
                          information!
 1001                     column=basic:age, timestamp=2023-09-02T23:13:44.031, value=19
 1001                     column=basic:name, timestamp=2023-09-02T23:13:44.212, value=yoyo
 1002                     column=basic:age, timestamp=2023-09-02T23:13:44.307, value=20
 1002                     column=basic:name, timestamp=2023-09-02T23:13:44.251, value=Jenkins
2 row(s)

# 删除数据，删除 1002 的 name，因为 1002 不止 name 这一列，此操作仅仅 name 这一个单元格
hbase:014:0> delete 'nano:stu', '1002', 'basic:name'
Took 0.0114 seconds
hbase:015:0> scan 'nano:stu'
ROW                       COLUMN+CELL
 1001                     column=basic:, timestamp=2023-09-02T23:13:43.967, value=this is basic
                          information!
 1001                     column=basic:age, timestamp=2023-09-02T23:13:44.031, value=19
 1001                     column=basic:name, timestamp=2023-09-02T23:13:44.212, value=yoyo
 1002                     column=basic:age, timestamp=2023-09-02T23:13:44.307, value=20
2 row(s)

# 删除数据，删除 1001 的所有单元格的数据，意味着这一整行都将被删除
hbase:018:0> deleteall 'nano:stu', '1001'
Took 0.0248 seconds
hbase:019:0> scan 'nano:stu'
ROW                       COLUMN+CELL
 1002                     column=basic:age, timestamp=2023-09-02T23:13:44.307, value=20
1 row(s)
Took 0.0241 seconds

3. HBase 的 Java API

新建 Maven 项目，pom 文件如下：


<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0modelVersion>

    <groupId>cn.tedu.hbasegroupId>
    <artifactId>hbase-learnerartifactId>
    <version>1.0version>

    <properties>
        <maven.test.skip>truemaven.test.skip>
        <maven.compiler.target>1.8maven.compiler.target>
        <maven.compiler.source>1.8maven.compiler.source>
        <maven.compiler.encoding>UTF-8maven.compiler.encoding>
        <project.build.sourceEncoding>UTF-8project.build.sourceEncoding>
        <project.reporting.outputEncoding>UTF-8project.reporting.outputEncoding>
    properties>

    <dependencies>
        <dependency>
            <groupId>junitgroupId>
            <artifactId>junitartifactId>
            <version>4.13.2version>
            <scope>testscope>
        dependency>
        <dependency>
            <groupId>org.apache.hbasegroupId>
            <artifactId>hbase-clientartifactId>
            <version>2.4.17version>
            <exclusions>
                <exclusion>
                    <groupId>org.glassfishgroupId>
                    <artifactId>javax.elartifactId>
                exclusion>
            exclusions>
        dependency>
        <dependency>
            <groupId>org.glassfishgroupId>
            <artifactId>javax.elartifactId>
            <version>3.0.1-b06version>
        dependency>
    dependencies>

    <repositories>
        <repository>
            <id>clouderaid>
            <url>https://repository.cloudera.com/artifactory/cloudera-repos/url>
        repository>
        <repository>
            <id>apache releaseid>
            <url>https://repository.apache.org/content/repositories/releases/url>
        repository>
    repositories>

project>

在 maven 项目的 resources 目录中增加 hbase-site.xml 文件，其内容如下：



<configuration>
  <property>
    <name>hbase.zookeeper.quorumname>
    <value>c7100.vm,c7101.vm,c7102.vmvalue>
    <description>上一行的 value 的值需要跟服务器端 zookeeper 的集群的配置值保持一致description>
  property>
configuration>

在 maven 项目的 resources 目录中增加 log4j.properties 文件，其内容如下：

log4j.rootLogger=INFO,Console

# Standard Console
log4j.appender.Console=org.apache.log4j.ConsoleAppender
log4j.appender.Console.Target=System.out
log4j.appender.Console.layout=org.apache.log4j.PatternLayout
log4j.appender.Console.layout.ConversionPattern=[%d{yyyy-MM-dd HH:mm:ss:SSS}][%C-%M] %m%n

# MyBatis Console
log4j.logger.com.huofutp.uc.dao=DEBUG
log4j.logger.com.huofutp.crm.dao=DEBUG
log4j.logger.com.huofutp.log.dao=DEBUG
log4j.logger.com.huofutp.pis.dao=DEBUG
log4j.logger.com.huofutp.user.dao=DEBUG
log4j.logger.com.huofutp.common.dao=DEBUG
log4j.logger.com.huofutp.report.dao=DEBUG
log4j.logger.com.huofutp.logger.dao=DEBUG
log4j.logger.com.huofutp.workflow.dao=DEBUG
log4j.logger.com.huofutp.messenger.dao=DEBUG
log4j.logger.com.huofutp.bcs.dynamic.field.dao=DEBUG

创建单例的 HBase 的链接对象

public final class HBaseConnection {
	private static Connection connection = null;

	/**
	 * 获取线程安全的 HBase 连接对象
	 * @return HBase 连接对象
	 */
	public static Connection getConnection() {
		if(connection == null) {
			synchronized (HBaseConnection.class) {
				if(connection == null) {
					try {
						connection = ConnectionFactory.createConnection();
					} catch (IOException e) {
						e.printStackTrace();
					}
				}
			}
		}
		return connection;
	}
}

创建HBase的DDL操作类

public class HBaseDDL {
	/**
	 * 创建命名空间
	 *
	 * @param namespace 命名空间名称
	 */
	public static void createNamespace(String namespace) throws IOException {
		if (isNamespaceExists(namespace)) {
			System.out.println("namespace[" + namespace + "] already exists");
			return;
		}
		NamespaceDescriptor.Builder builder = NamespaceDescriptor.create(namespace);
		try (Admin admin = getConnection().getAdmin()) {
			try {
				admin.createNamespace(builder.build());
			} catch (IOException e) {
				System.out.println("create namespace had error.");
			}
		}
		System.out.println("namespace[" + namespace + "] has been created");
	}

	/**
	 * 列出所有的命名空间
	 */
	public static void listNamespace() {
		try (Admin admin = getConnection().getAdmin()) {
			String[] strings = admin.listNamespaces();
			System.out.println("namespaces:[" + String.join("\t", strings) + "]");
		} catch (IOException e) {
			e.printStackTrace();
		}
	}

	/**
	 * 判断命名空间是否存在
	 */
	public static boolean isNamespaceExists(String namespace) {
		try (Admin admin = getConnection().getAdmin()) {
			String[] strings = admin.listNamespaces();
			return Arrays.asList(strings).contains(namespace);
		} catch (IOException e) {
			e.printStackTrace();
		}
		return false;
	}

	/**
	 * 删除命名空间
	 *
	 * @param namespace 命名空间名称
	 */
	public static void deleteNamespace(String namespace) throws IOException {
		if (!isNamespaceExists(namespace)) {
			System.out.println("namespace[" + namespace + "] does not exist");
			return;
		}
		try (Admin admin = getConnection().getAdmin()) {
			admin.deleteNamespace(namespace);
		}
		boolean disappear = !isNamespaceExists(namespace);
		if (disappear) {
			System.out.println("namespace[" + namespace + "] has been deleted");
		}
	}

	/**
	 * 判断表格是否存在
	 */
	public static void listTable() throws IOException {
		listTable(null);
	}

	/**
	 * 判断表格是否存在
	 *
	 * @param namespace 命名空间名称
	 */
	public static void listTable(String namespace) throws IOException {
		try (Admin admin = getConnection().getAdmin()) {
			List<String> strings = new ArrayList<>();
			if (namespace != null) {
				TableName[] names = admin.listTableNamesByNamespace(namespace);
				for (TableName name : names) {
					strings.add(name.getNameWithNamespaceInclAsString());
				}
			} else {
				List<TableDescriptor> descriptors = admin.listTableDescriptors();
				for (TableDescriptor descriptor : descriptors) {
					strings.add(descriptor.getTableName().getNameWithNamespaceInclAsString());
				}
			}
			System.out.println("tables:[" + String.join("\t", strings) + "]");
		}
	}

	/**
	 * 判断表格是否存在
	 *
	 * @param namespace 命名空间名称
	 * @param tablename 表的名称
	 * @return 返回 true 表示表存在
	 */
	public static boolean isTableExists(String namespace, String tablename) throws IOException {
		boolean exists = false;
		try (Admin admin = getConnection().getAdmin()) {
			try {
				exists = admin.tableExists(TableName.valueOf(namespace, tablename));
			} catch (IOException e) {
				e.printStackTrace();
			}
		}
		return exists;
	}

	/**
	 * 创建表
	 *
	 * @param namespace      命名空间
	 * @param tablename      表名
	 * @param columnFamilies 列族
	 */
	public static void createTable(String namespace, String tablename, String... columnFamilies) throws IOException {
		if (isTableExists(namespace, tablename)) {
			System.out.println("table[" + tablename + "] already exists");
			return;
		}
		if (columnFamilies == null || columnFamilies.length < 1) {
			System.out.println("Table should have at least one column family");
			return;
		}
		try (Admin admin = getConnection().getAdmin()) {
			TableName tn = TableName.valueOf(namespace, tablename);
			if (admin.tableExists(tn)) {
				return;
			}
			TableDescriptorBuilder builder = TableDescriptorBuilder.newBuilder(tn);
			List<ColumnFamilyDescriptor> descriptors = new ArrayList<>();
			for (String family : columnFamilies) {
				ColumnFamilyDescriptorBuilder descriptorBuilder = ColumnFamilyDescriptorBuilder.newBuilder(Bytes.toBytes(family));
				descriptors.add(descriptorBuilder.build());
			}
			builder.setColumnFamilies(descriptors);
			admin.createTable(builder.build());
		}
		System.out.println("table[" + namespace + ":" + tablename + "] has been created");
	}

	/**
	 * 获取列族的最大 version 值
	 *
	 * @param namespace    命名空间
	 * @param tablename    表名
	 * @param columnFamily 列族
	 * @return 返回最大 version 值
	 */
	public static int getTableColumnFamilyMaxVersion(String namespace, String tablename, String columnFamily) throws IOException {
		if (!isTableExists(namespace, tablename)) {
			System.out.println("table[" + tablename + "] does not exist");
			return 0;
		}
		try (Admin admin = getConnection().getAdmin()) {
			TableName tn = TableName.valueOf(namespace, tablename);
			if (!admin.tableExists(tn)) {
				System.out.println("table[" + tablename + "] does not exist!");
				return 0;
			}
			TableDescriptor descriptor = admin.getDescriptor(tn);
			// 获取原表的列族描述信息
			ColumnFamilyDescriptor family = descriptor.getColumnFamily(Bytes.toBytes(columnFamily));
			return family.getMaxVersions();
		} catch (IOException e) {
			e.printStackTrace();
		}
		return 0;
	}

	/**
	 * 修改表
	 *
	 * @param namespace 命名空间
	 * @param tablename 表名
	 * @param version   最大版本号
	 */
	public static void modifyTableColumnFamilyMaxVersion(String namespace, String tablename, String columnFamily, int version) throws IOException {
		if (!isTableExists(namespace, tablename)) {
			System.out.println("table[" + tablename + "] does not exist");
			return;
		}
		try (Admin admin = getConnection().getAdmin()) {
			TableName tn = TableName.valueOf(namespace, tablename);
			if (!admin.tableExists(tn)) {
				System.out.println("table[" + tablename + "] does not exist!");
				return;
			}
			TableDescriptor descriptor = admin.getDescriptor(tn);
			// 获取原表的列族描述信息
			ColumnFamilyDescriptor family = descriptor.getColumnFamily(Bytes.toBytes(columnFamily));
			{
				ColumnFamilyDescriptorBuilder builder = ColumnFamilyDescriptorBuilder.newBuilder(family);
				// 修改 version 后重新构建列族描述信息
				builder.setMaxVersions(version);
				family = builder.build();
			}
			TableDescriptorBuilder builder = TableDescriptorBuilder.newBuilder(descriptor);
			builder.modifyColumnFamily(family);
			admin.modifyTable(builder.build());
		}
	}

	/**
	 * 删除表
	 *
	 * @param namespace 命名空间
	 * @param tablename 表名
	 */
	public static void deleteTable(String namespace, String tablename) throws IOException {
		if (!isTableExists(namespace, tablename)) {
			System.out.println("table[" + tablename + "] does not exist");
			return;
		}
		try (Admin admin = getConnection().getAdmin()) {
			TableName tn = TableName.valueOf(namespace, tablename);
			if (!admin.isTableDisabled(tn)) {
				admin.disableTable(tn);
			}
			admin.deleteTable(tn);
		} catch (IOException e) {
			e.printStackTrace();
		}
		boolean disappear = !isTableExists(namespace, tablename);
		if (disappear) {
			System.out.println("table[" + namespace + ":" + tablename + "] has been deleted");
		}
	}
}

创建 HBase 的DML 操作类

public class HBaseDML {
	private static final Connection connection = HBaseConnection.getConnection();

	/**
	 * 为表中特定的行的列赋值
	 *
	 * @param namespace 命名空间
	 * @param tablename 表名
	 * @param rowKey    行键
	 * @param column    列名，由列族和列标识符组成，例如 basic:name
	 * @param value     该列的值
	 */
	public static void put(String namespace, String tablename, String rowKey, String column, String value) throws IOException {
		if (namespace == null || tablename == null || column == null) {
			return;
		}
		String[] strings = column.split(":");
		if (strings.length < 1) {
			return;
		}
		String columnName = strings.length > 1 ? strings[1] : "";
		Table table = connection.getTable(TableName.valueOf(namespace, tablename));
		Put put = new Put(Bytes.toBytes(rowKey));
		put.addColumn(Bytes.toBytes(strings[0]), Bytes.toBytes(columnName), Bytes.toBytes(value));
		table.put(put);
		table.close();
	}

	/**
	 * 打印 Cell 并返回 Map 结果
	 *
	 * @param result 数据返回结果
	 * @return 返回 Map 集合
	 */
	private static List<Map<String, Object>> getListFromResult(Result result) {
		List<Map<String, Object>> maps = new ArrayList<>();
		assert result != null;
		Cell[] cells = result.rawCells();
		System.out.print(Bytes.toString(result.getRow()) + "[");
		for (Cell cell : cells) {
			Map<String, Object> map = new HashMap<>();
			long timestamp = cell.getTimestamp();
			String time = DateFormatUtils.format(timestamp, "yyyy-MM-dd HH:mm:ss");
			String row = Bytes.toString(CellUtil.cloneRow(cell));
			String family = Bytes.toString(CellUtil.cloneFamily(cell));
			String qualifier = Bytes.toString(CellUtil.cloneQualifier(cell));
			String value = Bytes.toString(CellUtil.cloneValue(cell));
			map.put("key", row);
			map.put("timestamp", timestamp);
			map.put("time", time);
			map.put("column", family + ":" + qualifier);
			map.put("value", value);
			System.out.print("(" + family + ":" + qualifier + ") => " + value + "\t");
			maps.add(map);
		}
		System.out.println("]");
		return maps;
	}


	/**
	 * 扫描表的数据
	 *
	 * @param namespace 命名空间
	 * @param tablename 表名
	 * @param start     起始行的主键[包含]
	 * @param stop      结束行的主键[不包含]
	 */
	public static void scan(String namespace, String tablename, String start, String stop) throws IOException {
		scan(namespace, tablename, start, stop, null, null);
	}

	/**
	 * 扫描表的数据
	 *
	 * @param namespace 命名空间
	 * @param tablename 表名
	 * @param start     起始行的主键[包含]
	 * @param stop      结束行的主键[不包含]
	 * @param column    列名，由列族和列标识符组成，例如 basic:name
	 * @param value     结束行的主键[不包含]
	 */
	public static void scan(String namespace, String tablename, String start, String stop, String column, String value) throws IOException {
		Table table = connection.getTable(TableName.valueOf(namespace, tablename));
		Scan scan = new Scan();
		scan.withStartRow(Bytes.toBytes(start));
		scan.withStopRow(Bytes.toBytes(stop));
		// 过滤器
		if (column != null && column.contains(":") && value != null) {
			String[] cs = column.split(":");
			if (cs.length > 0) {
				String cn = cs.length > 1 ? cs[1] : "";
				Filter filter = new ColumnValueFilter(
						Bytes.toBytes(cs[0]),
						Bytes.toBytes(cn),
						// 会查找到所有等于 value 的数据
						// 需要注意的是，如果该列不存在，不会被找到
						CompareOperator.EQUAL,
						Bytes.toBytes(value)
				);
				// 1. scan 可以使用 FilterList 组装多个 Filter 后使用
				//    FilterList filters = new FilterList();
				// 2. SingleColumnValueFilter
				//    会查找到所有等于 value 的数据，如果该列不存在，也会被找到
				// 3. ColumnValueFilter
				//    会查找到所有等于 value 的数据，如果该列不存在，不会被找到
				scan.setFilter(filter);
			}
		}
		try (ResultScanner scanner = table.getScanner(scan)) {
			for (Result result : scanner) {
				List<Map<String, Object>> maps = getListFromResult(result);
				//System.out.println(maps);
			}
		} catch (IOException e) {
			e.printStackTrace();
		}
		table.close();
	}

	/**
	 * 获取某行的所有数据
	 *
	 * @param namespace 命名空间
	 * @param tablename 表名
	 * @param rowKey    行主键
	 */
	public static List<Map<String, Object>> get(String namespace, String tablename, String rowKey) throws IOException {
		return get(namespace, tablename, rowKey, null);
	}

	/**
	 * 获取某个单元格的数据
	 *
	 * @param namespace 命名空间
	 * @param tablename 表名
	 * @param rowKey    行主键
	 * @param column    列名，由列族和列标识符组成，例如 basic:name
	 * @return
	 */
	public static List<Map<String, Object>> get(String namespace, String tablename, String rowKey, String column) throws IOException {
		String[] cs = column != null && column.contains(":") ? column.split(":") : null;
		Table table = connection.getTable(TableName.valueOf(namespace, tablename));
		Get get = new Get(Bytes.toBytes(rowKey));
		if (cs != null && cs.length > 0) {
			String columnName = cs.length > 1 ? cs[1] : "";
			get.addColumn(Bytes.toBytes(cs[0]), Bytes.toBytes(columnName));
		}
		get.readAllVersions();
		Result result = null;
		try {
			result = table.get(get);
		} catch (IOException e) {
			e.printStackTrace();
		}
		assert result != null;
		List<Map<String, Object>> maps = getListFromResult(result);
		table.close();
		return maps;
	}
}

创建单元测试类

@RunWith(JUnit4.class)
public class JUnit4TestHBase {

	@After
	public void testClose() throws IOException {
		getConnection().close();
		System.out.println("单元测试结束！");
	}

	/**
	 * DDL 相关测试 —— 命名空间
	 */
	@Test
	public void testNamespace() throws IOException {
		HBaseDDL.listNamespace();
		HBaseDDL.createNamespace("tmp");
		HBaseDDL.listNamespace();
		HBaseDDL.createTable("tmp", "stu", "basic", "advanced");
		HBaseDDL.listTable("tmp");
	}

	/**
	 * DDL 相关测试 —— 修改表
	 */
	@Test
	public void testModifyTable() throws IOException {
		int version = HBaseDDL.getTableColumnFamilyMaxVersion("tmp", "stu", "basic");
		System.out.println("basic`s max version is:" + version);
		HBaseDDL.modifyTableColumnFamilyMaxVersion("tmp", "stu", "basic", version + 1);
		version = HBaseDDL.getTableColumnFamilyMaxVersion("tmp", "stu", "basic");
		System.out.println("basic`s max version is:" + version);
	}

	/**
	 * DML相关测试
	 */
	@Test
	public void testDML() throws IOException {
		HBaseDML.put("tmp", "stu", "1001", "basic:name", "tina");
		HBaseDML.put("tmp", "stu", "1001", "basic", "this is basic information!");
		HBaseDML.put("tmp", "stu", "1001", "basic:age", "19");
		//HBaseDML.put("tmp", "stu", "1002", "basic:name", "Jenkins");
		HBaseDML.put("tmp", "stu", "1002", "basic:age", "20");
		HBaseDML.put("tmp", "stu", "1003", "basic:name", "Lucas");
		HBaseDML.put("tmp", "stu", "1003", "basic:age", "19");

		System.out.println("==GET[1003]basic:name============");
		HBaseDML.get("tmp", "stu", "1003", "basic:name");
		//System.out.println(maps);
		System.out.println("==GET[1003]======================");
		HBaseDML.get("tmp", "stu", "1003");
		//System.out.println(maps);
		System.out.println("==SCAN[1001:1003]===========================");
		HBaseDML.scan("tmp", "stu", "1001", "1003");
		System.out.println("==SCAN(name=tina)================");
		HBaseDML.scan("tmp", "stu", "1001", "1003", "basic:name", "tina");
	}

	/**
	 * DDL 相关测试 —— 删除命名空间和表
	 */
	@Test
	public void testDeleteTable() throws IOException {
		HBaseDDL.listTable();
		HBaseDDL.deleteTable("tmp", "stu");
		HBaseDDL.listTable();

		HBaseDDL.listNamespace();
		HBaseDDL.deleteNamespace("tmp");
		HBaseDDL.listNamespace();
	}
}

你可能感兴趣的:(大数据,#,Java,hbase,数据库,大数据)

JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
日历插件-FullCalendar的详细使用老马聊技术 JavaScript 前端 javascript
一、介绍FullCalendar是一个功能强大、高度可定制的JavaScript日历组件，用于在网页中显示和管理日历事件。它支持多种视图（月、周、日等），可以轻松集成各种框架，并提供丰富的事件处理功能。二、实操案例具体代码如下：FullCalendar日期选择body{font-family:Arial,sans-serif;margin:20px;}#calendar{max-width:900
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
Java 调用 HTTP 接口的 7 种方式：全网最全指南
Java调用HTTP接口的7种方式：全网最全指南在开发过程中，调用HTTP接口是最常见的需求之一。本文将详细介绍Java中7种主流的调用HTTP接口的方式，包括每种工具的优缺点和完整代码实现。1.使用RestTemplateRestTemplate是Spring提供的同步HTTP客户端，适用于传统项目。尽管从Spring5开始被标记为过时，它仍然是许多开发者的首选。示例代码importorg.sp
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
javascript高级程序设计第3版——第12章 DOM2与DOM3 weixin_30687587 javascript 数据结构与算法 ViewUI
12章——DOM2与DOM3为了增强D0M1，DOM级规范定义了一些模块。DOM2核心：为不同的DOM类型引入了一些与XML命名空间有关的方法，还定义了以编程方式创建Document实例的方法；DOM2级样式：针对操作元素的样式而开发；其特性总结：1.每个元素都有一个关联的style对象，可用来确定和修改行内样式；2.要确定某个元素的计算样式，可使用getComgetComputedStyle（）
Java设计模式实战：高频场景解析与避坑指南 mckim_ 笔记学习 java 设计模式
引言设计模式是软件开发的基石，但许多开发者面对23种模式时容易陷入“学完就忘”或“滥用模式”的困境。本文从工业级项目视角出发，精选10种高频设计模式，结合真实代码案例与主流框架应用，帮你建立模式思维，拒绝纸上谈兵。一、创建型模式：告别new的暴力美学1.工厂方法模式（FactoryMethod）核心痛点：对象创建逻辑散落各处，难以统一管理。场景案例：电商平台需要支持多种支付方式（支付宝、微信、银联
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
《Java前端开发全栈指南：从Servlet到现代框架实战》
前言在当今Web开发领域，Java依然是后端开发的主力语言，而随着前后端分离架构的普及，Java开发者也需要掌握前端技术栈。本文将全面介绍JavaWeb前端开发的核心技术，包括传统Servlet/JSP体系、现代前端框架集成方案，以及全栈开发的最佳实践。通过本文，您将了解如何构建现代化的JavaWeb应用前端界面。一、JavaWeb前端技术演进1.1传统技术栈Servlet：JavaWeb基础，处
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
javaSE面试题---语法基础、面向对象、常用类、集合、多线程、文件和IO yang_xiao_wu_ java 面试开发语言 javase java基础多线程文件和IO
目录语法基础1.jdkjrejvm区别2.基本数据类型3.引用数据类型4.自动类型转换、强制类型转换5.常见的运算符6.&和&&区别7.++--在前和在后的区别8.+=有什么作用9.switch..case中switch支持哪些数据类型10.break和continue区别11.while和dowhile区别12.如何生成一个取值范围在[min,max]之间的随机数13.数组的长度如何获取？数组下
什么是OA系统？使用OA系统对企业有哪些好处？
OA系统（OfficeAutomationSystem），即办公自动化系统，是将现代化办公和计算机网络功能结合起来的一种新型的办公方式。是现代企业管理中一种重要的信息化工具，它通过计算机技术、网络技术和数据库技术等手段，实现企业内部办公流程的自动化和信息化管理。使企业的信息交流更加顺畅，办公流程更加高效，从而提高企业的运营效率和管理水平。一、主要功能1.文档管理文档存储与检索：OA系统可以集中存储
JAVA 高频八股文 Day03 Conqueror675 java 开发语言
12.TCP和Http的区别是什么TCP是传输层协议，负责建立可靠的点对点连接，确保数据有序、完整地传输（如铁路轨道）；HTTP是应用层协议，基于TCP构建，定义了Web服务交互的报文格式和规则（如货运订单）。TCP关注数据如何可靠送达，通过三次握手建立连接、流量控制等机制保证传输；HTTP关注传输内容的意义，提供请求/响应语义（GET/POST等）和无状态通信。补充：说一下什么是三次握手四次挥手
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu