lxiaoyouyouj

物联网架构之HBase

技能目标

了解 HBase 体系结构
理解 HBase 数据模型
掌握 HBase 的安装
会使用 HBase Shell 操作 HBase

一、案例概述

二、案例前置知识点

HBase简介

HBase 是数据库，但并不是传统的关系型数据库，HBase 不使用以行存储的关系型结构存储数据，而是以键值对方式按列存储，由此可以认为它是非关系型数据库 NoSQL（Not Only SQL）中的一个重要代表。

NoSQL目前并没有明确的范围和定义，主要特点是通常用于大规模数据的存储、没有预定义的模式（如表结构）、表和表之间没有复杂的关系。

总体上可将 NoSQL 数据库分为以下四类：

基于列存储的类型
基于文档存储的类型
基于键值对存储的类型
基于图形数据存储的类型

通常，人们将 HBase 归为基于列存储类型。在 NoSQL 领域，HBase 本身不是最优秀。但得益于与 Hadoop 的整合，给它带来了更广阔的发展空间。HBase 本质上只有插入操作，更新和删除都是使用插入方式完成，这是由底层 HDFS 流式访问特性（一次写入、多次读取）决定的。所以，在更新时总是插入一个带时间戳的新行，而删除时插入一个带有删除标记的新行。每一次的插入都有一个时间戳标记，每次都是一个新的版本HBase 会保留一定数量的版本（这个值是可以设定的）。如果在查询时提供时间戳，则返回距离该时间最近的版本；否则返回离现在最近的版本。

HBase和HDFS的关系

HBase体系结构

HRegion

HBase 使用表（Table）存储数据集，表由行和列组成，这与关系型数据库类似。但是，当表的大小超过设定值时，HBase 会自动将表划分为不同的区域（Region）。每个区域称为 HRegion，它是 HBase 集群上分布式存储和负载均衡的最小单位，在这点上表和 HRegion 类似于 HDFS 中文件与文件块的概念。一个 HRegion 中保存一个表中一段连续的数据，通过表名和主键范围（开始主键~结束主键）区分每一个HRegion。

一开始，一个表只有一个 Hregion。随着 HRegion 开始变大，直到超出设定的大小阈值，便会在某行的边界上把表分成两个大小基本相同的 HRegion，称为HRegion 分裂。如下图所示

每个 HRegion 由多个 HStore 组成，每个 HStore 对应表中一个列族（ColumnFamily）的存储，列族在后面还会详细介绍。HStore 由两部分组成：MemStore 和StoreFile。用户写入的数据首先放入 MemStore，当 MemStore 满了以后再刷入（flush）StoreFile。StoreFile 是 HBase 中的最小存储单元，底层最终由 HFile 实现，而 HFile是键值对数据的存储格式，实质是 HDFS 的二进制格式文件。HBase 中不能直接更新和删除数据，所有的数据均通过追加的方式进行更新。当StoreFile 的数量超过设定的阈值将触发合并操作，将多个 StoreFile 合并为一个StoreFile，此时进行数据的更新和删除。

HRegionServer

HRegionServer 负责响应用户 I/O 请求，向 HDFS 中读写数据，一台机器上只运行一个 HRegionServer。HRegionServer 包含两部分：HLog 部分和 HRegion 部分。其中 HLog 用于存储数据日志，实质是 HDFS 的 Sequence File。到达 HRegion的写操作首先被追加到日志中，然后才被加入内存中的 MemStore。HLog 文件主要用于故障恢复。例如某台 HRegionServer 发生故障，那么它所维护的 HRegion 会被重新分配到新的机器上，新的 HRegionServer 在加载 HRegion 的时候可以通过 HLog对数据进行恢复。

HRegion 部分由多个 HRegion 组成，每个 HRegion 对应了表中的一个分块，并且每一个 HRegion 只会被一个 HRegionServer 管理。

HMaster

每台 HRegionServer 都会和 HMaster 服务器通信，HMaster 的主要任务就是告诉每个 HRegionServer 它要维护的 HRegion。

在 HBase 中可以启动多个 HMaster，通过 ZooKeeper 的 Master 选举机制来保证系统中总有一个 Master 在运行。HMaster 的具体功能包括：

管理用户对表的增、删、改、查操作；
管理 HRegionServer 的负载均衡，调整 HRegion 分布；
在 HRegion 分裂后，负责新的 HRegion 分配；
在 HRegionServer 停机后，负责失效 HRegionServer 上的 HRegion 迁移。

**

ZooKeeper

ZooKeeper 存储的是 HBase 中的 ROOT 表和 META 表的位置，这是 HBase 中两张特殊的表，称为根数据表（ROOT）和元数据表（META）。META 表记录普通用户表的 HRegion 标识符信息，每个 HRegion 的标识符为：表名+开始主键+唯一 ID。

随着用户表的 HRegion 分裂，META 表的信息也会增长，并且可能还会被分割为几个 HRegion。此时，可以用一个 ROOT 表来保存 META 的 HRegion 信息，而ROOT 表是不能被分割的，也就是 ROOT 表只有一个 HRegion。那么客户端（Client）在访问用户数据前需要首先访问 ZooKeeper，然后访问 ROOT 表，接着访问 META表，最后才能找到用户数据的位置进行访问，如图下所示。

HBase与关系型数据库的区别

HBase 数据模型

（1）数据模型
在 HBase 中，数据以表的方式存储。具体数据模型中涉及到的术语解释如下：

表（Table）：是一个稀疏表（不存储值为 NULL 的数据），表的索引是行关键字、列关键字和时间戳。
行关键字（Row Key）：行的主键，唯一标识一行数据，也称行键。表中的行根据行键进行字典排序，所有对表的访问都要通过表的行键。在创建表时，行键不用、也不能预先定义。而在对表数据进行操作时必须指定行键，行键在添加数据时首次被确定。
列族（Column Family）：行中的列被分为“列族”。同一个列族的所有成员具有相同的列族前缀。例如“course:math”和“course:art”都是列族“course”的成员。一个表的列族必须在创建表时预先定义，列族名称不能包含 ASCII 控制字符（ASCII 码在 0~31 间外加 127）和冒号（:）。
列关键字（Column Key）：也称列、列键。语法格式为：
:
其中：
family 是列族名，用于表示列族前缀；
qualifier 是列族修饰符，表示列族中的一个成员。列族成员可以在随后
使用时按需加入，也就是只要列族预先存在，随时可以把列族成员添加
到列族中去。列族修饰符可以是任意字节。
存储单元格（Cell）：在 HBase 中，值是作为一个单元保存在系统中。要定位一个单元，需要使用“行键+列键+时间戳”三个要素。
时间戳（Timestamp）：插入单元格时的时间戳。默认作为单元格的版本号。

下面结合 HBase 的概念视图进一步体会这些术语。
（2）概念视图
在关系型数据库中，只能通过表的主键或唯一字段定位到某一条数据。例如使用典型的关系表的结构描述学生成绩表 scores，如下表所示。其中主要字段依次为姓名（name）、年级（grade）、数学成绩（math）、艺术成绩（art），主键为 name。

由于主键唯一标识了一行记录，所于很容易按姓名查询到某位同学的所有成绩。
但是，请思考如下问题：

（1）如果现在新加一门课程，能够在不修改表结构的情况下去保存新的课程成绩吗？
（2）如果某同学数学课程参加了补考，那么两次的考试成绩都能够保存下来吗？
（3）如果某同学只考试了一门课程而其它课程都没有成绩，是否可以只保存有成绩的课程而节省存储空间呢？

对于问题 1 和 2，在不修改表结构的情况下是不能够实现的，即使通过修改表结构实现，也不能保证后续的需求不会再发生变化。而在问题 3 中，按表结构的字段类型定义，一条记录的某个字段无论是否为 NULL 都会占用存储空间，那么将不能有选择的保存数据来节省存储空间。

很明显，上面的需求在实际运用中经常出现，而 HBase 则可以完美的解决这些问题。将 scores 表转为在 HBase 中的概念视图，如下表所示。

表中的列包含了行键、时间戳和两个列族（grade、course），行包含了“jason”和“tom”两行数据。每次对表操作都必须指定行键和列键，每次操作增加一条数据，每一条数据对应一个时间戳。从上往下按倒序排列，该时间戳自动生成，用户不必进行管理。每次只针对一个列键操作，例如在 t3 时刻，用户指定“tom”的“math”成绩为“89”，类似操作：先找到行键“tom”然后指定列键进行赋值：course:math=89。其中：“course:math”为列键，“course”为列族名而“math”为列族修饰符，最后将“89”作为列键值赋给列键，t3 时刻的时间自动插入到时间戳列中。

又如在 t4 时刻，用户指定“jason”的“grade”为“2”。按照前面分析应类似如下操作：先找到行键“jason”，然后指定列键并赋值：grade:=2。请注意：这里没有给出列键的列族修饰符，即列族修饰符为空字符串。这样是允许的，因为前面提过列族修饰符可以是任意字符组成。

现在在 HBase 中回答前面的三个问题：

（1）如果现在为学生 jason 新增英语成绩，那么指定行键：“jason”，列键：“cource:english”，以及列键值（英语成绩）。

（ 2 ）如果学生 jason 参加了数学补考，那么指定行键： “jason” ，列键：“cource:math”，以及列键值（补考成绩）。

（3）前面提过 HBase 是基于稀疏存储设计，在概念视图中发现存在很多空白项，这些空白项并不会被实际存储。总之，有数据就存储，无数据则忽略，通过表的物理视图可以更好的体会这一点。

（3）物理视图
通过概念视图，有助于从逻辑上理解 HBase 的数据结构。但在实际存储时，是按照列族来存储的。一个新的列键可以随时加入到已存在的列族中，这也是为什么列族必须在创建表时预先定义的原因。由上表中的概念视图对应的物理视图如下表1和下表2所示。
HBase 就是这样一个基于列模式的映射数据库，它只能表示简单的键-值的映射关系。与关系型数据库相比，它有如下特点：

HBase与关系型数据库的区别

Hive 和 Spark

完整的大数据平台应该提供离线计算、实时计算、实时查询这几方面的功能。离线计算就是非实时计算。通常，这类计算要在开始前就知道问题的所有数据输入。MapReduce 就是典型的离线计算，用于对全部归档数据进行批量处理，然后将结果缓存起来提供查询（如 HBase），可以看出从数据输入到结果输出的整个阶段，MapReduce 在实时性上并不是非常理想。

（1）Hive
在实际运用中，通常采用 Hadoop+Spark+Hive（MapReduce）的解决方案。利用 Hadoop 的 HDFS 解决分布式存储问题；利用 MapReduce 或 Hive 解决离线计算问题；利用 Spark 解决实时计算；最后利用 HBase 来解决实时查询的问题。

Hive 是 Hadoop 中的一个重要子项目，它的优势在于可以利用 MapReduce 编程技术，提供了类似 SQL 的编程接口,实现部分 SQL（结构化查询语句）语句的功能。Hive 的出现极大地推进了 Hadoop 在数据仓库方面的发展。

Hive 定义了类 SQL 的语言 ——HiveQL 。使用 HiveQL 意味着，不需要编写MapReduce 就可以方便地使用 Mapper 和 Reducer 操作，这对 MapReduce 框架是一个强有力的支持。

Hive 本身建立在 Hadoop 体系结构上，提供了一个 SQL 解析的过程，从外部接口中获取命令，并对用户指令进行解析。Hive 将外部命令解析成一个 MapReduce 作业，随后提交到 Hadoop 集群进行处理。

Hive 的出现，是要解决如何让用户从一个现有的数据基础架构转移到 Hadoop上，而这个基础架构是基于传统关系型数据库和 SQL 的。大多数的数据仓库应用程序是使用基于 SQL 的关系型数据库实现的，所以 Hive 降低了将这些应用移植到Hadoop 上的障碍。用户如果懂得 SQL，那么学习使用 Hive 将会很容易；否则只能重新学习 MapReduce 编程。

典型 Hive 命令如下：
hive> CREATE TABLE employees(name STRING,salary FLOAT);
hive> SELECT name ,salary FROM employees;

Hive 的默认文件格式为以行存储的文本格式，文件中每行表示一个记录，记录之间以不同分隔符来区别。如下所示：

Jason^A8000
Tom^A7000
…

其中“^A”表示字段间分隔符。
更多详细资料请参考 http://hive.apache.org。

（2）Spark
Apache Spark 是一个新出现的大数据处理引擎，和 Hadoop 都属于大数据解决方案，相同之处是 Spark 也提供了类似 MapReduce 的处理。但是 Spark 没有提供文件管理系统，所以它必须和其它的分布式文件系统进行集成才能运行。实际使用中，通常是选择 Hadoop 的 HDFS，并让 Spark 运行在 YARN 上。

MapReduce 存在的问题：
① MapReduce 框架局限性
a.仅支持 Map 和 Reduce 两种操作。
b.处理效率低。

Map 中间结果写磁盘，Reduce 写 HDFS，多个 MR 之间通过 HDFS 交
换数据; 任务调度和启动开销大。
无法充分利用内存。
Map 端和 Reduce 端均需要排序。
c.不适合迭代计算(如机器学习、图计算等)，交互式处理(数据挖掘) 和流式处理(点击日志分析)。
② MapReduce 编程不够灵活

与之相比，Spark 的优势是：

① 高效(比 MapReduce 快 10~100 倍)
a.内存计算引擎，提供 Cache 机制来支持需要反复迭代计算或者多次数据共享，减少数据读取的 IO 开销。
b.DAG 引擎，减少多次计算之间中间结果写到 HDFS 的开销。
c.使用多线程池模型来减少 task 启动开稍，shuffle 过程中避免不必要的 sort操作以及减少磁盘 IO 操作。

② 易用
a.提供了丰富的 API，支持 Java、Scala、Python 和 R 四种语言。
b.代码量比 MapReduce 少 2~5 倍。
③ 与 Hadoop 集成：读写 HDFS/Hbase 与 YARN 集成。

案例环境

1. 本案例实验环境

本章是在Hadoop 环境基础上进行讲解。Hadoop 环境基础搭建可在CSDN网站主页请搜索用户：lxiaoyouyouj 就可选择博客就可以找到一篇名为：《物联网架构之Hadoop》文章，HBase 同样也有三种模式，
分为单机模式、伪分布式、完全分布式模式，前面两种不是本章学习的重点。只是简单的介绍，本章还是以 3 台主机介绍 HBase 完全分布式模式的安装。具体环境如下表

**

案例需求

下面是本案例的需求：
（1）安装部署 HBase。
（2）HBase 日常操作管理。

HBase 的安装部署

安装 HBase 与 HDFS、MapReduce 不同，HBase 需要单独安装。首先下载压缩包，注意需要选择和 Hadoop 相对应的 HBase 软件包，不然可能会有问题。本案例中提供的是 hbase-1.0.2 版本，然后将其解压到 NameNode 节点（node1）上：
首先先上传下载的Hbase的软件压缩包
解压时必须要解压到Hadoop解压的目录下面
[root@node1 ~]# tar zxvf hbase-1.0.2-bin.tar.gz -C /home/hduser/

解压后查看 Hbase 的目录结构。
下面是其中各目录用途的说明：

bin：包含了所有可执行命令与脚本。
conf：配置文件目录。
docs: 配置文档
hbase-webapps：存储 Web 应用的目录，里面应用主要用于查看 HBase 运行状态。默认访问地址 http://Master:16010，其中 Master 为 HBase Master服务器地址。
lib：jar 文件目录，包括第三方依赖与 Hadoop 相关 jar 文件。其中 Hadoop相关 jar 文件版本最好能与实际运行的 Hadoop 版本一致，保证稳定运行。

按照惯例，HBase 的 conf 目录下也提供了 hbase-site.xml 文件进行自定义配置，用以覆盖默认配置文件 hbase-default.xml，其位于 lib/hbase-common-1.0.2.jar 中。按照 hbase-site.xml 不同的配置方式，使得 HBase 分别运行在单机、伪分布式和完全分布模式下，其中运行分布式 HBase 需要以下条件：

JDK 环境
SSH 免密码登录
Hadoop 环境
这些条件的实现可请在CSDN网站主页搜索用户：lxiaoyouyouj 就可选择博客就可以找到一篇名为：《物联网架构之Hadoop》文章

单机模式

解压后即可在单机模式下运行，在此模式下只需要在hbase-1.0.2/conf/hbase-site.xml 中指定 HBase 的文件存储目录即可

[root@node1 hduser]# vim /home/hduser/hbase-1.0.2/conf/hbase-site.xml

末尾添加
其中 hbase.rootdir 指定了 HBase 的数据存储目录。注意：这是 Linux 系统的文件目录。运行下面命令即可启动 Hbase。

启动hbase
在单机模式下的 HBase 运行进程仅有 HMaster 进程。
启动后 HBase 自动创建 hbase.rootdir 目录，其中的文件数据如下所示。

停止 HBase 使用如下命令
停止后就没有 HMaster 进程了

伪分布式模式

在伪分布式模式下，HBase 只在单个节点上运行，这和单机模式一样。但是其数据文件可以存储在 HDFS 分布式存储系统中。配置伪分布模式，只需要在hbase-site.xml 中将 hbase.rootdir 的值更换为 HDFS 文件系统，修改如下配置。

上传下载的Hbase压缩包，解压操作

解压时必须要解压到Hadoop解压的目录下面
[root@node1 ~]# tar zxvf hbase-1.0.2-bin.tar.gz -C /home/hduser/

修改配置文件
[root@node1 ~]# vim /home/hduser/hbase-1.0.2/conf/hbase-site.xml
末尾添加

使用 HDFS 替换本地文件系统后，必须首先启动 HDFS，然后再启动 HBase,已经启动的就不需要在启动了，没有启动的

执行下面命令启动HDFS

启动HBase

进程列表主要包含 Hadoop 的相关进程和 HBase 的 HMaster 进程，对 HBase来说还是只有一个进程，这和单机模式并无差异。但在此模式下 HBase 数据存储目录位于 HDFS 中，如下所示。

在执行完伪分布操作后，会在 HDFS 生成 hbase 目录，此时要删除 hbase 目录，才能进行下面的完全分布式配置模式，执行前先关闭 HBase 服务。

格式化文件系统
关闭HBase服务

[root@node1 bin]# hdfs namenode -format //格式化文件系统

完全分布式部署

完全分布式与伪分布式的差别在于 HBase 会运行在多个节点上。通常是将HBase 的 HMaster 运行在 HDFS 的 NameNode 上，而 HRegionServer 运行在 HDFS DataNode 上。

在后续的实验中 HBase 均采用完全分布式模式运行，在此模式下需要在 conf 目录下配置三个文件 hbase-site.xml、hbase-env.sh 和 regionservers。首先在 node1上进行配置，随后将整个 HBase 安装目录复制到其它节点上。

在配置前先做一些必要的清理工作：

将 HDFS 中已经存在的“hdfs://node1:9000/hbase”目录删除（按前面配置示例，配置过伪分布式模式运行，已使用过该目录），如果没有请跳过。
检查并同步所有节点机（node1、node2、node3）的时钟，并且各节点与HBase 的 HMaster 节点（node1）时钟误差不能大于 30 秒。

删除vim /home/hduser/hbase-1.0.2/conf/hbase-site.xml 下添加的配置文件
[root@node1 ~]# vim /home/hduser/hbase-1.0.2/conf/hbase-site.xml

检查hbase目录是否存在：

显示已不存在

检查时间同步：

[root@node1 ~]# date
2021年 04月 14日星期三 20:01:17 CST

[root@node2 ~]# date
2021年 04月 14日星期三 20:01:17 CST

[root@node3 ~]# date
2021年 04月 14日星期三 20:01:17 CST

三台主机时间都一致

上传下载的Hbase压缩包，解压操作

解压时必须要解压到Hadoop解压的目录下面
[root@node1 ~]# tar zxvf hbase-1.0.2-bin.tar.gz -C /home/hduser/

修改配置文件
[root@node1 ~]# vim /home/hduser/hbase-1.0.2/conf/hbase-site.xml
文件末尾添加
带有汉字的地方是注释信息

其中主要参数说明如下：

hbase.cluster.distributed：默认为 false，即单机或伪分布式运行。这里设置为 true，表示在完全分布式模式运行。
hbase.master：指定 HBase 的 HMaster 服务器地址、端口。
hbase.zookeeper.quorum：指出了 ZooKeeper 集群中各服务器位置。也就是将哪些节点加入到 ZooKeeper 进行协调管理，推荐为奇数个服务器。

hbase-env.sh 文件
此文件用来配置全局的 HBase 集群系统的特性，每一台机器都可以通过该文件来了解全局的 HBase 的某些特性。需要在文件末尾增加以下环境变量

[root@node1 ~]# vim /home/hduser/hbase-1.0.2/conf/hbase-env.sh
文件末尾添加

前三个环境变量分别代表 Java、Hadoop、HBase 安装目录。完全分布式的 HBase集群需要 ZooKeeper 实例的运行，那么最后一个环境变量 HBASE_MANAGES_ZK表示 HBase 是否使用内置的 ZooKeeper 实例，默认为 true。

当在 hbase-site.xml 文件中配置了 hbase.zookeeper.quorum 属性后，系统会使用该属性所指定的 ZooKeeper 集群服务器列表。在启动 HBase 时，HBase 将把ZooKeeper 作为自身的一部分运行，其对应进程为“HQuorumPeer”，关闭 HBase 时其内置 ZooKeeper 实例也一起关闭。如果 HBASE_MANAGES_ZK 为 false，表示不会使用内置 ZooKeeper 实例，也就是内置 ZooKeeper 不会随 HBase 启动，而需要用户在指定机器上独立安装配置 ZooKeeper 实例，同样使用hbase.zookeeper.quorum 属性指定这些机器，并且在启动 HBase 之前必须手动启动这些机器的ZooKeeper。

说明：为了方便讲解，使用 HBase 内置 ZooKeeper 实例。关于 ZooKeeper 的单独安装与配置不在本课程讨论范围。如果需要，大家可以自行查阅相关资料。

regionservers 文件
该文件列出了所有 HRegionServer 节点，配置方式与 Hadoop 的 slaves 文件类似，每一行指定一台机器。当 HBase 启动、关闭时会把此文件中列出的所有机器同时启动、关闭。按下表的各机器角色分配，将 node2、node3 作为 HRegionServer。故regionservers 文件中内容如下：

regionservers 文件中内容修改为如下：
[root@node1 ~]# vim /home/hduser/hbase-1.0.2/conf/regionservers
node2
node3

注意：regionservers 文件不包含 node1，因为 node1 已在 hbase-site.xml 中被指定为 HMaster 服务器，通常不会将 HMaster 和 HRegionServer 服务器运行在一个节点上。

在机器 node1 上配置完成上面三个文件后，HBase 基本的完全分布式模式配置便已完成。同 Hadoop 分布式安装类似，还需要将 HBase 所在目录如“/home/hduser/hbase-1.0.2”分别复制到 node2、node3，使得各个节点上都能运行HBase 来构建 HBase 集群。

在 node1 上运行下面命令：
[root@node1 ~]# scp -r /home/hduser/hbase-1.0.2/ node2:/home/hduser/
[root@node1 ~]# scp -r /home/hduser/hbase-1.0.2/ node3:/home/hduser/

在启动 HBase 的过程中，HBase 会先启动 ZooKeeper，再启动所有 HMaster和 HRegionServer ，启动成功后注意 node1 上的 java 进程增加了两个：“HQuorumPeer”和“HMaster”，分别为 ZooKeeper 进程和 HBase 进程。

查看 node2 的 java 进程，多了两个进程“HQuorumPeer”和“HRegionServer”，同样分别为 ZooKeeper 进程和 HBase 进程。另外在 node3 中的 java 进程和 node2 一样。
[root@node2 ~]# jps
23667 DataNode
23811 NodeManager
42419 Jps
42068 HRegionServer
41967 HQuorumPeer

[root@node3 ~]# jps
42212 HRegionServer
42582 Jps
23630 DataNode
23774 NodeManager
42111 HQuorumPeer

在启动 HBase 后，通过命令“hbase shell”进入 HBase Shell，然后使用 HBaseShell 命令“status”可在 HBase Shell 中查看 HBase 运行状态。如下所示，表示当前共有 2 个 HRegionServer 正在正常运行。

提示：如输入命令“hbase shell”提示“bash: hbase: command not found”，此时将HBase 的 bin 目录加入到系统环境变量 PATH 中即可。方法如下：
（1）打开文件：vim /etc/profile
（2）在文件中增加一行，随后保存退出。
export PATH=/home/hduser/hbase-1.0.2/bin:$PATH”
（3）使配置生效：source /etc/profile
还可以通过 HMaster 节点的 16010 端口查看 HBase 运行状态，如
http://192.168.10.101:16010，页面输出如下图所示。

最后，使用命令“exit”即可退出 HBase Shell。

Hbase Shell 操作

前面已经接触了两个 HBase Shell 命令：status 和 exit。HBase 命令很多，其中又分为几个组，输入：help “cmd”可查看所有分组及其所包含的命令。如果需要了解具体命令的用法，可以将参数”cmd”换成具体命令，如：help “status”。下表提供了HBase Shell 的常用命令。

现在，使用命令将下表所示的概念视图 scores 表保存到 HBase 中。
创建表：create
由于将 scores 表的“name”作为行键，所以在创建表时不用预指定行键这一列。并且 “时间戳 ”这一列也是由 HBase 自动生成，所以只需指定两个列族 “grade”和“course”。

create 命令的语法格式：
语法：
create ‘表名称’,’列名称 1’,’列名称 2’,…,’列名称 N’
其中：表名、列名必须用单引号括起来并以逗号分隔。

按照 create 语法操作如下：
hbase(main):002:0> create ‘scores’,‘grade’,‘course’
0 row(s) in 0.6580 seconds

=> Hbase::Table - scores

查看所有表：list
语法：
list

使用 list 命令可以查看当前 HBase 数据库中所有表，具体操作如下。

hbase(main):003:0> list
TABLE
scores
1 row(s) in 0.0190 seconds

=> [“scores”]

可以看到当前数据库中已经存在“scores”表。如果要查看该表所有列族的详细描述信息可使用 describe 命令。

语法：
describe ‘表名’

其中关于列族描述信息具体含义如下表所示。

添加数据：put
向 scores 中增加一些数据，使用 put 命令可向表中插入数据。
语法：

put ‘表名称’,’行键’,’列键’,’值’

具体操作如下：

扫描表：scan
scan 用于进行全表单元扫描。
语法：

scan ‘表名称’,{COLUMNS=>[‘列族名 1’,’列族名 2’…],参数名=>参数值…}

大括号内的内容为扫描条件。如果不指定扫描条件，则查询所有数据。

输出结果显示共 2 行数据，因为在 scan 的结果中，相同行键的所有单元视为一行。如果对有些列族不关心，便可指定查询某个列族。

能不能指定列键来扫描呢？肯定是可以的，语法如下。
语法：

scan ‘表名称’,{COLUMN=>[‘列键 1’,’列键 2’…],参数名=>参数值…}

将 COLUMNS 替换成 COLUMN，表示当前扫描的目标是列键，注意区分大小写。如下所示，扫描所有行的列键为“course:math”的单元，并使用 LIMIT 参数限制为输出一个单元。

获取数据：get
get 用于获取行的所有单元或者某个指定的单元。
语法：

get ‘表名称’,’行键’,{COLUMNS=>[‘列族名 1’,’列族名 2’…],参数名=>参数值…}

get ‘表名称’,’行键’,{COLUMN=>[‘列键 1’,’列键 2’…],参数名=>参数值…}

与 scan 相比多一个参数即行键。scan 查找的目标是全表的某个列族、列键，而get 查找的目标是某行的某个列族、列健。

查找行键为“jason”的所有单元：
从上面输出结果可见，不指定列族或列键，会输出行键的所有列键单元。

精确查找行键为“jason”，列键为“course:math”的单元：

删除数据：delete
语法：

delete ‘表名称’,’行键’,’列键’

deleteall ‘表名称’,’行键’

delete 只能删除一个单元，而 deleteall 为删除一行。下面删除 scores 表中，行键为“jason”，列键为“course:art”的单元：

修改表：alter
使用 alter 可为表增加或修改列族。
语法：

alter ‘表名称’,参数名=>参数值,…

其中列族名参数 NAME 必须提供，如果已存在则修改，否则增加一个列族。下面示例将 scores 表的列族“course”的“VERSIONS”参数修改为“5”：

同时修改或增加多个列族时以逗号分开，并且每个列族用“{}”括起来。
语法：

alter ‘表名称’,{参数名=>参数值,…},{参数名=>参数值,…}…

下面示例将同时修改 scores 表的两个列族：

删除表：drop
在前面的 describe 命令操作过程中就可以发现， HBase 表分两种状态：
DISABLED 和 ENABLED，分别表示是否可用状态。

使用 disable 将表置为不可用状态：
hbase(main):027:0> disable ‘scores’
0 row(s) in 1.1970 seconds

使用 enable 将表置为可用状态：
hbase(main):028:0> enable ‘scores’
0 row(s) in 0.2200 seconds

当表为 ENABLED 状态时，表会禁止被删除。所以必须先将表置为 DISABLED状态。操作如下：

MapReduce 与 Hbase

为什么要集成 MapReduce 和 HBase？

HBase 可以使用本地文件系统和 HDFS 文件系统作为数据存储介质，当在伪分布式和完全分布式下运行时，其使用的是 HDFS 文件系统。不用关心 HBase 中的表是如何在 HDFS 上存储的，但是数据最终会被写入某些文件中，并且可以通过 HBase将数据从这些文件中读取出来。

再来看，一个 MapReduce 应用要被定义为一个作业才能在 MapReduce 框架中运行，这些定义包括两个基本要素：MapReduce 的输入和输出，包括数据输入/输出的文件和处理这些文件所采用的输入/输出格式。

综上两点，可以让 MapReduce 作业需要输入数据时从 HBase 中读取，而在输出数据时，又可以输出到 HBase 完成存储，达到 HBase 与 MapReduce 协同工作，为 MapReduce 提供数据的输入输出的目的。这样带来的好处是，既利用了MapReduce 分布式计算的优势，也利用了 HDFS 海量存储的特点，特别是利用了HBase 对海量数据的实时访问的特点。通过 MapReduce 和 HBase 的集成，MapReduce、HBase、HDFS 之间关系如下图所示。

除了将 HBase 作为 MapReduce 作业的输入和输出，集成 MapReduce 与 HBase还可以做什么呢？

（1）可以对 HBase 中的数据进行非实时性的统计分析。HBase 适合做 Key-Value查询，默认不带聚合函数（sum、avg 等），对于这种需求非常适合集成 MapReduce来完成，但也应该注意到 MapReduce 局限性，MapReduce 的本身高延迟使得它不能满足实时交互式的计算。

（2）可以对 HBase 的表数据进行分布式计算。HBase 的目标是在海量数据中快速定位所需要的数据并访问它，可以发现 HBase 只能按照行键查询并不支持其他条件查询，所以只依靠 HBase 来解决存储的扩展，而不是业务逻辑，那么此时将业务逻辑放到 MapReduce 计算框架中是合适的。

（3）可以在多个 MapReduce 间使用 HBase 作为中间存储介质。
HBase Java API 对 MapReduce API 进行了扩展，这里将其称为 HBaseMapReduce API。显然这是由 HBase 提供，主要是为了方便 MapReduce 应用对HTable 的操作。

前面提过，MapReduce 的输入和输出包括数据输入/输出的文件和处理这些文件所采用的输入/输出格式，与 HBase 集成后，“输入/输出的文件”变为“表（HTable）”，那么针对表的输入 / 输出格式也得提供相应实现，分别是 TableInputFormat 和TableOutputFormat，其所在 jar 文件为“hbase-server-1.0.2.jar”。同时，HBase 还提供了 TableMapper 和 TableReducer 类使得编写 MapReduce 程序更加方便。

表中左侧的类均继承于右侧的类，关于 HBase MapReduce API 的具体使用
在稍后再详细讲解。默认情况下，MapReduce 作业发布到集群中后，不能访问 HBase的配置文件和相关类，所以首先需要对集群中的各节点的 Hadoop 环境做如下调整：

（1）将 hbase-site.xml 复制到$HADOOP_HOME/etc/hadoop 下；
[root@node1 ~]# cp /home/hduser/hbase-1.0.2/conf/hbase-site.xml $HADOOP_HOME/etc/hadoop
（2）编辑$HADOOP_HOME/etc/hadoop/hadoop-env.sh，增加一行：
[root@node1 ~]# vim $HADOOP_HOME/etc/hadoop/hadoop-env.sh
末尾添加

其中，HBase 的路径视其安装目录而不同。第一步可使 MapReduce 作业在运行时可以连接到 ZooKeeper 集群；第二步将 HBase 安装目录 lib 下的所有 jar 文件添加到环境变量$HADOOP_CLASSPATH 中，使得 MapReduce 作业可以访问所依赖的HBase 相关类，从而不用每次将 HBase 相关类打包到 MapReduce 应用的 jar 文件中。

最后注意将上述操作的两个文件，复制到 Hadoop 集群中其它节点上。

使用如下命令可测试环境是否已正确配置：
music是hbase里面的表，可以统计出这个表的行数
省略部分内容…

该命令将运行“hbase-server-1.0.2.jar”中的 MapReduce 应用“rowcounter”，参数为表名“music”。其功能是使用 MapReduce 框架统计 HBase 数据库表 music 中的行数。

你可能感兴趣的:(linux,centos,服务器,运维)

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
第六集如何安装CentOS7.0，3分钟学会centos7安装教程 date分享
从光盘引导系统按回车键继续进入引导程序安装界面，选择语言这里选择简体中文版点击继续选择桌面安装下面给系统分区选择磁盘，点击完成选择基本分区，点击加号swap分区,大小填内存的两倍在选择根分区，使用所有可用的磁盘空间选择文件系统ext4点击完成，点击开始安装设置root密码，点击完成设置普通用户和密码，点击完成整个过程持续八分钟左右根据个人配置不同，时间长短不同好，现在点击重启系统进入重启状态点击本
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
CentOS的根目录下，/bin 和 /sbin 用途和权限 Energet!c Linux日常 centos linux 运维
CentOS的根目录下，/bin和/sbin用途和权限一、/bin(Binary)二、/sbin(SystemBinary)三、总结在CentOS的根目录下，/bin和/sbin目录有不同的用途和权限一、/bin(Binary)用途:存放系统的基本命令，这些命令对所有用户都是可用的。例如：ls、cp、mv、rm等。权限:普通用户和系统管理员都可以使用这些命令。二、/sbin(SystemBinar
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
linux 发展史种树的猴子内核 java 操作系统 linux 大数据
linux发展史说明此前对linux认识模糊一知半解，近期通过学习将自己对于linux的发展总结一下方便大家日后的学习。那Linux是目前一款非常火热的开源操作系统，可是linux是什么时候出现的，又是因为什么样的原因被开发出来的呢。以下将对linux的发展历程进行详细的讲解。目录一、Linux发展背景二、UINIX的诞生三、UNIX的重要分支-BSD的诞生四、Minix的诞生五、GNU与Free
Linux sh命令 fengyehongWorld Linux linux
目录一.基本语法二.选项2.1-c字符串中读取内容，并执行2.1.1基本用法2.1.2获取当前目录下失效的超链接2.2-x每个命令执行之前，将其打印出来2.3结合Here文档使用一.基本语法⏹Linux和Unix系统中用于执行shell脚本或运行命令的命令。sh[选项][脚本文件][参数...]⏹选项-c：从字符串中读取内容，并执行。-x：在每个命令执行之前，将其打印出来。-s：从标准流中读取内容
Linux vi常用命令 fengyehongWorld Linux linux
参考资料viコマンド（vimコマンド）リファレンス目录一.保存系命令二.删除系命令三.移动系命令四.复制粘贴系命令一.保存系命令⏹保存并退出:wq⏹强制保存并退出:wq!⏹退出(文件未编辑):q⏹强制退出(忽略已编辑内容):q!⏹另存为:w新文件名二.删除系命令⏹删除当前行dd⏹清空整个文档gg：移动到文档顶部dG：删除到最后一行ggdG三.移动系命令⏹移动到文档顶部gg⏹移动到文档底部#方式1G
CentOS 7官方源停服，配置本机光盘yum源码哝小鱼 linux运维 centos linux 运维
1、挂载系统光盘mkdir/mnt/isomount-oloop/tools/CentOS-7-x86_64-DVD-1810.iso/mnt/isocd/mnt/iso/Packages/rpm-ivh/mnt/iso/Packages/yum-utils-1.1.31-50.el7.noarch.rpm(图形界面安装，默契已安装）如安装yum-utils依赖错误，按提示安装依赖包rpm-ivh
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
Linux查看服务器日志 TPBoreas 运维 linux 运维
一、tail这个是我最常用的一种查看方式用法如下：tail-n10test.log查询日志尾部最后10行的日志;tail-n+10test.log查询10行之后的所有日志;tail-fn10test.log循环实时查看最后1000行记录(最常用的)一般还会配合着grep用，(实时抓包)例如:tail-fn1000test.log|grep'关键字'（动态抓包）tail-fn1000test.log
Python多线程实现大规模数据集高效转移 sand&wich 网络 python 服务器
背景在处理大规模数据集时，通常需要在不同存储设备、不同服务器或文件夹之间高效地传输数据。如果采用单线程传输方式，当数据量非常大时，整个过程会非常耗时。因此，通过多线程并行处理可以大幅提升数据传输效率。本文将分享一个基于Python多线程实现的高效数据传输工具，通过遍历源文件夹中的所有文件，将它们移动到目标文件夹。工具和库这个数据集转移工具主要依赖于以下Python标准库：os：用于文件系统操作，如
笋丁网页自动回复机器人V3.0.0免授权版源码希希分享软希网58soho_cn 源码资源笋丁网页自动回复机器人
笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
最简单将静态网页挂载到服务器上(不用nginx) 全能全知者服务器 nginx 运维前端 html 笔记
最简单将静态网页挂载到服务器上(不用nginx)如果随便弄个静态网页挂在服务器都要用nignx就太麻烦了，所以直接使用Apache来搭建一些简单前端静态网页会相对方便很多检查Web服务器服务状态：sudosystemctlstatushttpd#ApacheWeb服务器如果发现没有安装web服务器：安装Apache：sudoyuminstallhttpd启动Apache：sudosystemctl
阿里云服务器4核8G配置购买及价格类文章汇总（10篇）阿里云最新优惠和活动汇总
阿里云服务器4核8G配置如何购买？价格是多少？4核8G配置的阿里云服务器可以通过云服务器产品页购买也可以通过阿里云活动去下单购买，一般通过活动购买的用户比较多，但是不同实例规格的阿里云服务器价格不一样，带宽不同价格也不一样，本文为大家汇总了10篇关于阿里云服务器4核8G配置购买教程文章和价格类文章，分为购买类文章和价格类文章，以供大家参考如何购买阿里云服务器4核8G配置和最新优惠价格是多少。阿里云
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s