bin/hbase shell
能够展示 HBase 中所有能使用的命令,主要使用的命令有 namespace 命令空间相关, DDL 创建修改表格,DML 写入读取数据。
help
1)创建命名空间
create_namespace 'test_namespace';
3)查看所有的命名空间
list_namespace;
在 bigdata 命名空间中创建表格 student,两个列族。info 列族数据维护的版本数为 5 个, 如果不写默认版本数为 1。
create 'test_namespace:student', {NAME => 'info', VERSIONS => 5}, {NAME => 'msg'}
如果创建表格只有一个列族,没有列族属性,可以简写。 如果不写命名空间,使用默认的命名空间 default。
create 'student1','info'
查看表有两个命令:list 和 describe list:查看所有的表名
list
describe:查看一个表的详情
describe 'student1';
表名创建时写的所有和列族相关的信息,都可以后续通过 alter 修改,包括增加删除列 族。
(1)增加列族和修改信息都使用覆盖的方法
alter 'test_namespace.student', {NAME => 'f1', VERSIONS => 3};
(2)删除信息使用特殊的语法
alter 'test_namespace.student', NAME => 'f1', METHOD => 'delete';
或
alter 'test_namespace.student', 'delete' => 'f1';
shell 中删除表格,需要先将表格状态设置为不可用。
disable 'test_namespace.student';
drop 'test_namespace.student';
在 HBase 中如果想要写入数据,只能添加结构中最底层的 cell。可以手动写入时间戳指 定 cell 的版本,推荐不写默认使用当前的系统时间。
put 'test_namespace:student','1001','info:name','zhangsan'
put 'test_namespace:student','1002','info:name','lisi'
put 'test_namespace:student','1003','info:age','18'
读取数据的方法有两个:get 和 scan。
get 最大范围是一行数据,也可以进行列的过滤,读取数据的结果为多行 cell。
get 'test_namespace:student','1003'
过滤列
get 'test_namespace:student','1001', {COLUMN => ['info:name']}
过滤版本
也可以修改读取 cell 的版本数,默认读取一个。最多能够读取当前列族设置的维护版本数。
get 'test_namespace:student','1001' , {COLUMN => ['info:name'], VERSIONS => 2}
scan 是扫描数据,能够读取多行数据,不建议扫描过多的数据,推荐使用 startRow 和 stopRow 来控制读取的数据,默认范围左闭右开。
scan 'test_namespace:student'
scan 'test_namespace:student', {STARTROW => '1001',STOPROW => '1002'}
delete 表示删除一个版本的数据,即为 1 个 cell,不填写版本默认删除最新的一个版本。
delete 'test_namespace:student','1001','info:name'
deleteall 表示删除所有版本的数据,即为当前行当前列的多个 cell。(执行命令会标记 数据为要删除,不会直接将数据彻底删除,删除数据只在特定时期清理磁盘时进行)
deleteall 'test_namespace:student','1001','info:name'