VanasWang

HBase API+优化+Phenix+索引笔记

文章目录

HBase优化

预分区

1.手动设定预分区
2.指明分区个数
3.按照文件中设置的规则预分区
4.使用javaApi创建预分区

rowKey的设计

小案例：

内存优化
基础优化

HBase底层原理
HBase与Hive集成使用
Phoenix

安装配置
配置环境变量
启动
Shell操作

删除表

映射：

视图映射

创建视图
删除视图

表映射

Phoenix数字问题
idea可视化
Phoenix JDBC操作

Thin 瘦客户端
Thick胖客户端

索引

参数配置
全局二级索引
本地二级索引

API

创建表、删除表、表是否存在、

添加依赖

<dependency>
    <groupId>org.apache.hbasegroupId>
    <artifactId>hbase-serverartifactId>
    <version>2.0.5version>
dependency>

<dependency>
    <groupId>org.apache.hbasegroupId>
    <artifactId>hbase-clientartifactId>
    <version>2.0.5version>
dependency>

DDL

java

package com.vanas.hbase.client;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.NamespaceDescriptor;
import org.apache.hadoop.hbase.NamespaceExistException;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.util.Bytes;

import java.io.IOException;

/**
 * @author Vanas
 * @create 2020-06-28 2:20 下午
 */
public class HBaseUtil {
    public static Connection connection;

    static {
        try {
            Configuration conf = HBaseConfiguration.create();
            conf.set("hbase.zookeeper.quorum", "hadoop102,hadoop103,hadoop104");
            connection = ConnectionFactory.createConnection(conf);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    public static void createNameSpace(String nameSpace) throws IOException {
        Admin admin = connection.getAdmin();
        NamespaceDescriptor namespaceDescriptor = NamespaceDescriptor.create(nameSpace).build();

        try {
            admin.createNamespace(namespaceDescriptor);
        } catch (NamespaceExistException e) {
            System.err.println(nameSpace + "已存在");
        } finally {
            admin.close();
        }

    }

    public static void createTable(String nameSpace, String tableName, String... families) throws IOException {
        if (families.length < 1) {
            System.out.println("至少有一个列族");
            return;
        }
        Admin admin = connection.getAdmin();
        try {
            if (admin.tableExists(TableName.valueOf(nameSpace, tableName))) {
                System.out.println(nameSpace + ":" + tableName + "已存在");
                return;
            }
            TableDescriptorBuilder builder = TableDescriptorBuilder.newBuilder(TableName.valueOf(nameSpace, tableName));
            for (String family : families) {
                ColumnFamilyDescriptorBuilder cfBuilder = ColumnFamilyDescriptorBuilder.newBuilder(Bytes.toBytes(family));
                builder.setColumnFamily(cfBuilder.build());
            }
            admin.createTable(builder.build());
        } finally {
            admin.close();
        }

    }

    public void deleteTable(String nameSpace, String tableName) throws IOException {
        Admin admin = connection.getAdmin();
        try {
            if (!admin.tableExists(TableName.valueOf(nameSpace, tableName))) {
                System.out.println(nameSpace + ":" + tableName + "不存在");
                return;
            }
            admin.disableTable(TableName.valueOf(nameSpace, tableName));
            admin.deleteTable(TableName.valueOf(nameSpace, tableName));
        } finally {
            admin.close();
        }
    }

    public static void main(String[] args) throws IOException {
        createNameSpace("vanas");
        createTable("vamas", "student", "info", "msg");
    }
}

Scala

package com.vanas.hbase

import org.apache.hadoop.hbase.{HBaseConfiguration, NamespaceDescriptor, TableName}
import org.apache.hadoop.hbase.client.{Admin, ColumnFamilyDescriptorBuilder, Connection, ConnectionFactory, TableDescriptorBuilder}
import org.apache.hadoop.hbase.util.Bytes


/**
 * @author Vanas
 * @create 2020-06-24 9:22 上午 
 */
object HbaseDDL {
    //1.先获取hbase的连接
    val conf = HBaseConfiguration.create()
    conf.set("hbase.zookeeper.quorum", "hadoop130,hadoop133,hadoop134")
    val conn: Connection = ConnectionFactory.createConnection(conf)

    def main(args: Array[String]): Unit = {

        //println(tableExists("user"))

        createTable("hbase1", "cf1", "cf2")

        //createNS("abc")
        closeConnection()

    }

    def createNS(name: String) = {
        val admin: Admin = conn.getAdmin
        if (!nsExists(name)) {
            val nd: NamespaceDescriptor.Builder = NamespaceDescriptor.create(name)
            admin.createNamespace(nd.build())
        } else {
            println(s"创建的命名空间：${name}已经存在")
        }

        admin.close()
    }

    def nsExists(name: String): Boolean = {
        val admin: Admin = conn.getAdmin
        val nss: Array[NamespaceDescriptor] = admin.listNamespaceDescriptors()
        val r: Boolean = nss.map(_.getName).contains(name)
        admin.close()
        r
    }

    def deleteTable(name: String) = {
        val admin: Admin = conn.getAdmin

        if (tableExists(name)) {
            admin.disableTable(TableName.valueOf(name))
            admin.deleteTable(TableName.valueOf(name))
        }
        admin.close()
    }

    /**
     * 创建指定编表
     *
     * @param name
     */
    def createTable(name: String, cfs: String*): Boolean = {
        val admin: Admin = conn.getAdmin
        val tableName = TableName.valueOf(name)

        if (tableExists(name)) return false

        val td = TableDescriptorBuilder.newBuilder(tableName)

        cfs.foreach(cf => {
            val cfd = ColumnFamilyDescriptorBuilder
                    .newBuilder(Bytes.toBytes(cf))
                    .build()
            td.setColumnFamily(cfd)
        })

        admin.createTable(td.build())
        admin.close()
        true
    }

    /**
     * 判断表是否存在
     *
     * @param name
     * @return
     */
    def tableExists(name: String): Boolean = {

        //2.获取管理对象 Admin
        val admin: Admin = conn.getAdmin

        //3.利用Admin进行各种操作
        val tableName = TableName.valueOf(name)
        val b: Boolean = admin.tableExists(tableName)

        //4.关闭Admin
        admin.close()
        b
    }

    //4.关闭连接
    def closeConnection() = conn.close()

}

DML

java

   public static void putCell(String nameSpace, String tableName, String rowKey, String family, String column, String value) throws IOException {
        Table table = connection.getTable(TableName.valueOf(nameSpace, tableName));
        try {
            Put put = new Put(Bytes.toBytes(rowKey));
            put.addColumn(Bytes.toBytes(family), Bytes.toBytes(column), Bytes.toBytes(value));
            table.put(put);
        } finally {
            table.close();
        }
    }

    public static void getCell(String nameSpace, String tableName, String rowKey, String family, String column) throws IOException {

        Table table = connection.getTable(TableName.valueOf(nameSpace, tableName));
        Get get = new Get(Bytes.toBytes(rowKey));
        get.addColumn(Bytes.toBytes(family), Bytes.toBytes(column));
        Result result = table.get(get);

        Cell[] cells = result.rawCells();
        for (Cell cell : cells) {
            System.out.println("CF:" + Bytes.toString(CellUtil.cloneFamily(cell)) +
                    ",CN:" + Bytes.toString(CellUtil.cloneQualifier(cell)) +
                    ",Value:" + Bytes.toString(CellUtil.cloneValue(cell)));
        }
        table.close();

    }

    public static void scanRows(String nameSpace, String tableName, String startRow, String stopRow) throws IOException {
        Table table = connection.getTable(TableName.valueOf(nameSpace, tableName));
        Scan scan = new Scan();
        Scan scan1 = scan.withStartRow(Bytes.toBytes(startRow)).withStopRow(Bytes.toBytes(stopRow));
        ResultScanner scanner = table.getScanner(scan1);

        for (Result result : scanner) {
            Cell[] cells = result.rawCells();
            for (Cell cell : cells) {
                System.out.println("CF:" + Bytes.toString(CellUtil.cloneFamily(cell)) +
                        ",CN:" + Bytes.toString(CellUtil.cloneQualifier(cell)) +
                        ",Value:" + Bytes.toString(CellUtil.cloneValue(cell)));
            }
        }
        scanner.close();
        table.close();
    }

    public void deleteCell(String nameSpace, String tableName, String rowKey, String family, String column) throws IOException {
        Table table = connection.getTable(TableName.valueOf(nameSpace, tableName));
        Delete delete = new Delete(Bytes.toBytes(rowKey));
        delete.addColumns(Bytes.toBytes(family), Bytes.toBytes(column)); //删所有版本
        table.delete(delete);
        table.close();
    }

scala

package com.vanas.hbase

import java.util

import org.apache.hadoop.hbase.client._
import org.apache.hadoop.hbase.filter.SingleColumnValueFilter
import org.apache.hadoop.hbase.util.Bytes
import org.apache.hadoop.hbase.{Cell, CellUtil, CompareOperator, HBaseConfiguration, TableName}

/**
 * @author Vanas
 * @create 2020-06-24 11:04 上午 
 */
object HbaseDML {
    //1.先获取hbase的连接
    val conf = HBaseConfiguration.create()
    conf.set("hbase.zookeeper.quorum", "hadoop130,hadoop133,hadoop134")
    val conn: Connection = ConnectionFactory.createConnection(conf)

    def main(args: Array[String]): Unit = {

        //putData("user", "1001", "info", "name", "ww")
        //deleteData("user", "1001", "info", "age")
        //getData("user", "1001", "info", "name")
        scanData("user")
        closeConnection()
    }


    def scanData(tableName: String) = {
        val table: Table = conn.getTable(TableName.valueOf(tableName))
        val scan = new Scan()
        val filter = new SingleColumnValueFilter(Bytes.toBytes("info"), Bytes.toBytes("name"), CompareOperator.EQUAL, Bytes.toBytes("ww"))
        filter.setFilterIfMissing(true)
        scan.setFilter(filter)
        val results: ResultScanner = table.getScanner(scan)

        import scala.collection.JavaConversions._
        //从scanner拿到所有数据
        for (result <- results) {
            val cells: util.List[Cell] = result.listCells() //rowCells
            if (cells != null) {
                for (cell <- cells) {
                    println(
                        s"""
                           |row =${Bytes.toString(CellUtil.cloneRow(cell))}
                           |cf =${Bytes.toString(CellUtil.cloneFamily(cell))}
                           |name =${Bytes.toString(CellUtil.cloneQualifier(cell))}
                           |value =${Bytes.toString(CellUtil.cloneValue(cell))}
                           |""".stripMargin)
                }
            }
        }
        table.close()
    }

    def getData(tableName: String, rowKey: String, cf: String, columnName: String) = {
        val table: Table = conn.getTable(TableName.valueOf(tableName))
        val get = new Get(Bytes.toBytes(rowKey))
        get.addColumn(Bytes.toBytes(cf), Bytes.toBytes(columnName))
        val result: Result = table.get(get)


        //这个是用来在java的集合和scala的集合之间转换（隐式转换）
        import scala.collection.JavaConversions._
        val cells: util.List[Cell] = result.listCells() //rowCells
        if (cells != null) {
            for (cell <- cells) {
                //cell.getFamilyArray
                //println(Bytes.toString(CellUtil.cloneFamily(cell)))
                println(
                    s"""
                       |row =${Bytes.toString(CellUtil.cloneRow(cell))}
                       |cf =${Bytes.toString(CellUtil.cloneFamily(cell))}
                       |name =${Bytes.toString(CellUtil.cloneQualifier(cell))}
                       |value =${Bytes.toString(CellUtil.cloneValue(cell))}
                       |""".stripMargin)
            }
        }
        table.close()
    }

    def deleteData(tableName: String, rowKey: String, cf: String, columnName: String) = {
        val table: Table = conn.getTable(TableName.valueOf(tableName))
        val delete = new Delete(Bytes.toBytes(rowKey))
        //delete.addColumn(Bytes.toBytes(cf), Bytes.toBytes(columnName))
        delete.addColumns(Bytes.toBytes(cf), Bytes.toBytes(columnName)) //删除所有版本
        table.delete(delete)

        table.close()
    }

    def putData(tableName: String, rowKey: String, cf: String, columnName: String, value: String) = {

        //最好先判断下
        //1.先获取到表对象，客户端到表连接
        val table: Table = conn.getTable(TableName.valueOf(tableName))

        //2.调用表对象的put
        //2.1 把需要添加的数据封装到一个Put对象 ,put ''.rowkey,''
        val put = new Put(Bytes.toBytes(rowKey))
        put.addColumn(Bytes.toBytes(cf), Bytes.toBytes(columnName), Bytes.toBytes(value))
        //put.addColumn(Bytes.toBytes(cf), Bytes.toBytes(columnName + "abc"), Bytes.toBytes(value + "efg"))

        //2.2 提交Put对象
        table.put(put)

        //3.关闭到table的连接
        table.close()
    }

    //4.关闭连接
    def closeConnection() = conn.close()

}

HBase优化

预分区

1.手动设定预分区

hbase> create 'staff1','info',SPLITS => ['1000','2000','3000','4000']

2.指明分区个数

15个区，分区策略按照16进制字符串分

所以rowKey也要变为16进制字符串才能匹配

分区键什么样对应的rowKey也要保持什么样

create 'staff2','info',{NUMREGIONS => 15, SPLITALGO => 'HexStringSplit'}

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dgaH2VeG-1593336073442)(/Users/vanas/Desktop/截屏2020-06-28下午4.01.10.png)]

3.按照文件中设置的规则预分区

vim splits.txt
aaaa
bbbb
cccc
dddd
--要有序
--在当前路径进入到hbase shell
create 'staff3','info',SPLITS_FILE => 'splits.txt'

4.使用javaApi创建预分区

        byte[][] splits=new byte[3][];
        splits[0]=Bytes.toBytes("aaa");
        splits[1]=Bytes.toBytes("bbb");
        splits[2]=Bytes.toBytes("ccc");

        Admin admin = connection.getAdmin();
        TableDescriptorBuilder builder = TableDescriptorBuilder.newBuilder(TableName.valueOf("bigdata"));
        ColumnFamilyDescriptorBuilder cfBuilder= ColumnFamilyDescriptorBuilder.newBuilder(Bytes.toBytes("info"));
        builder.setColumnFamily(cfBuilder.build());
        admin.createTable(builder.build(),splits);
        admin.close();

scala

    def createTable(name: String, cfs: String*): Boolean = {
        val admin: Admin = conn.getAdmin
        val tableName = TableName.valueOf(name)

        if (tableExists(name)) return false

        val td = TableDescriptorBuilder.newBuilder(tableName)


        cfs.foreach(cf => {
            val cfd = ColumnFamilyDescriptorBuilder
                    .newBuilder(Bytes.toBytes(cf))
                    .build()
            td.setColumnFamily(cfd)
        })

        //admin.createTable(td.build())
        val splites = Array(Bytes.toBytes("aaa"), Bytes.toBytes("bbb"), Bytes.toBytes("ccc"))

        admin.createTable(td.build(), splites)
        admin.close()
        true
    }

rowKey的设计

1.长度

1亿条

row：10字节 1亿*10 =10亿字节

row：100字节

10-100字节 2的幂次方 8、16、32、64

长度相同

2.散列

对rowKey散列防止数据倾斜

md5

hash

3.唯一性

放置rowKey重复

反转的意义：把类似的信息放一起，方便之后查找

hbase.apache.org => gro.echapa…

hadoop.apache.org

kafka.apache.org

rowKey里包含有意义的信息

ID name age sex

rowKey :id

列：name age sex

rowKey :1001_lisi_10

小案例：

统计网站的每分钟的访问次数，怎么设计预分区和rowKey？

user_id timestamp

rowKey唯一性，保证后期查询时的数据要写在一起

1.满足业务

2.解决热点问题

yyyyMMddHHmmssSSS. 避免这种单调递增的rowkey

当分裂时都往新的region里写，出现热点问题

违反唯一性

yyyyMMddHHmmssSSS_user_id

mmHHddMMyyyy_user_id 这种可行

加有规律的随机数 %5(0,1,2,3,4)分区键设计1,2,3,4

取前缀求哈希值模一个数（分区键=>按取模的数订就可以了）

“yyyyMMddHHmm”.hashCode()%5_yyyyMMddHHmmssSSS_user_id

-,1

1,2

2,3

3,4

4,+

查询：202003211203

scan("202003211203".hashCode()%5_202003211203,
     "202003211203".hashCode()%5_202003211203|)

如果50个分区，分区键设计？

-,01

01,02

02,03

03,04

04,+

设计rowKey时尽量短一些不要太长，保证业务要求的情况下越短越好，列族，列名也尽可能短

内存优化

regionServer占用的多，一般分配16-36G就可以

hbase-env.sh

export HBASE_OFFHEAPSIZE 调整参数大小

# Uncomment below if you intend to use off heap cache. For example, to allocate 8G of 
# offheap, set the value to "8G".
# export HBASE_OFFHEAPSIZE=1G

基础优化

--1.Zookeeper会话超时时间
hbase-site.xml
属性：zookeeper.session.timeout
解释：默认值为90000毫秒（90s）。当某个RegionServer挂掉，90s之后Master才能察觉到。可适当减小此值，以加快Master响应，可调整至600000毫秒。

--2.设置RPC监听数量
hbase-site.xml
属性：hbase.regionserver.handler.count
解释：默认值为30，用于指定RPC监听的数量，可以根据客户端的请求数进行调整，读写请求较多时，增加此值。
一般调regionServer所在节点的核数的倍数 2倍就行

--3.手动控制Major Compaction
hbase-site.xml
属性：hbase.hregion.majorcompaction
解释：默认值：604800000秒（7天）， Major Compaction的周期，若关闭自动Major Compaction，可将其设为0

--4.优化HStore文件大小
hbase-site.xml
属性：hbase.hregion.max.filesize
解释：默认值10737418240（10GB），如果需要运行HBase的MR任务，可以减小此值，因为一个region对应一个map任务，如果单个region过大，会导致map任务执行时间过长。该值的意思就是，如果HFile的大小达到这个数值，则这个region会被切分为两个Hfile。

--5.优化HBase客户端缓存
hbase-site.xml
属性：hbase.client.write.buffer
解释：默认值2097152bytes（2M）用于指定HBase客户端缓存，增大该值可以减少RPC调用次数，但是会消耗更多内存，反之则反之。一般我们需要设定一定的缓存大小，以达到减少RPC次数的目的。
一般做测试来决定值，没什么固定值

--6.指定scan.next扫描HBase所获取的行数
hbase-site.xml
属性：hbase.client.scanner.caching
解释：用于指定scan.next方法获取的默认行数，值越大，消耗内存越大。

--7.BlockCache占用RegionServer堆内存的比例
hbase-site.xml
属性：hfile.block.cache.size
解释：默认0.4，读请求比较多的情况下，可适当调大

--8.MemStore占用RegionServer堆内存的比例
hbase-site.xml
属性：hbase.regionserver.global.memstore.size
解释：默认0.4，写请求较多的情况下，可适当调大

--7 和 --8 加起来差不多0.8就可以了

HBase底层原理

Log Struct Merge Tree

LSMT数据结构

HBase与Hive集成使用

hive-site.xml

    <property>
        <name>hive.zookeeper.quorumname>
        <value>hadoop102,hadoop103,hadoop104value>
    property>

    <property>
        <name>hive.zookeeper.client.portname>
        <value>2181value>
    property>

Hive 建表关联hbase

CREATE TABLE hive_hbase_emp_table(
empno int,
ename string,
job string,
mgr int,
hiredate string,
sal double,
comm double,
deptno int)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,info:ename,info:job,info:mgr,info:hiredate,info:sal,info:comm,info:deptno")
TBLPROPERTIES ("hbase.table.name" = "hbase_emp_table");

临时表

CREATE TABLE emp(
empno int,
ename string,
job string,
mgr int,
hiredate string,
sal double,
comm double,
deptno int)
row format delimited fields terminated by '\t';

只能用insert

load data local inpath '/opt/module/hive/datas/emp.txt' into table emp;
insert into table hive_hbase_emp_table select * from emp;

Hive 映射一个在hbase已经存在的表

CREATE EXTERNAL TABLE relevance_hbase_emp(
empno int,
ename string,
job string,
mgr int,
hiredate string,
sal double,
comm double,
deptno int)
STORED BY 
'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = 
":key,info:ename,info:job,info:mgr,info:hiredate,info:sal,info:comm,info:deptno") 
TBLPROPERTIES ("hbase.table.name" = "hbase_emp_table");

Phoenix

协处理器是给HBase建立二级索引用的

绑定的表发生写操作或者读操作时，相应的去做什么

协处理器需要放在hbase的lib目录下

有2种客户端

胖客户端瘦客户端

安装配置

tar -zxvf apache-phoenix-5.0.0-HBase-2.0-bin.tar.gz -C /opt/module/

mv apache-phoenix-5.0.0-HBase-2.0-bin phoenix-5.0.0

cd /opt/module/phoenix/
cp phoenix-5.0.0-HBase-2.0-server.jar /opt/module/hbase-5.0.0/lib/

cd /opt/module/hbase-5.0.0/lib/
xsync phoenix-5.0.0-HBase-2.0-server.jar

配置环境变量

#phoenix
export PHOENIX_HOME=/opt/module/phoenix-5.0.0
export PHOENIX_CLASSPATH=$PHOENIX_HOME
export PATH=$PATH:$PHOENIX_HOME/bin

启动

hadoop集群、zookeeper、hbase

sqlline.py 胖客户端 zk地址不传地址默认时localhost

[vanas@hadoop130 ~]$ sqlline.py hadoop130,hadoop133,hadoop134:2181

queryserver.py 瘦客户端

Shell操作

!table

--primary key 相当于hbase里的rowkey
CREATE table user(id varchar primary key,name varchar,age bigint);
!table

第一行涉及到空值的处理问题

列名编码 0是列族名、\x00\x00 减少对磁盘的占用把列名映射成数字

COLUMN_ENCODED_BYTES=0

一般还是会使用列名的

--更新和插入合体
0: jdbc:phoenix:hadoop130,hadoop133,hadoop134> upsert into user values('1001','lisi',10);
1 row affected (0.082 seconds)
0: jdbc:phoenix:hadoop130,hadoop133,hadoop134> select * from user;
+-------+-------+------+
|  ID   | NAME  | AGE  |
+-------+-------+------+
| 1001  | lisi  | 10   |
+-------+-------+------+
1 row selected (0.039 seconds)
0: jdbc:phoenix:hadoop130,hadoop133,hadoop134> upsert into user values('1002','ww',20);
1 row affected (0.012 seconds)
0: jdbc:phoenix:hadoop130,hadoop133,hadoop134> upsert into user values('1003','zs',15);
1 row affected (0.013 seconds) 
0: jdbc:phoenix:hadoop130,hadoop133,hadoop134> upsert into user values('1004','wb',30);
1 row affected (0.013 seconds)
0: jdbc:phoenix:hadoop130,hadoop133,hadoop134> select * from user;
+-------+-------+------+
|  ID   | NAME  | AGE  |
+-------+-------+------+
| 1001  | lisi  | 10   |
| 1002  | ww    | 20   |
| 1003  | zs    | 15   |
| 1004  | wb    | 30   |
+-------+-------+------+
0: jdbc:phoenix:hadoop130,hadoop133,hadoop134> select * from user where age>15;
+-------+-------+------+
|  ID   | NAME  | AGE  |
+-------+-------+------+
| 1002  | ww    | 20   |
| 1004  | wb    | 30   |
+-------+-------+------+

0: jdbc:phoenix:hadoop130,hadoop133,hadoop134> delete from user where age=15;
1 row affected (0.019 seconds)
0: jdbc:phoenix:hadoop130,hadoop133,hadoop134> select  * from user;
+-------+-------+------+
|  ID   | NAME  | AGE  |
+-------+-------+------+
| 1001  | lisi  | 10   |
| 1002  | ww    | 20   |
| 1004  | wb    | 30   |
+-------+-------+------+

hbase创建的表默认在phoneix看不到
phoneix建的表默认在hbase是可以看到的，而且可读

[vanas@hadoop130 ~]$ hbase shell
hbase(main):001:0> scan 'USER'

删除表

drop table user;
!table

单引号表示 String

双引号表示小写

1.联合主键
id name age

CREATE table person(id varchar,name varchar,age bigint constraint my_pk primary key(id,name));

2.列族

CREATE 'c','info1','info2' hbase
phoneix 如果不置顶列族，默认是'0'
CREATE table person1(id varchar primary key,info1.name varchar,info2.age bigint);

3.预分区

CREATE table person2(id varchar primary key,info1.name varchar,info2.age bigint) split on ('100','200','300');

映射：

hbase表和phoenix表的映射

hbase中建立的表，在phoenix无法访问

视图映射

比如hbase已经建立表 test100

想再phoenix访问，在phoenix建立一个同样的名字的视图（view）

视图是只读的，用来查询，无法通过源数据进行修改等操作

hbase(main):004:0>  create 'test100','info'
Created table test100
Took 0.9261 seconds                                                                                                            
=> Hbase::Table - test100
hbase(main):005:0> put 'test100','100','info:name','lisi'
Took 0.1809 seconds                                                                                                            
hbase(main):006:0> put 'test100','200','info:name','zs'
Took 0.0068 seconds                                                                                                            
hbase(main):007:0> put 'test100','200','info:age',10
Took 0.0074 seconds                                                                                                            
hbase(main):008:0> put 'test100','100','info:age',20
Took 0.0089 seconds

创建视图

create view  "test100" ("id" varchar primary key,"info"."name" varchar,"info"."age" varchar);

0: jdbc:phoenix:hadoop130,hadoop133,hadoop134> select * from "test100";
+------+-------+------+
|  id  | name  | age  |
+------+-------+------+
| 100  | lisi  | 20   |
| 200  | zs    | 10   |
+------+-------+------+

删除视图

drop view "test100";

表映射

hbase也会联动

hbase中不存在表

直接在Phoenix创建

hbase中已存在表

把view改为table，把列编码设置为0 不然列的数据找不到

create table "test100"(id varchar primary key,"info"."name" varchar, "info"."age" varchar) column_encoded_bytes=0;

Phoenix数字问题

10->000000…1010

-10-> 11111…

phoenix中存在，把符号位取反

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PJdAUyRM-1593336073447)(/Users/vanas/Library/Application Support/typora-user-images/截屏2020-06-26下午6.48.23.png)]

存的是补码

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EAa7g4yM-1593336073448)(/Users/vanas/Library/Application Support/typora-user-images/截屏2020-06-26下午6.52.21.png)]

phoenix 保证排序负数都在正数上面所有把首位反转

所以在声明时候不要用INTEGER 改用 UNSIGNED_INT

客户端默认当成Long处理

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wwT0V4VS-1593336073448)(/Users/vanas/Library/Application Support/typora-user-images/截屏2020-06-26下午6.54.06.png)]

idea可视化

hive

hiveserver2+beeline

涉及到如何在idea下去连接Phoenix

有2种连接Phoenix的方法：

使用瘦客户端(优先使用)

使用胖客户端

可视化工具：

1.dbeaver 在eclipse的基础上做的二次开发

2.SQuirrel phoenix官方推荐的

3.idea自带的插件 database

Phoenix JDBC操作

添加依赖

    <dependencies>
        
        <dependency>
            <groupId>org.apache.phoenixgroupId>
            <artifactId>phoenix-queryserver-clientartifactId>
            <version>5.0.0-HBase-2.0version>
        dependency>
    dependencies>

Thin 瘦客户端

1.需要在服务器端起一个查询服务器

2.idea使用瘦客户端连接

queryserver.py start

Java

public class TestThinClient {
    public static void main(String[] args) throws SQLException {
        String url = ThinClientUtil.getConnectionUrl("hadoop130", 8765);
        System.out.println(url);
        //jdbc:phoenix:thin:url=http://hadoop130:8765;serialization=PROTOBUF

        Connection connection = DriverManager.getConnection(url);
        PreparedStatement ps = connection.prepareStatement("select * from person");
        ResultSet resultSet = ps.executeQuery();
        while (resultSet.next()){
            System.out.println(resultSet.getString(1)+":"+resultSet.getString(2));
        }
    }
}

Scala

object PhoenixTest {
    def main(args: Array[String]): Unit = {
        //本质：就是通过jdbc访问Phoenix
        //1.建立连接
        val url = ThinClientUtil.getConnectionUrl("hadoop130", 8765)
        println(url) //jdbc:phoenix:thin:url=http://hadoop130:8765;serialization=PROTOBUF
        val conn: Connection = DriverManager.getConnection(url)

        //2.PrepareState
        val ps: PreparedStatement = conn.prepareStatement("select * from person")

        //3.执行
        val resultSet: ResultSet = ps.executeQuery()

        //4.解析结果
        while (resultSet.next()) {
            val id: String = s"id=${resultSet.getString(1)},name=${resultSet.getString(2)},age=${resultSet.getLong(3)}"
            println(id)
        }

        //5.关闭连接
        conn.close()
    }
}

Thick胖客户端

        <dependency>
            <groupId>org.apache.phoenixgroupId>
            <artifactId>phoenix-coreartifactId>
            <version>5.0.0-HBase-2.0version>
            <exclusions>
                <exclusion>
                <groupId>org.glassfishgroupId>
                    <artifactId>javax.elartifactId>
                exclusion>
            exclusions>
        dependency>
        <dependency>
            <groupId>org.glassfishgroupId>
            <artifactId>javax.elartifactId>
            <version>3.0.1-b06version>
        dependency>

Java

public class TestThickClient {
    public static void main(String[] args) throws SQLException {
        String url = "jdbc:phoenix:hadoop130,hadoop133,hadoop134:2181";
        Connection connection = DriverManager.getConnection(url);
        PreparedStatement ps = connection.prepareStatement("select * from person");
        ResultSet resultSet = ps.executeQuery();
        while (resultSet.next()){
            System.out.println(resultSet.getString(1)+":"+resultSet.getString(2));
        }
    }
}

若还不成功补充配置

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uL7QaD5R-1593336073449)(/Users/vanas/Desktop/截屏2020-06-26下午8.05.06.png)]

scala

object PhoenixTest {
    def main(args: Array[String]): Unit = {
        //本质：就是通过jdbc访问Phoenix
        //1.建立连接
        val url = "jdbc:phoenix:hadoop130,hadoop133,hadoop134:2181"
        println(url) //jdbc:phoenix:thin:url=http://hadoop130:8765;serialization=PROTOBUF
        val conn: Connection = DriverManager.getConnection(url)

        //2.PrepareState
        val ps: PreparedStatement = conn.prepareStatement("select * from person")

        //3.执行
        val resultSet: ResultSet = ps.executeQuery()

        //4.解析结果
        while (resultSet.next()) {
            val id: String = s"id=${resultSet.getString(1)},name=${resultSet.getString(2)},age=${resultSet.getLong(3)}"
            println(id)
        }

        //5.关闭连接
        conn.close()
    }
}

索引

二级索引：索引字段 -> rowkey -> 数据

优化查询速度

参数配置

hbase-site.xml

    
    <property>
        <name>hbase.regionserver.wal.codecname>
        <value>org.apache.hadoop.hbase.regionserver.wal.IndexedWALEditCodecvalue>
    property>




    <property>
        <name>hbase.region.server.rpc.scheduler.factory.classname>
        <value>org.apache.hadoop.hbase.ipc.PhoenixRpcSchedulerFactoryvalue>
        <description>Factory to create the Phoenix RPC Scheduler that uses separate queues for index and metadata updatesdescription>
    property>

    <property>
        <name>hbase.rpc.controllerfactory.classname>
        <value>org.apache.hadoop.hbase.ipc.controller.ServerRpcControllerFactoryvalue>
        <description>Factory to create the Phoenix RPC Scheduler that uses separate queues for index and metadata updatesdescription>
    property>

分发配置文件

重启

全局二级索引

新建一个表，索引数据和数据表存在不同的

create index。。

在查询的字段中，有非索引字段就需要全表扫描

适用范围：多读少写

explain select "id" from "test100" where "id" ='100'; 
create index index2 on "test100"("info"."name");
explain select "name" from "test100" where "name" ='a';
explain select "name","age" from "test100" where "name" ='a';

删除索引

drop index index2 on "test100"

覆盖索引（包含索引）

create index index4 on "test100"  ("info"."name") include ("info"."age");
explain select "name","age" from "test100" where "name" ='a';

强制索引(还存在问题先预留)

如果辨识度不高还不如全表扫描

explain select /*+ INDEX("test100" index2)*/"name","age" from "test100" where "name" ='zs';

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VYqMW9we-1593336073451)(/Users/vanas/Library/Application Support/typora-user-images/截屏2020-06-26下午8.28.13.png)]

官方给出的3种索引

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sy1ttBH0-1593336073451)(/Users/vanas/Library/Application Support/typora-user-images/截屏2020-06-26下午8.48.25.png)]

本地二级索引

不新建表在本地中

create local index 。。。

查询字段的时候，即使查询的字段没有索引，也可以优化（where 字段必须有索引）

使用范围：多写少读

create table demo1(id varchar primary key,name varchar ,age varchar);
create local index loal_1 on demo1(name);

可以在前两行看出列拼接主键

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tf8P3ozO-1593336073452)(/Users/vanas/Library/Application Support/typora-user-images/截屏2020-06-26下午8.41.38.png)]

都是范围扫描

你可能感兴趣的:(hbase)

nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
hbase介绍 CrazyL- 云计算+大数据 hbase
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用hadoophdfs作为其文件存储系统，提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用hadoopmapreduce来处理hbase、中的海量数据hbase利用zookeeper作为分布式系统服务特点：数据量大：一个表可以有上亿行，上百万列（列多时，插入变慢）面向列：面向列（族）的
Apache HBase基础（基本概述，物理架构，逻辑架构，数据管理，架构特点，HBase Shell） May--J--Oldhu HBase HBase shell hbase物理架构 hbase逻辑架构 hbase
NoSQL综述及ApacheHBase基础一.HBase1.HBase概述2.HBase发展历史3.HBase应用场景3.1增量数据-时间序列数据3.2信息交换-消息传递3.3内容服务-Web后端应用程序3.4HBase应用场景示例4.ApacheHBase生态圈5.HBase物理架构5.1HMaster5.2RegionServer5.3Region和Table6.HBase逻辑架构-Row7.
HBase（一）——HBase介绍 weixin_30595035 大数据数据库数据结构与算法
HBase介绍1、关系型数据库与非关系型数据库（1）关系型数据库关系型数据库最典型的数据机构是表，由二维表及其之间的联系所组成的一个数据组织优点：1、易于维护：都是使用表结构，格式一致2、使用方便：SQL语言通用，可用于复杂查询3、复杂操作：支持SQL，可用于一个表以及多个表之间非常复杂的查询缺点：1、读写性能比较差，尤其是海量数据的高效率读写2、固定的表结构，灵活度稍欠3、高并发读写需求，传统关
HBase介绍 mingyu1016 数据库
概述HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是GoogleBigtable的开源实现，它利用HadoopHDFS作为其文件存储系统，利用HadoopMapReduce来处理HBase中的海量数据，利用Zookeeper作为协同服务。HBase的表结构HBase以表的形式存储数据。表有行和列组成。列划分为
Hbase - 迁移数据[导出,导入] kikiki5
>有没有这样一样情况，把一个集群中的某个表导到另一个群集中，或者hbase的表结构发生了更改，但是数据还要，比如预分区没做，导致某台RegionServer很吃紧，Hbase的导出导出都可以很快的完成这些操作。![](https://upload-images.jianshu.io/upload_images/9028759-4fb9aa8ca3777969.png?imageMogr2/auto
通过DBeaver连接Phoenix操作hbase 不想做咸鱼的王富贵
通过DBeaver连接Phoenix操作hbase前言本文介绍常用一种通用数据库工具Dbeaver，DBeaver可通过JDBC连接到数据库，可以支持几乎所有的数据库产品，包括：MySQL、PostgreSQL、MariaDB、SQLite、Oracle、Db2、SQLServer、Sybase、MSAccess、Teradata、Firebird、Derby等等。商业版本更是可以支持各种NoSQ
Hbase - kerberos认证异常 kikiki2
之前怎么认证都认证不上，问题找了好了，发现它的异常跟实际操作根本就对不上，死马当活马医，当时也是瞎改才好的，给大家伙记录记录。KrbException:ServernotfoundinKerberosdatabase(7)-LOOKING_UP_SERVER>>>KdcAccessibility:removestorm1.starsriver.cnatsun.security.krb5.KrbTg
kvm 虚拟机命令行虚拟机操作、制作快照和恢复快照以及工作常用总结西京刀客云原生(Cloud Native)云计算虚拟化 Linux C/C++服务器 linux kvm
文章目录kvm虚拟机命令行虚拟机操作、制作快照和恢复快照一、kvm虚拟机命令行虚拟机操作(创建和删除)查看虚拟机virt-install创建一个虚拟机关闭虚拟机重启虚拟机销毁虚拟机二、kvm制作快照和恢复快照**创建快照**工作常见问题创建快照报错：：internalsnapshotsofaVMwithpflashbasedfirmwarearenotsupported检查虚拟机是否包含pflas
hadoop 0.22.0 部署笔记 weixin_33701564 大数据 java 运维
为什么80%的码农都做不了架构师？>>>因为需要使用hbase，所以开始对hbase进行学习。hbase是部署在hadoop平台上的NOSql数据库，因此在部署hbase之前需要先部署hadoop。环境：redhat5、hadoop-0.22.0.tar.gz、jdk-6u13-linux-i586.zipip192.168.1.128hostname：localhost.localdomain（
实时数仓之实时数仓架构(Hudi)(1)，2024年最新熬夜整理华为最新大数据开发笔试题 2401_84181221 程序员架构大数据
+Hudi：湖仓一体数据管理框架，用来管理模型数据，包括ODS/DWD/DWS/DIM/ADS等；+Doris：OLAP引擎，同步数仓结果模型，对外提供数据服务支持；+Hbase：用来存储维表信息，维表数据来源一部分有Flink加工实时写入，另一部分是从Spark任务生产，其主要作用用来支持FlinkETL处理过程中的LookupJoin功能。这里选用Hbase原因主要因为Table的HbaseC
HBase 源码阅读（一） Such Devotion hbase 数据库大数据
1.HMastermain方法在上文中MacosM1IDEA本地调试HBase2.2.2，我们使用HMaster的主函数使用"start"作为入参，启动了HMaster进程这里我们再深入了解下HMaster的运行机理publicstaticvoidmain(String[]args){LOG.info("STARTINGservice"+HMaster.class.getSimpleName())
HBase 源码阅读（四）HBase 关于LSM Tree的实现- MemStore Such Devotion hbase lsm-tree 数据库
4.MemStore接口Memstore的函数不能并行的被调用。调用者需要持有读写锁，这个的实现在HStore中我们放弃对MemStore中的诸多函数进行查看直接看MemStore的实现类AbstractMemStoreCompactingMemStoreDefaultMemStore4.1三个实现类的使用场景1.AbstractMemStore角色:基础抽象类作用:AbstractMemStor
大数据（Hbase简单示例） BL小二 hbase 大数据 hadoop
importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.TableName;importorg.apache.hadoop.hbase.client.*;importorg.apache.hadoop.hbase
Hbase的简单使用示例傲雪凌霜，松柏长青后端大数据 hbase 数据库大数据
HBase是基于HadoopHDFS构建的分布式、列式存储的NoSQL数据库，适用于存储和检索超大规模的非结构化数据。它支持随机读写，并且能够处理PB级数据。HBase通常用于实时数据存取场景，与Hadoop生态紧密集成。使用HBase的Java示例前置条件HBase集群：确保HBase集群已经安装并启动。如果没有，你可以通过本地伪分布模式或Docker来运行HBase。Hadoop配置：HBas
快手HBase在千亿级用户特征数据分析中的应用与实践王知无
声明：本文的原文是来自Hbase技术社区的一个PPT分享，个人做了整理和提炼。大家注意哈，这种会议PPT类的东西能学习到的更多的是技术方案和他人在实践过程中的经验。希望对大家有帮助。背景快手每天产生数百亿用户特征数据，分析师需要在跨30-90天的数千亿特征数据中，任意选择多维度组合(如:城市=北京&性别=男)，秒级分析用户行为。针对这一需求,快手基于HBase自主研发了支持bitmap转化、存储、
ClickHouse与其他数据库的对比九州Pro ClickHouse 数据库 clickhouse 数据仓库大数据 sql
目录1与传统关系型数据库的对比1.1性能差异1.2数据模型差异1.3适用场景差异2与其他列式存储数据库的对比2.1ApacheCassandra2.2HBase3与分布式数据库的对比3.1GoogleBigQuery3.2AmazonRedshift3.3Snowflake4ClickHouse的缺点5ClickHouse的其他优点1与传统关系型数据库的对比1.1性能差异ClickHouse是一种
Hbase、hive以及ClickHouse的介绍和区别？ damokelisijian866 hbase hive clickhouse
一、Hbase介绍：HBase是一个分布式的、面向列的开源数据库，由ApacheSoftwareFoundation开发，是Hadoop生态系统中的一个重要组件。HBase的设计灵感来源于Google的Bigtable论文，它通过提供类似于Bigtable的能力，在Hadoop之上构建了一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。HBase主要用于存储大量结构化数据，并支持随机读写访问，
Hive和Hbase的区别傲雪凌霜，松柏长青大数据后端 hive hbase hadoop
Hive和HBase都是Hadoop生态系统中的重要组件，它们都能处理大规模数据，但各自有不同的适用场景和设计理念。以下是两者的主要区别：1.数据模型Hive：Hive类似于传统的关系型数据库(RDBMS)，以表格形式存储数据。它使用SQL-like语言HiveQL来查询和处理数据，数据通常是结构化或半结构化的。HBase：HBase是一个NoSQL数据库，基于Google的BigTable模型。
HBase 傲雪凌霜，松柏长青大数据后端 hbase 数据库大数据
ApacheHBase是一个基于Hadoop分布式文件系统（HDFS）构建的分布式、面向列的NoSQL数据库，主要用于处理大规模、稀疏的表结构数据。HBase的设计灵感来自Google的Bigtable，能够在海量数据中提供快速的随机读写操作，适合需要低延迟和高吞吐量的应用场景。HBase核心概念表（Table）：HBase的数据存储在表中，与传统的关系型数据库不同，HBase的表是面向列族（Co
大数据面试题：说下为什么要使用Hive？Hive的优缺点？Hive的作用是什么？蓦然_ 大数据面试题 hive 大数据开发面试题大数据面试
1、为什么要使用Hive？Hive是Hadoop生态系统中比不可少的一个工具，它提供了一种SQL(结构化查询语言)方言，可以查询存储在Hadoop分布式文件系统（HDFS）中的数据或其他和Hadoop集成的文件系统，如MapR-FS、Amazon的S3和像HBase（Hadoop数据仓库）和Cassandra这样的数据库中的数据。大多数数据仓库应用程序都是使用关系数据库进行实现的，并使用SQL作为
Hadoop组件静听山水 Hadoop hadoop
这张图片展示了Hadoop生态系统的一些主要组件。Hadoop是一个开源的大数据处理框架，由Apache基金会维护。以下是每个组件的简短介绍：HBase：一个分布式、面向列的NoSQL数据库，基于GoogleBigTable的设计理念构建。HBase提供了实时读写访问大量结构化和半结构化数据的能力，非常适合大规模数据存储。Pig：一种高级数据流语言和执行引擎，用于编写MapReduce任务。Pig
Hbase BulkLoad用法 kikiki2
要导入大量数据，Hbase的BulkLoad是必不可少的，在导入历史数据的时候，我们一般会选择使用BulkLoad方式，我们还可以借助Spark的计算能力将数据快速地导入。使用方法导入依赖包compilegroup:'org.apache.spark',name:'spark-sql_2.11',version:'2.3.1.3.0.0.0-1634'compilegroup:'org.apach
EMR组件部署指南 ivwdcwso 运维 EMR 大数据开源运维
EMR(ElasticMapReduce)是一个大数据处理和分析平台,包含了多个开源组件。本文将详细介绍如何部署EMR的主要组件,包括:JDK1.8ElasticsearchKafkaFlinkZookeeperHBaseHadoopPhoenixScalaSparkHive准备工作所有操作都在/data目录下进行。首先安装JDK1.8:yuminstalljava-1.8.0-openjdk部署
Sublime text3+python3配置及插件安装 raysonfang
作者：方雷个人博客：http://blog.chargingbunk.cn/微信公众号：rayson_666(Rayson开发分享)个人专研技术方向：微服务方向：springboot,springCloud,Dubbo分布式/高并发：分布式锁，消息队列RabbitMQ大数据处理：Hadoop,spark,HBase等python方向：pythonweb开发一，前言在网上搜索了一些Python开发的
Spring Data：JPA与Querydsl 光图强 java
JPAJPA是java的一个规范，用于在java对象和数据库之间保存数据，充当面向对象领域模型和数据库之间的桥梁。它使用Hibernate、TopLink、IBatis等ORM框架实现持久性规范。SpringDataSpringData是Spring的一个子项目，用于简化数据库访问，支持NoSql数据和关系数据库。支持的NoSql数据库包括：Mongodb、redis、Hbase、Neo4j。Sp
HBase 源码阅读（二） Such Devotion hbase 数据库大数据
衔接在上一篇文章中，HMasterCommandLine类中在startMaster();方法中//这里除了启动HMaster之外，还启动一个HRegionServerLocalHBaseClustercluster=newLocalHBaseCluster(conf,mastersCount,regionServersCount,LocalHMaster.class,HRegionServer.
大数据技术之HBase 与 Hive 集成(7) 大数据深度洞察 Hbase 大数据 hbase hive
目录使用场景HBase与Hive集成使用1）案例一2）案例二使用场景如果大量的数据已经存放在HBase上面，并且需要对已经存在的数据进行数据分析处理，那么Phoenix并不适合做特别复杂的SQL处理。此时，可以使用Hive映射HBase的表格，之后通过编写HQL进行分析处理。HBase与Hive集成使用Hive安装https://blog.csdn.net/qq_45115959/article/
【HBase之轨迹】（1）使用 Docker 搭建 HBase 集群寒冰小澈IceClean 【大数据之轨迹】【Docker之轨迹】笔记 hbase docker hadoop
——目录——0.前置准备1.下载安装2.配置（重）3.启动与关闭4.搭建高可用HBase前言（贫穷使我见多识广）前边经历了Hadoop，Zookeeper，Kafka，他们的集群，全都是使用Docker搭建的一开始的我认为，把容器看成是一台台独立的服务器就好啦也确实是这样，但端口映射问题，让我一路以来磕碰了太多太多，直到现在的HBase，更是将Docker集群所附带的挑战性，放大到了极致（目前是如
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

HBase API+优化+Phenix+索引 笔记