iteye_21185

HBase开发实例学习

1 开发环境

在进行Hbase开发前，需要安装JDK、Hadoop和HBase，选择一款合适的开发IDE，具体安装方法就不介绍了，网上有很多参考资料，这里给出我的开发环境：

操作系统：Ubuntu 14.04 LTS

Java版本：jdk1.7.0_79

Hadoop版本：hadoop-2.6.0-cdh5.7.1

HBase版本：hbase-1.2.0-cdh5.7.1

Ecipse版本：Eclipse Java EE LunaRelease

使用Maven构建项目，在pom.xml中添加hbase的依赖如下：

[html]  view plain 
       copy
          
      
  <repositories>  
      <repository>  
        <id>clouderaid>  
        <url>https://repository.cloudera.com/artifactory/cloudera-repos/url>  
      repository>  
  repositories>  
  
  <dependencies>  
      <dependency>  
          <groupId>junitgroupId>  
          <artifactId>junitartifactId>  
          <version>3.8.1version>  
          <scope>testscope>  
      dependency>  
      <dependency>    
          <groupId>org.apache.hadoopgroupId>    
          <artifactId>hadoop-commonartifactId>    
          <version>2.6.0-cdh5.7.1version>    
      dependency>    
      <dependency>    
          <groupId>org.apache.hadoopgroupId>    
          <artifactId>hadoop-hdfsartifactId>    
          <version>2.6.0-cdh5.7.1version>    
      dependency>  
      <dependency>    
          <groupId>org.apache.hbasegroupId>    
          <artifactId>hbase-clientartifactId>    
          <version>1.2.0-cdh5.7.1version>    
      dependency>  
<dependency>    
          <groupId>org.apache.hbasegroupId>    
          <artifactId>hbase-serverartifactId>    
          <version>1.2.0-cdh5.7.1version>    
      dependency>  
  dependencies>  

2 初始化配置

首先需要设置HBase的配置，如ZooKeeper的地址、端口号等等。可以通过org.apache.hadoop.conf.Configuration.set方法手工设置HBase的配置信息，也可以直接将HBase的hbase-site.xml配置文件引入项目即可。下面给出配置代码：

[java]  view plain 
       copy
          
      
// 声明静态配置  
  private static Configuration conf = null;  
  static {  
      conf = HBaseConfiguration.create();  
      conf.set("hbase.zookeeper.quorum", "localhost");  
      conf.set("hbase.zookeeper.property.clientPort", "2181");  
  }  

3 常见API的使用

HBase的常用操作包括建表、插入表数据、删除表数据、获取一行数据、表扫描、删除列族、删除表等等，下面给出具体代码。

3.1 创建数据库表

[java]  view plain 
       copy
          
      
    // 创建数据库表  
public static void createTable(String tableName, String[] columnFamilys) throws IOException {  
    // 建立一个数据库的连接  
    Connection conn = ConnectionFactory.createConnection(conf);  
    // 创建一个数据库管理员  
    HBaseAdmin hAdmin = (HBaseAdmin) conn.getAdmin();  
    if (hAdmin.tableExists(tableName)) {  
        System.out.println(tableName + "表已存在");  
        conn.close();  
        System.exit(0);  
    } else {  
        // 新建一个表描述  
        HTableDescriptor tableDesc = new HTableDescriptor(TableName.valueOf(tableName));  
        // 在表描述里添加列族  
        for (String columnFamily : columnFamilys) {  
            tableDesc.addFamily(new HColumnDescriptor(columnFamily));  
        }  
        // 根据配置好的表描述建表  
        hAdmin.createTable(tableDesc);  
        System.out.println("创建" + tableName + "表成功");  
    }  
    conn.close();  
}  

3.2 添加一条数据

[java]  view plain 
       copy
          
      
 // 添加一条数据  
public static void addRow(String tableName, String rowKey, String columnFamily, String column, String value)   
        throws IOException {  
    // 建立一个数据库的连接  
    Connection conn = ConnectionFactory.createConnection(conf);  
    // 获取表  
    HTable table = (HTable) conn.getTable(TableName.valueOf(tableName));  
    // 通过rowkey创建一个put对象  
    Put put = new Put(Bytes.toBytes(rowKey));  
    // 在put对象中设置列族、列、值  
    put.addColumn(Bytes.toBytes(columnFamily), Bytes.toBytes(column), Bytes.toBytes(value));  
    // 插入数据,可通过put(List)批量插入  
    table.put(put);  
    // 关闭资源  
    table.close();  
    conn.close();  
}  

3.3 获取一条数据

[java]  view plain 
       copy
          
      
// 通过rowkey获取一条数据  
public static void getRow(String tableName, String rowKey) throws IOException {  
    // 建立一个数据库的连接  
    Connection conn = ConnectionFactory.createConnection(conf);  
    // 获取表  
    HTable table = (HTable) conn.getTable(TableName.valueOf(tableName));  
    // 通过rowkey创建一个get对象  
    Get get = new Get(Bytes.toBytes(rowKey));  
    // 输出结果  
    Result result = table.get(get);  
    for (Cell cell : result.rawCells()) {  
        System.out.println(  
                "行键:" + new String(CellUtil.cloneRow(cell)) + "\t" +  
                "列族:" + new String(CellUtil.cloneFamily(cell)) + "\t" +   
                "列名:" + new String(CellUtil.cloneQualifier(cell)) + "\t" +   
                "值:" + new String(CellUtil.cloneValue(cell)) + "\t" +  
                "时间戳:" + cell.getTimestamp());  
    }  
    // 关闭资源  
    table.close();  
    conn.close();  
}  

3.4 全表扫描

[java]  view plain 
       copy
          
      
    // 全表扫描  
    public static void scanTable(String tableName) throws IOException {  
        // 建立一个数据库的连接  
        Connection conn = ConnectionFactory.createConnection(conf);  
        // 获取表  
        HTable table = (HTable) conn.getTable(TableName.valueOf(tableName));  
        // 创建一个扫描对象  
        Scan scan = new Scan();  
        // 扫描全表输出结果  
        ResultScanner results = table.getScanner(scan);  
        for (Result result : results) {  
            for (Cell cell : result.rawCells()) {  
                System.out.println(  
                        "行键:" + new String(CellUtil.cloneRow(cell)) + "\t" +  
                        "列族:" + new String(CellUtil.cloneFamily(cell)) + "\t" +   
                        "列名:" + new String(CellUtil.cloneQualifier(cell)) + "\t" +   
                        "值:" + new String(CellUtil.cloneValue(cell)) + "\t" +  
                        "时间戳:" + cell.getTimestamp());  
            }  
        }  
        // 关闭资源  
        results.close();  
        table.close();  
        conn.close();  
}  

3.5 删除一条数据

[java]  view plain 
       copy
          
      
// 删除一条数据  
public static void delRow(String tableName, String rowKey) throws IOException {  
    // 建立一个数据库的连接  
    Connection conn = ConnectionFactory.createConnection(conf);  
    // 获取表  
    HTable table = (HTable) conn.getTable(TableName.valueOf(tableName));  
    // 删除数据  
    Delete delete = new Delete(Bytes.toBytes(rowKey));  
    table.delete(delete);  
    // 关闭资源  
    table.close();  
    conn.close();  
}  

3.6 删除多条数据

[java]  view plain 
       copy
          
      
// 删除多条数据  
public static void delRows(String tableName, String[] rows) throws IOException {  
    // 建立一个数据库的连接  
    Connection conn = ConnectionFactory.createConnection(conf);  
    // 获取表  
    HTable table = (HTable) conn.getTable(TableName.valueOf(tableName));  
    // 删除多条数据  
    List list = new ArrayList();  
    for (String row : rows) {  
        Delete delete = new Delete(Bytes.toBytes(row));  
        list.add(delete);  
    }  
    table.delete(list);  
    // 关闭资源  
    table.close();  
    conn.close();  
}  

3.7 删除列族

[java]  view plain 
       copy
          
      
// 删除列族  
public static void delColumnFamily(String tableName, String columnFamily) throws IOException {  
    // 建立一个数据库的连接  
    Connection conn = ConnectionFactory.createConnection(conf);  
    // 创建一个数据库管理员  
    HBaseAdmin hAdmin = (HBaseAdmin) conn.getAdmin();  
    // 删除一个表的指定列族  
    hAdmin.deleteColumn(tableName, columnFamily);  
    // 关闭资源  
    conn.close();  
}  

3.8 删除数据库表

[java]  view plain 
       copy
          
      
// 删除数据库表  
public static void deleteTable(String tableName) throws IOException {  
    // 建立一个数据库的连接  
    Connection conn = ConnectionFactory.createConnection(conf);  
    // 创建一个数据库管理员  
    HBaseAdmin hAdmin = (HBaseAdmin) conn.getAdmin();  
    if (hAdmin.tableExists(tableName)) {  
        // 失效表  
        hAdmin.disableTable(tableName);  
        // 删除表  
        hAdmin.deleteTable(tableName);  
        System.out.println("删除" + tableName + "表成功");  
        conn.close();  
    } else {  
        System.out.println("需要删除的" + tableName + "表不存在");  
        conn.close();  
        System.exit(0);  
    }  
}  

3.9 追加插入

[java]  view plain 
       copy
          
      
// 追加插入(将原有value的后面追加新的value，如原有value=a追加value=bc则最后的value=abc)  
public static void appendData(String tableName, String rowKey, String columnFamily, String column, String value)   
        throws IOException {  
    // 建立一个数据库的连接  
    Connection conn = ConnectionFactory.createConnection(conf);  
    // 获取表  
    HTable table = (HTable) conn.getTable(TableName.valueOf(tableName));  
    // 通过rowkey创建一个append对象  
    Append append = new Append(Bytes.toBytes(rowKey));  
    // 在append对象中设置列族、列、值  
    append.add(Bytes.toBytes(columnFamily), Bytes.toBytes(column), Bytes.toBytes(value));  
    // 追加数据  
    table.append(append);  
    // 关闭资源  
    table.close();  
    conn.close();  
}  

3.10 符合条件后添加数据

[java]  view plain 
       copy
          
      
// 符合条件后添加数据(只能针对某一个rowkey进行原子操作)  
public static boolean checkAndPut(String tableName, String rowKey, String columnFamilyCheck, String columnCheck, String valueCheck, String columnFamily, String column, String value) throws IOException {  
    // 建立一个数据库的连接  
    Connection conn = ConnectionFactory.createConnection(conf);  
    // 获取表  
    HTable table = (HTable) conn.getTable(TableName.valueOf(tableName));  
    // 设置需要添加的数据  
    Put put = new Put(Bytes.toBytes(rowKey));  
    put.addColumn(Bytes.toBytes(columnFamily), Bytes.toBytes(column), Bytes.toBytes(value));  
    // 当判断条件为真时添加数据  
    boolean result = table.checkAndPut(Bytes.toBytes(rowKey), Bytes.toBytes(columnFamilyCheck),   
            Bytes.toBytes(columnCheck), Bytes.toBytes(valueCheck), put);  
    // 关闭资源  
    table.close();  
    conn.close();  
      
    return result;  
}  

3.11 符合条件后删除数据

[java]  view plain 
       copy
          
      
// 符合条件后刪除数据(只能针对某一个rowkey进行原子操作)  
public static boolean checkAndDelete(String tableName, String rowKey, String columnFamilyCheck, String columnCheck,   
        String valueCheck, String columnFamily, String column) throws IOException {  
    // 建立一个数据库的连接  
    Connection conn = ConnectionFactory.createConnection(conf);  
    // 获取表  
    HTable table = (HTable) conn.getTable(TableName.valueOf(tableName));  
    // 设置需要刪除的delete对象  
    Delete delete = new Delete(Bytes.toBytes(rowKey));  
    delete.addColumn(Bytes.toBytes(columnFamilyCheck), Bytes.toBytes(columnCheck));  
    // 当判断条件为真时添加数据  
    boolean result = table.checkAndDelete(Bytes.toBytes(rowKey), Bytes.toBytes(columnFamilyCheck), Bytes.toBytes(columnCheck),   
            Bytes.toBytes(valueCheck), delete);  
    // 关闭资源  
    table.close();  
    conn.close();  
  
    return result;  
}  

3.12 计数器

[java]  view plain 
       copy
          
      
// 计数器(amount为正数则计数器加，为负数则计数器减，为0则获取当前计数器的值)  
public static long incrementColumnValue(String tableName, String rowKey, String columnFamily, String column, long amount)   
        throws IOException {  
    // 建立一个数据库的连接  
    Connection conn = ConnectionFactory.createConnection(conf);  
    // 获取表  
    HTable table = (HTable) conn.getTable(TableName.valueOf(tableName));  
    // 计数器  
    long result = table.incrementColumnValue(Bytes.toBytes(rowKey), Bytes.toBytes(columnFamily), Bytes.toBytes(column), amount);  
    // 关闭资源  
    table.close();  
    conn.close();  
      
    return result;  
}  

4 内置过滤器的使用

HBase为筛选数据提供了一组过滤器，通过这个过滤器可以在HBase中数据的多个维度（行、列、数据版本）上进行对数据的筛选操作，也就是说过滤器最终能够筛选的数据能够细化到具体的一个存储单元格上（由行键、列名、时间戳定位）。通常来说，通过行键、值来筛选数据的应用场景较多。需要说明的是，过滤器会极大地影响查询效率。所以，在数据量较大的数据表中，应尽量避免使用过滤器。

下面介绍一些常用的HBase内置过滤器的用法：

1、RowFilter：筛选出匹配的所有的行。使用BinaryComparator可以筛选出具有某个行键的行，或者通过改变比较运算符（下面的例子中是CompareFilter.CompareOp.EQUAL）来筛选出符合某一条件的多条数据，如下示例就是筛选出行键为row1的一行数据。

[java]  view plain 
       copy
          
      
// 筛选出匹配的所有的行  
Filter rf = new RowFilter(CompareFilter.CompareOp.EQUAL, new BinaryComparator(Bytes.toBytes("row1")));    

2、PrefixFilter：筛选出具有特定前缀的行键的数据。这个过滤器所实现的功能其实也可以由RowFilter结合RegexComparator来实现，不过这里提供了一种简便的使用方法，如下示例就是筛选出行键以row为前缀的所有的行。

[java]  view plain 
       copy
          
      
// 筛选匹配行键的前缀成功的行  
Filter pf = new PrefixFilter(Bytes.toBytes("row"));  

3、KeyOnlyFilter：这个过滤器唯一的功能就是只返回每行的行键，值全部为空，这对于只关注于行键的应用场景来说非常合适，这样忽略掉其值就可以减少传递到客户端的数据量，能起到一定的优化作用。

[java]  view plain 
       copy
          
      
// 返回所有的行键，但值全是空  
Filter kof = new KeyOnlyFilter();  

4、RandomRowFilter：按照一定的几率（<=0会过滤掉所有的行，>=1会包含所有的行）来返回随机的结果集，对于同样的数据集，多次使用同一个RandomRowFilter会返回不同的结果集，对于需要随机抽取一部分数据的应用场景，可以使用此过滤器。

[java]  view plain 
       copy
          
      
// 随机选出一部分的行  
Filter rrf = new RandomRowFilter((float) 0.8);     

5、InclusiveStopFilter：扫描的时候，我们可以设置一个开始行键和一个终止行键，默认情况下，这个行键的返回是前闭后开区间，即包含起始行，但不包含终止行。如果我们想要同时包含起始行和终止行，那么可以使用此过滤器。

[java]  view plain 
       copy
          
      
// 包含了扫描的上限在结果之内  
Filter isf = new InclusiveStopFilter(Bytes.toBytes("row1"));    

6、FirstKeyOnlyFilter：如果想要返回的结果集中只包含第一列的数据，那么这个过滤器能够满足要求。它在找到每行的第一列之后会停止扫描，从而使扫描的性能也得到了一定的提升。

[java]  view plain 
       copy
          
      
// 筛选出每行的第一个单元格  
Filter fkof = new FirstKeyOnlyFilter();     

7、ColumnPrefixFilter：它按照列名的前缀来筛选单元格，如果我们想要对返回的列的前缀加以限制的话，可以使用这个过滤器。

[java]  view plain 
       copy
          
      
// 筛选出前缀匹配的列  
Filter cpf = new ColumnPrefixFilter(Bytes.toBytes("qual1"));     

8、ValueFilter：按照具体的值来筛选单元格的过滤器，这会把一行中值不能满足的单元格过滤掉，如下面的构造器，对于每一行的一个列，如果其对应的值不包含ROW2_QUAL1，那么这个列就不会返回给客户端。

[java]  view plain 
       copy
          
      
// 筛选某个（值的条件满足的）特定的单元格  
Filter vf = new ValueFilter(CompareFilter.CompareOp.EQUAL, new SubstringComparator("ROW2_QUAL1"));  

9、ColumnCountGetFilter：这个过滤器在遇到一行的列数超过我们所设置的限制值的时候，结束扫描操作。

[java]  view plain 
       copy
          
      
// 如果突然发现一行中的列数超过设定的最大值时，整个扫描操作会停止  
Filter ccf = new ColumnCountGetFilter(2);    

10、SingleColumnValueFilter：用一列的值决定这一行的数据是否被过滤，可对它的对象调用setFilterIfMissing方法，默认的参数是false。其作用是，对于咱们要使用作为条件的列，如果参数为true，这样的行将会被过滤掉，如果参数为false，这样的行会包含在结果集中。

[java]  view plain 
       copy
          
      
// 将满足条件的列所在的行过滤掉  
SingleColumnValueFilter scvf = new SingleColumnValueFilter(    
•          Bytes.toBytes("colfam1"),     
•          Bytes.toBytes("qual2"),     
•          CompareFilter.CompareOp.NOT_EQUAL,     
•          new SubstringComparator("BOGUS"));    
scvf.setFilterIfMissing(true);  

11、SingleColumnValueExcludeFilter：这个过滤器与第10种过滤器唯一的区别就是，作为筛选条件的列，其行不会包含在返回的结果中。

12、SkipFilter：这是一种附加过滤器，其与ValueFilter结合使用，如果发现一行中的某一列不符合条件，那么整行就会被过滤掉。

[java]  view plain 
       copy
          
      
// 发现某一行中的一列需要过滤时，整个行就会被过滤掉  
Filter skf = new SkipFilter(vf);  

13、WhileMatchFilter：使用这个过滤器，当遇到不符合设定条件的数据的时候，整个扫描结束。

[java]  view plain 
       copy
          
      
// 当遇到不符合过滤器rf设置的条件时，整个扫描结束  
Filter wmf = new WhileMatchFilter(rf);     

14. FilterList：可以用于综合使用多个过滤器。其有两种关系： Operator.MUST_PASS_ONE表示关系AND，Operator.MUST_PASS_ALL表示关系OR，并且FilterList可以嵌套使用，使得我们能够表达更多的需求。

[java]  view plain 
       copy
          
      
// 综合使用多个过滤器，AND和OR两种关系  
List filters = new ArrayList();    
filters.add(rf);    
filters.add(vf);    
FilterList fl = new FilterList(FilterList.Operator.MUST_PASS_ALL,filters);  

下面给出一个使用RowFilter过滤器的完整示例：

[java]  view plain 
       copy
          
      
public class HBaseFilter {  
      
    private static final String TABLE_NAME = "table1";  
  
    public static void main(String[] args) throws IOException {  
        // 设置配置  
        Configuration conf = HBaseConfiguration.create();  
        conf.set("hbase.zookeeper.quorum", "localhost");  
        conf.set("hbase.zookeeper.property.clientPort", "2181");  
        // 建立一个数据库的连接  
        Connection conn = ConnectionFactory.createConnection(conf);  
        // 获取表  
        HTable table = (HTable) conn.getTable(TableName.valueOf(TABLE_NAME));  
        // 创建一个扫描对象  
        Scan scan = new Scan();  
        // 创建一个RowFilter过滤器  
        Filter filter = new RowFilter(CompareFilter.CompareOp.EQUAL, new BinaryComparator(Bytes.toBytes("abc")));  
        // 将过滤器加入扫描对象  
        scan.setFilter(filter);  
        // 输出结果  
        ResultScanner results = table.getScanner(scan);  
        for (Result result : results) {  
            for (Cell cell : result.rawCells()) {  
                System.out.println(  
                        "行键:" + new String(CellUtil.cloneRow(cell)) + "\t" +  
                        "列族:" + new String(CellUtil.cloneFamily(cell)) + "\t" +   
                        "列名:" + new String(CellUtil.cloneQualifier(cell)) + "\t" +   
                        "值:" + new String(CellUtil.cloneValue(cell)) + "\t" +  
                        "时间戳:" + cell.getTimestamp());  
            }  
        }  
        // 关闭资源  
        results.close();  
        table.close();  
        conn.close();  
          
    }  
  
}  

5 HBase与MapReduce

我们知道，在伪分布式模式和完全分布式模式下的HBase是架构在HDFS之上的，因此完全可以将MapReduce编程框架和HBase结合起来使用。也就是说，将HBase作为底层存储结构，MapReduce调用HBase进行特殊的处理，这样能够充分结合HBase分布式大型数据库和MapReduce并行计算的优点。

HBase实现了TableInputFormatBase类，该类提供了对表数据的大部分操作，其子类TableInputFormat则提供了完整的实现，用于处理表数据并生成键值对。TableInputFormat类将数据表按照Region分割成split，即有多少个Regions就有多个splits，然后将Region按行键分成对，key值对应与行键，value值为该行所包含的数据。

HBase实现了MapReduce计算框架对应的TableMapper类和TableReducer类。其中，TableMapper类并没有具体的功能，只是将输入的对的类型分别限定为Result和ImmutableBytesWritable。IdentityTableMapper类和IdentityTableReducer类则是上述两个类的具体实现，其和Mapper类和Reducer类一样，只是简单地将对输出到下一个阶段。

HBase实现的TableOutputFormat将输出的对写到指定的HBase表中，该类不会对WAL（Write-Ahead Log）进行操作，即如果服务器发生故障将面临丢失数据的风险。可以使用MultipleTableOutputFormat类解决这个问题，该类可以对是否写入WAL进行设置。

为了能使Hadoop集群上运行HBase程序，还需要把相关的类文件引入Hadoop集群上，不然会出现ClassNotFoundException错误。其具体方法是可在hadoop的环境配置文件hadoop-env.sh中引入HBASE_HOME和HBase的相关jar包，或者直接将HBase的jar包打包到应用程序文件中。

下面这个例子是将MapReduce和HBase结合起来的WordCount程序，它首先从指定文件中搜集数据，进行统计计算，最后将结果存储到HBase中：

[java]  view plain 
       copy
          
      
package com.hbase.demo;  
  
import java.io.IOException;  
  
import org.apache.hadoop.conf.Configuration;  
import org.apache.hadoop.fs.Path;  
import org.apache.hadoop.hbase.HBaseConfiguration;  
import org.apache.hadoop.hbase.HColumnDescriptor;  
import org.apache.hadoop.hbase.HTableDescriptor;  
import org.apache.hadoop.hbase.TableName;  
import org.apache.hadoop.hbase.client.Connection;  
import org.apache.hadoop.hbase.client.ConnectionFactory;  
import org.apache.hadoop.hbase.client.HBaseAdmin;  
import org.apache.hadoop.hbase.client.Put;  
import org.apache.hadoop.hbase.mapreduce.TableOutputFormat;  
import org.apache.hadoop.hbase.mapreduce.TableReducer;  
import org.apache.hadoop.io.IntWritable;  
import org.apache.hadoop.io.LongWritable;  
import org.apache.hadoop.io.NullWritable;  
import org.apache.hadoop.io.Text;  
import org.apache.hadoop.mapreduce.Job;  
import org.apache.hadoop.mapreduce.Mapper;  
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;  
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;  
  
public class HBaseWordCount {  
      
    public static class hBaseMapper extends Mapper {  
  
        private final static IntWritable ONE = new IntWritable(1);  
        private Text word = new Text();  
  
        @Override  
        protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {  
            String[] words = value.toString().split(" ");  
            for ( String w : words) {  
                word.set(w);  
                context.write(word, ONE);  
            }  
        }  
    }  
      
    public static class hBaseReducer extends TableReducer {  
  
        @Override  
        protected void reduce(Text key, Iterable values, Context context) throws IOException, InterruptedException {  
            int sum = 0;  
            for (IntWritable value : values) {  
                sum += value.get();  
            }  
              
            // Put实例化，每个词存一行  
            Put put = new Put(key.getBytes());  
            // 列族为content,列名为count,列值为单词的数目  
            put.addColumn("content".getBytes(), "count".getBytes(), String.valueOf(sum).getBytes());  
              
            context.write(NullWritable.get(), put);  
        }  
          
    }  
      
    // 创建HBase数据表  
    public static void createHBaseTable(String tableName) throws IOException {  
        // 配置HBse  
        Configuration conf = HBaseConfiguration.create();  
        conf.set("hbase.zookeeper.quorum", "localhost");  
        conf.set("hbase.zookeeper.property.clientPort", "2181");  
        // 建立一个数据库的连接  
        Connection conn = ConnectionFactory.createConnection(conf);  
        // 创建一个数据库管理员  
        HBaseAdmin hAdmin = (HBaseAdmin) conn.getAdmin();  
        // 判断表是否存在  
        if (hAdmin.tableExists(tableName)) {  
            System.out.println("该数据表已存在，正在重新创建");  
            hAdmin.disableTable(tableName);  
            hAdmin.deleteTable(tableName);  
        }  
        // 创建表描述  
        HTableDescriptor tableDesc = new HTableDescriptor(TableName.valueOf(tableName));  
        // 在表描述里添加列族  
        tableDesc.addFamily(new HColumnDescriptor("content"));  
        // 创建表  
        hAdmin.createTable(tableDesc);  
        System.out.println("创建" + tableName + "表成功");  
    }  
      
    public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {  
          
        if (args.length != 3) {  
            System.out.println("args error");  
            System.exit(0);  
        }  
          
        String input = args[0];  
        String jobName = args[1];  
        String tableName = args[2];  
          
        // 创建数据表  
        HBaseWordCount.createHBaseTable(tableName);  
          
        // 配置MapReduce(或者将hadoop和hbase的相关配置文件引入项目)  
        Configuration conf = new Configuration();  
        conf.set("fs.defaultFS", "localhost:9000");  
       conf.set("mapred.job.tracker", "localhost:9001");  
        conf.set("hbase.zookeeper.quorum", "localhost");  
        conf.set("hbase.zookeeper.property.clientPort", "2181");  
        conf.set(TableOutputFormat.OUTPUT_TABLE, tableName);  
          
        // 配置任务  
        Job job = Job.getInstance(conf, jobName);  
        job.setJarByClass(HBaseWordCount.class);  
        job.setMapperClass(hBaseMapper.class);  
        job.setReducerClass(hBaseReducer.class);  
        job.setMapOutputKeyClass(Text.class);  
        job.setMapOutputValueClass(IntWritable.class);  
        job.setInputFormatClass(TextInputFormat.class);  
        job.setOutputFormatClass(TableOutputFormat.class);  
        FileInputFormat.addInputPath(job, new Path(input));  
          
        //执行MR任务  
        boolean result = job.waitForCompletion(true);  
        System.exit(result ? 0 : 1);  
    }  
  
}  

6 HBase的Bulkload

HBase可以让我们随机的、实时的访问大数据，但是怎样有效的将数据导入到HBase呢？HBase有多种导入数据的方法，最直接的方法就是在MapReduce作业中使用TableOutputFormat作为输出，或者使用标准的客户端API，但是这些都不是非常有效的方法。

如果HDFS中有海量数据要导入HBase，可以先将这些数据生成HFile文件，然后批量导入HBase的数据表中，这样可以极大地提升数据导入HBase的效率。这就是HBase的Bulkload，即利用MapReduce作业输出HBase内部数据格式的表数据，然后将生成的StoreFiles直接导入到集群中。与使用HBase API相比，使用Bulkload导入数据占用更少的CPU和网络资源。两个表之间的数据迁移也可以使用这种方法。下面给出具体示例：

[java]  view plain 
       copy
          
      
package com.hbase.demo;  
  
import java.io.IOException;  
  
import org.apache.hadoop.conf.Configuration;  
import org.apache.hadoop.fs.Path;  
import org.apache.hadoop.hbase.HBaseConfiguration;  
import org.apache.hadoop.hbase.TableName;  
import org.apache.hadoop.hbase.client.Connection;  
import org.apache.hadoop.hbase.client.ConnectionFactory;  
import org.apache.hadoop.hbase.client.HTable;  
import org.apache.hadoop.hbase.client.Put;  
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;  
import org.apache.hadoop.hbase.mapreduce.HFileOutputFormat2;  
import org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles;  
import org.apache.hadoop.hbase.mapreduce.PutSortReducer;  
import org.apache.hadoop.hbase.util.Bytes;  
import org.apache.hadoop.io.LongWritable;  
import org.apache.hadoop.io.Text;  
import org.apache.hadoop.mapreduce.Job;  
import org.apache.hadoop.mapreduce.Mapper;  
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;  
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;  
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;  
  
  
public class HBaseBulk {  
      
    public static class bulkMapper extends Mapper {  
  
        @Override  
        protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {  
            // 将输入数据用tab键分词  
            String[] values = value.toString().split("\t");  
            if (values.length == 2) {  
                // 设置行键、列族、列名和值  
                byte[] rowKey = Bytes.toBytes(values[0]);  
                byte[] family = Bytes.toBytes("content");  
                byte[] column = Bytes.toBytes("number");  
                byte[] colValue = Bytes.toBytes(values[1]);  
                // 将行键序列化作为mapper输出的key  
                ImmutableBytesWritable rowKeyWritable = new ImmutableBytesWritable(rowKey);  
                // 将put对象作为mapper输出的value  
                Put put = new Put(rowKey);  
                put.addColumn(family, column, colValue);  
                context.write(rowKeyWritable, put);  
            }  
        }  
    }  
    
    @SuppressWarnings("deprecation")  
    public static void main(String[] args) throws Exception {  
          
        if (args.length != 3) {  
            System.out.println("args error");  
            System.exit(0);  
        }  
          
        String input = args[0];  
        String output = args[1];  
        String jobName = args[2];  
        String tableName = args[3];  
          
        // 配置MapReduce(或者将hadoop的相关配置文件引入项目)  
        Configuration hadoopConf = new Configuration();  
        hadoopConf.set("fs.defaultFS", "localhost:9000");  
        hadoopConf.set("mapred.job.tracker", "localhost:9001");  
        Job job = Job.getInstance(hadoopConf, jobName);  
        job.setJarByClass(HBaseBulk.class);  
        job.setMapperClass(bulkMapper.class);  
        job.setReducerClass(PutSortReducer.class);  
        job.setMapOutputKeyClass(ImmutableBytesWritable.class);  
        job.setMapOutputValueClass(Put.class);  
        job.setInputFormatClass(TextInputFormat.class);  
        job.setOutputFormatClass(HFileOutputFormat2.class);  
        FileInputFormat.addInputPath(job, new Path(input));  
        FileOutputFormat.setOutputPath(job, new Path(output));  
          
        // 配置HBase(或者将hbase的相关配置文件引入项目)  
        Configuration hbaseConf = HBaseConfiguration.create();  
        hbaseConf.set("hbase.zookeeper.quorum", "localhost");  
        hbaseConf.set("hbase.zookeeper.property.clientPort", "2181");  
          
        // 生成HFile  
        Connection conn = ConnectionFactory.createConnection(hbaseConf);  
        HTable table = (HTable) conn.getTable(TableName.valueOf(tableName));  
        HFileOutputFormat2.configureIncrementalLoad(job, table);  
          
        // 执行任务  
        job.waitForCompletion(true);  
          
        // 将HFile文件导入HBase  
        LoadIncrementalHFiles loader = new LoadIncrementalHFiles(hbaseConf);  
        loader.doBulkLoad(new Path(output), table);  
    }  
}  

上述代码首先将HDFS中的数据文件通过MapReduce任务生成HFile文件，然后将HFile文件导入HBase数据表（该数据表已存在）。HDFS中的数据文件和导入HBase后的数据表分别如下图所示：

你可能感兴趣的:(大数据,数据库,开发工具,java)

Django学习笔记 Atmanlee python SQL Django
Django跟着“自强学堂”学习django。。。。。感谢学堂！！！https://code.ziqiangxuetang.com/django/django-tutorial.html（自强学堂）Django使用python开发的免费开源的web框架，用于快速搭建网站。特点之一就是拥有强大的数据库操作接口(QuerySetAPI),如果需要也可以执行原生SQLDjango概览urls.py网址入
使用Neo4j-Semantic-Ollama构建智能交互代理 safHTEAHE neo4j oracle 数据库 python
在现代应用中，结合图数据库与语义层的智能代理能够极大提升数据交互的效率和灵活性。本文将展示如何使用Neo4j-Semantic-Ollama模板来开发一个能够通过语义层与Neo4j图数据库交互的智能代理。我们将关注其如何利用Mixtral作为JSON格式的代理，通过用户意图与数据库进行交互。技术背景介绍Neo4j是一种高性能的图数据库，它适合于处理结构复杂的数据。在此基础上，加入语义层可以让应用程
Spring Boot 各种事务操作实战(自动回滚、手动回滚、部分回滚） m0_74825108 spring boot java 数据库
概念事务定义事务，就是一组操作数据库的动作集合。事务是现代数据库理论中的核心概念之一。如果一组处理步骤或者全部发生或者一步也不执行，我们称该组处理步骤为一个事务。当所有的步骤像一个操作一样被完整地执行，我们称该事务被提交。由于其中的一部分或多步执行失败，导致没有步骤被提交，则事务必须回滚到最初的系统状态。事务特点原子性：一个事务中所有对数据库的操作是一个不可分割的操作序列，要么全做要么全不做一致性
基于大数据的商品推荐系统的设计与实现 JAVA编码选手个人作品案例展示分享大数据 spring boot maven vue.js 后端 javascript
摘要在当今互联网时代，随着电子商务的快速发展，各行各业都面临着海量数据的挑战和机遇，电子商务极大地改变了商业运作的方式，为消费者和企业带来了前所未有的便利和机会。该毕业设计以京东商品数据为来源，设计与实现基于大数据的电商商品推荐系统。通过对电商商品数据进行深度挖掘，可以发现消费趋势、产品热门度、价格以及地区差异等信息，为市场营销和产品策略提供重要参考。利用Java语言及SpringBoot框架、M
ARM架构下的JDK 8安装包及部署指南：为您的开发环境加速平稳炜
ARM架构下的JDK8安装包及部署指南：为您的开发环境加速项目地址:https://gitcode.com/open-source-toolkit/8c506项目介绍在ARM架构的设备上，如树莓派等，搭建Java开发环境可能是一项挑战。为了简化这一过程，我们推出了ARM架构专属的JDK8安装包及部署指南。本项目提供了一个关键的软件资源——jdk-8u391-linux-aarch64.tar，专门
MySQL新建和删除普通用户夏天又到了 MySQL数据库技术 mysql 数据库
【图书推荐】《MySQL9从入门到性能优化（视频教学版）》-CSDN博客《MySQL9从入门到性能优化（视频教学版）（数据库技术丛书）》(王英英)【摘要书评试读】-京东图书(jd.com)MySQL9数据库技术_夏天又到了的博客-CSDN博客13.2.2新建普通用户要创建新用户，必须有相应的权限来执行创建操作。在MySQL数据库中，有两种方式创建新用户：一种是使用CREATEUSER语句；另一种是
【Python】如何将列表中的所有字符串转换为整数 civilpy python windows 开发语言
基本原理在Python编程中，我们经常需要处理数据类型的转换。例如，你可能从数据库、文件或用户输入中获取数据，这些数据通常以字符串的形式存在。但是，如果你需要进行数学运算，就必须将这些字符串转换为整数或其他数值类型。本篇文章将为你介绍如何使用Python将列表中的所有字符串元素转换为整数。代码示例在Python中，有几种方法可以实现这一转换。以下是一些常见的方法：示例1：使用循环和内置函数int(
Spring学习笔记_41——@RequestBody LuckyLay Spring学习笔记 spring 消息转换器 RequestBody SpringMVC SpringBoot
Spring学习笔记_38——@RequestParamSpring学习笔记_39——@PathVariableSpring学习笔记_40——@RequestHeader@RequestBody1.介绍@RequestBody是Spring框架中用于处理HTTP请求的一个非常关键的注解。它主要用于将客户端发送的HTTP请求体中的JSON、XML或其他格式的数据转换到Java方法参数上，这个转换过程
走进JavaWeb技术世界11：单元测试框架Junit 程序员黄小斜走进JavaWeb技术世界 Java
本系列文章将整理到我在GitHub上的《Java面试指南》仓库，更多精彩内容请到我的仓库里查看https://github.com/h2pl/Java-Tutorial喜欢的话麻烦点下Star哈文章首发于我的个人博客：www.how2playlife.com本文是微信公众号【Java技术江湖】的《走进JavaWeb技术世界》其中一篇，本文部分内容来源于网络，为了把本文主题讲得清晰透彻，也整合了很多
深入探秘 Java 网络编程：从基础到多线程服务器的全方位指南 2的n次方_ java 网络服务器
我的主页：2的n次方_Java作为一门功能强大的编程语言，不仅在桌面应用、移动开发、后端开发等领域表现出色，还在网络编程中拥有广泛的应用。网络编程涉及在两个或多个设备之间通过网络进行通信，这对于构建分布式系统、客户端-服务器应用程序、以及互联网服务至关重要。在这篇博客中，我们将详细探讨Java网络编程的基础知识，并通过代码示例展示如何在Java中实现网络通信。1.Java网络编程基础Java网络编
Python 操作 Elasticsearch 全指南：从连接到数据查询与处理 XMYX-0 python elasticsearch jenkins
文章目录Python操作Elasticsearch全指南：从连接到数据查询与处理引言安装`elasticsearch-py`连接到Elasticsearch创建索引插入数据查询数据1.简单查询2.布尔查询更新文档删除文档和索引删除文档删除索引批量插入数据处理分页结果总结Python操作Elasticsearch全指南：从连接到数据查询与处理引言在大数据分析与搜索应用中，Elasticsearch是
Oracle数据库恢复时要建库吗_Oracle数据ASM实例不能mount怎么恢复数据 weixin_39624461
一、数据库故障描述今天给大家分享一个Oracle数据库故障数据恢复案例，数据库故障表现为ASM磁盘组掉线，ASM实例不能mount。数据库管理员自己尝试进行简单的数据库修复后没有成功，于是联系到北京当地的数据恢复公司进行数据库的数据恢复操作。二、数据库故障分析方法数据库数据恢复工程师首先对底层的磁盘进行分析，通过分析组成ASM磁盘组的磁盘将ASM元数据提取出来进行进一步的分析。通过数据库工程师进一
Spring Cloud LoadBalancer负载均衡（空白格） Spring Cloud spring cloud
PS:放假偷偷摸摸卷Java-------------------------------------------------正文分割线----------------------------------------------------概念：负载均衡换句话说就是将请求并发访问转发给后台多台云服务器实例，实现应用程序的流量均衡，性能上实现业务水平扩展。负载均衡还通过故障自动切换及时地消除服务的单
前端面试题-手写篇-万字长文！前端Jason 面试前端面试前端面试
1.手写实现EventBus实现一个简单的EventBus（事件总线）可以让我们在不同的组件或模块之间进行事件驱动的通信。下面是一个用JavaScript手写实现EventBus的基本例子：classEventBus{constructor(){this.events={};//存储事件名与对应的监听器}//注册事件监听器on(event,listener){if(!this.events[eve
使用 MySQL 从 JSON 字符串提取数据 m0_74825678 面试学习路线阿里巴巴 mysql json oracle
使用MySQL从JSON字符串提取数据在现代数据库管理中，JSON格式因其灵活性而广泛使用。然而，当数据存储在JSON中时，我们经常需要将其转换为更易于处理的格式。本篇文章将通过一个具体的SQL查询示例，展示如何从存储在MySQL中的JSON字符串提取数据并重新格式化。1.背景知识JSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式，易于阅读和编写，同时也易于机器
Python中Cache的使用爬虫俗手小马达 python 开发语言缓存
文章目录一、缓存的基础概念二、基础使用三、进阶使用四、外部缓存工具五、缓存的注意事项一、缓存的基础概念缓存（Cache）是一种在应用程序中提升性能的技术，它通过将一些数据临时存储在快速访问的存储介质（如内存）中，以减少数据的重复计算或重复读取。通常，缓存用于存储一些昂贵计算或IO密集型操作的结果，从而加快程序的执行速度。在Python中，缓存通常用于函数的输出、API请求的结果、数据库查询、文件读
Java 9 Optional新特性深度剖析与实例应用 2501_90323865 python windows 开发语言个人开发
在Java编程的漫长旅程中，Optional类一直是处理可选值的得力助手。Java9对其进行了重要扩展，引入了诸多新方法，让Optional的使用更加灵活高效。本文将深入剖析这些新特性，并结合实例进行详细解读。ifPresentOrElse(Consumer,Runnable)方法介绍ifPresentOrElse(Consumer,Runnable)方法是Java9为Optional新增的。当O
2024金三银四必备：Java后端开发面试总结【25个技术专题】 2401_89790869 java 面试开发语言
16、List和Map、Set的区别？17、数组和链表分别比较适合用于什么场景，为什么？18、说说ConcurrentHashMap19、Java中ArrayList和LinkedList区别？20、TreeMap（可排序）21、请用两个队列模拟堆栈结构？22、Map中的key和value可以为null？23、数据结构基础之双向链表24、HashMap的底层实现25、ConcurrentHashM
HTML期末学生大作业-最新QQ音乐、网易云音乐、酷狗音乐、虾米音乐、咪咕音乐网站html+css+javascript 2401_89790869 html 课程设计 css
href=“https://y.qq.com/n/ryqq/playlist/7772849553”>好评999+英文歌！轻松解压100％播放量：2.8亿扎心情歌丨爱到最后终是空欢喜播放量：510.4万如果词不达意就把爱藏心里播放量：1645.7万深情片段：深夜我还是会想起你播放量：2663.8万href=“https://y.qq.com/n/ryqq/playlist/7537828
Hana 到 PostgreSQL 数据迁移同步
简述SAPHana与PostgreSQL已成为许多企业常用的两款重要数据库，实现这两者之间高效稳定的数据传输也是许多企业的诉求之一。本文将介绍如何使用国产数据迁移同步工具CloudCanal构建一条Hana到PostgreSQL的数据同步链路。技术点表级别CDC表CloudCanal在实现Hana源端增量同步时，最初采用的是单CDC表的模式，即所有订阅表的增量数据（插入、更新、删除）通过触发器统一
Python 3.13性能大提升：免费多线程时代来临敖行客 Allthinker python java 开发语言爬虫
在编程的世界里，Python一直以其简洁、易读和强大的功能而备受青睐。随着技术的不断进步，Python的每一个新版本都带来了新的惊喜和改进。而Python3.13无疑是其中的一颗璀璨明星。在一个数据驱动的世界里，Python已经成为了一种无处不在的编程语言，它的性能和功能的提升始终是开发者们关注的热点。随着大数据、人工智能、云计算等技术的飞速发展，对编程语言性能的要求也在不断提高。在这样的背景下，
用JavaScript实现找不同小游戏算是难了 javascript 开发语言前端 websocket
目录倒计时的实现找不同实现对canvas的初始化实现画布的分割,父盒子>子盒子>canvas找不同逻辑的判断实现图片的导入DOM节点的监听声明两个需要监听的节点禁用页面点击事件的函数DOM监听实现勋章分数增加和生命的减少减命逻辑死亡响应websocket交互定义给后端发送的数据包断线重连最后,调用封装好的websocket创建初始之物，其行必丑代码写的非常繁琐,有很多细节在复盘的时候也会想不起来为
Ruby语言的软件开发工具 2501_90183952 包罗万象 golang 开发语言后端
Ruby语言的软件开发工具概述引言Ruby是一种高效、灵活的动态编程语言，因其简洁的语法和强大的功能而受到开发者的欢迎。在软件开发过程中，使用合适的开发工具可以大幅提高工作效率，提升代码质量。本文将详细介绍一些常用的Ruby开发工具，从代码编辑器到版本控制，再到测试工具，深入探讨它们的功能及使用方法。1.Ruby语言简介Ruby语言由松本行弘（YukihiroMatsumoto）于1995年首次发
Java工程结构：服务器规约（JVM 碰到 OOM 场景时输出 dump 信息、设置tomcat的 JVM 的内存参数、了解服务平均耗时） iOS逆向 Java开发的深入浅出 java 服务器开发语言
文章目录I调用远程操作必须有超时设置。II推荐了解每个服务大致的平均耗时JVM的Xms和Xmx设置一样大小的内存容量让JVM碰到OOM场景时输出dump信息调大服务器所支持的最大文件句柄数（FileDescriptor，简写为fd）高并发服务器建议调小TCP协议的time_wait超时时间。III设置tomcat的JVM的内存参数查找Tomcat位置：快速定位服务状态和部署位置具体配置步骤查看JV
策略模式和职责链模式实现坦克大战科学的发展-只不过是读大自然写的代码设计模式-坦克大战-java 策略模式
目录：一个实例讲完23种设计模式当前：策略模式职责链观察者上一篇《命令模式坦克大战简单实现(java实现)》需求：坦克大战创建两种坦克坦克类型射程速度b7070米时/70公里b5050米时/70公里简单说明一下：这任然用坦克大战的需求，实现了如下3种模式策略职责链观察者（这里的观察者就一个，没有体现被观察者和观察者1对多的关系，但是观察者的价值在于被观察者发现自己有变化的时候，对观察者自动的通知，
Redis实战之Jedis使用技巧详解小马不敲代码实战 redis 缓存
一、前言基于redis开放的通信协议，大神们纷纷开发了各种语言的redis客户端，有c、c++、java、python、php、nodeJs等等开发语言的客户端，准确来说其实这些客户端都是基于redis命令做了一层封装，然后打包成工具以便大家更佳方便的操作redis，以Java项目为例，使用最广的就是以下三种客户端：JedisLettuceRedisson二、JedisJedis是老牌的Redis
【Spring】Spring DI(依赖注入)详解——注入参数的细节处理-内部Bean的注入 AI人H哥会Java JAVA java 开发语言 spring 后端
引言在现代Java开发中，Spring框架已经成为了构建企业级应用的标准工具之一。Spring的核心特性之一就是依赖注入（DependencyInjection，DI），它通过将对象的依赖关系从代码中解耦出来，提升了代码的可维护性和可测试性。特别是在大型项目中，良好的依赖管理能够显著降低代码的复杂度，提高开发效率。依赖注入的基本概念依赖注入是一种设计模式，用于实现控制反转（InversionofC
Grape-RAG disgare AI ai
Grape-RAG传统RAG的局限性图的优点用知识图谱来呈现数据关系GraphRAG传统RAG的局限性经典的RAG架构以向量数据库（VectorDB）为核心来检索语义相似性上下文，让大语言模型（LLM）不需要重新训练就能够获取最新的知识，其工作流如下图所示：这一架构目前广泛应用于各类AI业务场景中，例如问答机器人、智能客服、私域知识库检索等等。虽然RAG通过知识增强一定程度上缓解了LLM幻觉问题，
arcgis for JavaScript入门篇五彩斑斓黑123 arcgis for javascript arcgis javascript 开发语言
介绍ArcGISforJavaScript是一种基于Web的地图开发解决方案，由ESRI公司开发。它允许开发人员在Web应用程序中嵌入交互式地图，并使用JavaScript编写地图应用程序。ArcGISforJavaScript提供了许多功能强大的API和工具，使开发人员能够创建高度定制的地图应用程序。它支持各种地图数据源，包括ESRI的ArcGISOnline服务、第三方地图服务、以及开发人员自
JSONObject解析数据库Date类型报错问题知忆_IS 数据库 java database postgresql
JSONObject解析数据库Date类型报错问题最近项目在写服务器后端查询空间数据的接口时，由于表结构不一致，直接写了一个通用函数用json储存数据库中查询的结果，然而今天前端查询一个表的时候无法查到相应的结果，查了一下代码发现爆了如下错误。报错：Causedby:java.lang.IllegalArgumentExceptionatjava.sql.Date.getHours原因是该表中存在
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本