行思坐忆，志凌云

hbase批量入库的总结

最近这一段时间一直在研究hbase的批量入库，看似简单的问题其实埋着无数的坑......

接下来就把我遇到的一些问题和解决的办法分享给大家，希望能让那些新接触到的人不至于像我一样走这么多弯路。

hbase一般的插入过程都使用HTable对象，将数据封装在Put对象中，Put在new创建的时候需要传入rowkey，并将列族，列名，列值add进去。然后HTable调用put方法，通过rpc请求提交到Regionserver端。

写入的方式可以分为以下几种:


    
    
    
    
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        单条
        
        
        
        put
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        批量
        
        
        
        put
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        使用Mapreduce
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        bluckload

进行批量入库之前，首先要连接到正确的连接到hbase


    
    
    
    
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        static{
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		conf=
        
        
        
        HBaseConfiguration.create();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        //
        
        
        
        可以连接
        
        
        
        hbase
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        //zookeeper
        
        
        
        给客户端的端口
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		conf.
        
        
        
        set(
        
        
        
        "hbase.zookeeper.property.clientPort", 
        
        
        
        "2181");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		conf.
        
        
        
        set(
        
        
        
        "hbase.zookeeper.quorum", 
        
        
        
        "192.168.137.138,192.168.137.139");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		conf.
        
        
        
        set(
        
        
        
        "hbase.master", 
        
        
        
        "192.168.10.138:60000");		
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	}

然后开始建立我们的表结构:


    
    
    
    
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        public static void createTable(String tableName){
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        try {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			ha = 
        
        
        
        new HBaseAdmin(conf);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        if(ha.tableExists(tableName)){
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        				ha.disableTable(tableName);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        				ha.deleteTable(tableName);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        //
        
        
        
        建立表结构
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			HTableDescriptor hd =
        
        
        
        new HTableDescriptor(tableName);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        //
        
        
        
        添加列族
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			hd.addFamily(
        
        
        
        new HColumnDescriptor(
        
        
        
        "family1".getBytes()));
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			hd.addFamily(
        
        
        
        new HColumnDescriptor(
        
        
        
        "family2".getBytes()));
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
                    ha.createTable(hd);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		} 
        
        
        
        catch (Exception e) {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			System.
        
        
        
        out.println(e);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	}

有了上面的基础后，可以正式开始进行数据的插入

单条put


    
    
    
    
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        // 
        
        
        
        插入内容，行键，列族，列名，值，插入的表名
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	public 
        
        
        
        static 
        
        
        
        void insertData(
        
        
        
        String rowkey, 
        
        
        
        String cf, 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        String clomun, 
        
        
        
        String content, 
        
        
        
        String tableName)
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			throws IOException {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		htable = 
        
        
        
        new HTable(conf, tableName);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Put put = 
        
        
        
        new Put(rowkey.getBytes());
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		put.add(cf.getBytes(), clomun.getBytes(), content.getBytes());
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		htable.put(put);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	}

这种方式是批量插入数据最慢的方式，它更合适的应用场景是一般是线上业务运行时，记录单条插入，如报文记录，处理记录，写入后htable对象即释放。每次提交就是一次rpc请求.

多条Put

也就是将每一个put对象,放入List集合里面,然后对这个List集合进行入库,相比于单条Put,这种方式在入库效率上明显会有所提升. 应用场景一般在数据量稍多的环境下，通过批量提交减少请求次数


    
    
    
    
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        public static void insertData(String rowkey, String cf, 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        String clomun, 
        
        
        
        String content, 
        
        
        
        String tableName)
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        throws IOException {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		htable = 
        
        
        
        new HTable(conf, tableName);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		List list =
        
        
        
        new ArrayList(); 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Put put = 
        
        
        
        new Put(rowkey.getBytes());
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		put.add(cf.getBytes(), clomun.getBytes(), content.getBytes());
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
                       list.add(put);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		htable.put(list);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	}

在主方法里面调用该方法并且输入相关参数就可以实现用put方式对数据的批量插入了


    
    
    
    
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        public static void main(String[] args) throws IOException {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
                createTable(
        
        
        
        "insertTest");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
               
        
        
        
        try {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
                   
        
        
        
        for (
        
        
        
        int i = 
        
        
        
        0; i < 
        
        
        
        10; i++) {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
                        String rowkey = UUID.randomUUID().toString();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
                       
        
        
        
        // 因为不能动态增加列簇,所以只能动态添加列
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
                       
        
        
        
        for (
        
        
        
        int j = 
        
        
        
        0; j <= 
        
        
        
        10; j++) {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
                            insertData(rowkey, 
        
        
        
        "family1", 
        
        
        
        "column",
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
                                   
        
        
        
        new SimpleDateFormat(
        
        
        
        "yyyy-MM-dd hh:mm:ss").
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
                                    format(
        
        
        
        new Date()), 
        
        
        
        "insertTest");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
                            insertData(rowkey, 
        
        
        
        "family2", 
        
        
        
        "column",
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
                                   
        
        
        
        new SimpleDateFormat(
        
        
        
        "yyyy-MM-dd hh:mm:ss").
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
                                    format(
        
        
        
        new Date()), 
        
        
        
        "insertTest");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
                        }
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
                    }
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
                } 
        
        
        
        catch (Exception e) {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
                    e.printStackTrace();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
                }
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
            }

以上的put插入数据,因为不适合处理大批量的数据,所以都是在自己搭建的集群上进行的测试,接下来介绍的两种方式用的是公司的集群.

使用mapReduce批量插入

因为hbase是寄托在hadoop集群上的分布式非关系型数据库,而Hadoop又是处理大规模数据的典范,所以使用MapReduce来实现hbase的批量入库自然是个不错的选择,废话不多说,直接贴代码


    
    
    
    
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.conf.Configuration;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.client.Put;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.mapreduce.TableOutputFormat;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.mapreduce.TableReducer;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.util.Bytes;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.io.LongWritable;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.io.NullWritable;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.io.Text;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.mapreduce.Job;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.mapreduce.Mapper;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import java.io.IOException;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import java.text.SimpleDateFormat;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import java.util.Date;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        public 
        
        
        
        class Hbase_MapReduceTest {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        static 
        
        
        
        class BatchMapper extends Mapper<LongWritable, Text, Text, Text> {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        SimpleDateFormat simpleDateFormat = 
        
        
        
        new 
        
        
        
        SimpleDateFormat(
        
        
        
        "yyyyMMddHHmmssSS");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Text text = 
        
        
        
        new 
        
        
        
        Text();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        protected void map(LongWritable key, Text value, Context context) {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        try {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       				
        
        
        
        final 
        
        
        
        String[] spliteds = value.
        
        
        
        toString().
        
        
        
        split(
        
        
        
        "::");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       				
        
        
        
        Date date = 
        
        
        
        new 
        
        
        
        Date();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       				
        
        
        
        String dateFormat = simpleDateFormat.format(date);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       				
        
        
        
        final 
        
        
        
        String rowKey = spliteds[
        
        
        
        0] + 
        
        
        
        "_" + dateFormat;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        				text.
        
        
        
        set(rowKey);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        				context.write(text, value);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			} 
        
        
        
        catch (
        
        
        
        IOException e) {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        				e.printStackTrace();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			} 
        
        
        
        catch (
        
        
        
        InterruptedException e) {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        				e.printStackTrace();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        static 
        
        
        
        class BatchReducer extends TableReducer<Text, Text, NullWritable> {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        protected void reduce(Text key, Iterable<Text> values, Context context) {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        for (
        
        
        
        Text tx : values) {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       				
        
        
        
        try {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       					
        
        
        
        final 
        
        
        
        String[] arrays = tx.
        
        
        
        toString().
        
        
        
        split(
        
        
        
        "::");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       					
        
        
        
        Put put = 
        
        
        
        new 
        
        
        
        Put(key.getBytes());
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        					put.addColumn(
        
        
        
        "info".getBytes(), 
        
        
        
        "name".getBytes(),
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        					arrays[
        
        
        
        1].getBytes());
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       					
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        					context.write(
        
        
        
        NullWritable.
        
        
        
        get(), put);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        				} 
        
        
        
        catch (
        
        
        
        IOException e) {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        					e.printStackTrace();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        				} 
        
        
        
        catch (
        
        
        
        InterruptedException e) {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        					e.printStackTrace();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        				}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        public static void main(String[] args) throws Exception {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        final 
        
        
        
        Configuration configuration = 
        
        
        
        new 
        
        
        
        Configuration();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		configuration.
        
        
        
        set(
        
        
        
        "hbase.zookeeper.quorum", 
        
        
        
        "master");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		configuration.
        
        
        
        set(
        
        
        
        "hbase.zookeeper.property.clientPort", 
        
        
        
        "4180");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        // 设置hbase表名称
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		configuration.
        
        
        
        set(
        
        
        
        TableOutputFormat.
        
        
        
        OUTPUT_TABLE, 
        
        
        
        "HBASE_INSERT");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		configuration.
        
        
        
        set(
        
        
        
        "dfs.socket.timeout", 
        
        
        
        "180000");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        final 
        
        
        
        Job job = 
        
        
        
        new 
        
        
        
        Job(configuration, 
        
        
        
        "HBaseBatchImport");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        // 设置reduce的个数
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		job.setNumReduceTasks(
        
        
        
        3);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
                       job.setMapperClass(
        
        
        
        BatchMapper.
        
        
        
        class);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		job.setReducerClass(
        
        
        
        BatchReducer.
        
        
        
        class);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        // 设置map的输出，不设置reduce的输出类型
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		job.setMapOutputKeyClass(
        
        
        
        Text.
        
        
        
        class);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		job.setMapOutputValueClass(
        
        
        
        Text.
        
        
        
        class);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		job.setInputFormatClass(
        
        
        
        TextInputFormat.
        
        
        
        class);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        // 不再设置输出路径，而是设置输出格式类型
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		job.setOutputFormatClass(
        
        
        
        TableOutputFormat.
        
        
        
        class);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        // 设置数据的输入路径
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        FileInputFormat.setInputPaths(job, args[
        
        
        
        0]);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        // hdfs://master:9000/input
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        System.exit(job.waitForCompletion(
        
        
        
        true) ? 
        
        
        
        0 : 
        
        
        
        1);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        }

这里和普通的MapReduce最大的区别就在于reduce过程的输出:不是常规的将reduce的结果输出到hdfs上面,而是直接输出到表里面,而且不用设置reduce的输出类型这里是最关键的两行代码:


    
    
    
    
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        //设置输出的hbase的表名 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        configuration.
        
        
        
        set(
        
        
        
        TableOutputFormat.
        
        
        
        OUTPUT_TABLE, 
        
        
        
        "HBASE_INSERT");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        //设置数据的输出格式类型
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        job.setOutputFormatClass(
        
        
        
        TableOutputFormat.
        
        
        
        class);

这种方式最终会调用Tableoutputformat类，核心的原理还是使用htable的put方法，不过由于使用了mapreduce分布式提交到hbase，速度比单线程效率高出许多.

但是这种方式也不是万能的，put提交的速度太快时会给hbase造成比较大的压力，容易发生gc,造成节点挂掉，尤其是初始化表到hbase时，一般都会有很多的历史数据需要入库，容易造成比较大的压力，这种情况下建议使用下面的方式bulkload方式入库，减少给hbase压力。上面这种方式是直接在map中生成put然后交给TableOutputformat去提交的，因为这里几乎不需要逻辑处理，如果需要做逻辑处理，那么一般会在reduce端去生成put对象，在map端做业务逻辑处理，比如数据关联，汇总之类的.

采用bulkLoad方法批量入库

这是应用最广泛的,也是经过官方认证的最快捷使用的hbase 批量入库的方式, hbase官方文档对这一块的介绍如下(经过google翻译之后的文档...):

散货装载 bulkload


    
    
    
    
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        1. 概观 HBase包含几种将数据加载到表中的方法。
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        最直接的方法是使用TableOutputFormatMapReduce作业中的类，
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        或者使用普通的客户端API; 然而，这些并不总是最有效的方法。 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        批量加载功能使用MapReduce作业以HBase内部数据格式输出表格数据，
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        然后直接将生成的StoreFiles加载到正在运行的集群中。
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        使用批量加载将比使用HBase API使用更少的CPU和网络资源。  
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        2.  大容量装载限制 当批量加载绕过写入路径时，WAL不会被写入作为过程的一部分。
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        复制通过读取WAL文件来工作，所以它不会看到批量加载的数据 - 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        对于使用的编辑也是如此Put.setDurability(SKIP_WAL)。
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        处理该问题的一种方法是将原始文件或HFile发送到其他群集，并在那里进行其他处理。
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
        
        
        
        3. 批量加载架构 HBase批量加载过程包含两个主要步骤。 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
           
        
        
        
        1. 通过MapReduce作业准备数据 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
            批量加载的第一步是使用MapReduce作业生成HBase数据文件（StoreFiles）HFileOutputFormat2。
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
            这种输出格式将数据写入HBase的内部存储格式，以便以后可以非常高效地将其加载到群集中。
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
            为了高效工作，HFileOutputFormat2必须对每个输出HFile进行配置，使其适合单个区域。
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
            为了做到这一点，输出将被批量加载到HBase中的作业使用Hadoop的
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
            TotalOrderPartitioner类将映射输出分区到键空间的不相交范围，对应于表中区域的键范围。 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
            HFileOutputFormat2包括一个便利功能，configureIncrementalLoad()它
        
        
        
        '
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
            TotalOrderPartitioner根据当前的表格区域边界自动设置一个。 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
             
        
        
        
        2. 完成数据加载 在准备好数据导入之后，通过使用importtsv具有“importtsv.bulk.output”
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              选项的工具或使用其他某个MapReduce作业HFileOutputFormat，
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              该completebulkload工具可用于将数据导入到正在运行的集群中。
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              这个命令行工具遍历准备好的数据文件，每个文件确定文件所属的区域。
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              然后，它会联系采用HFile的相应RegionServer，
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              将其移动到其存储目录中，并将数据提供给客户端。 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              如果在批量装载准备过程中，或者在准备和完成步骤之间区域边界发生了变化，
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              completebulkload公用程序将自动将数据文件分割成对应于新边界的片段。
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              这个过程并不是最佳的，所以用户应该小心地减少准备批量加载和导入到群集之间的延迟，
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              尤其是当其他客户端同时通过其他方式加载数据时。 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              $ hadoop jar hbase-
        
        
        
        server-VERSION.jar completebulkload 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              [-c /path/
        
        
        
        to/hbase/config/hbase-site.xml] /user/todd/myoutput mytable 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              该-c config-file选项可用于指定包含相应hbase参数的文件（例如，hbase-site.xml）
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              （如果CLASSPATH中尚未提供此参数）
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              （另外，如果zookeeper不是，则CLASSPATH必须包含具有zookeeper配置文件的目录由HBase管理）。     
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
              如果目标表在HBase中不存在，该工具将自动创建表。 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        4. 也可以看看 有关引用的实用程序的更多信息，请参阅ImportTsv和 CompleteBulkLoad。 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        请参阅操作方法：使用HBase批量加载，以及为什么选择最近一次有关批量加载状态的博客。 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        5. 高级用法 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        尽管该importtsv工具在很多情况下都很有用，但是高级用户可能希望以编程方式生成数据
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        ，或者从其他格式导入数据。
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        要开始这样做，挖掘ImportTsv.java并检查JavaDoc 
        
        
        
        for HFileOutputFormat。 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        批量加载的导入步骤也可以通过编程来完成。

我做测试的时候采用的是将wordcount的结果进行批量入库,测试的数据量是2个G的文本文件,wordcount的代码就不贴出来了,直接贴批量入库的代码


    
    
    
    
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import java.io.IOException;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.conf.Configuration;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.fs.FileSystem;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.fs.Path;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.HBaseConfiguration;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.HColumnDescriptor;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.HTableDescriptor;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.TableName;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.client.Admin;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.client.ConnectionFactory;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.client.HTable;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.client.Put;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.mapreduce.HFileOutputFormat;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.hbase.util.Bytes;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.io.LongWritable;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.io.Text;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.mapreduce.Job;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.mapreduce.Mapper;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        import org.apache.hadoop.util.GenericOptionsParser;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        public 
        
        
        
        class WorldCount_Hbase {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        public 
        
        
        
        static 
        
        
        
        class ConvertWordCountOutToHFileMapper
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        extends 
        
        
        
        Mapper<
        
        
        
        LongWritable, 
        
        
        
        Text, 
        
        
        
        ImmutableBytesWritable, 
        
        
        
        Put> {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		@
        
        
        
        Override
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		protected void 
        
        
        
        map(
        
        
        
        LongWritable key, 
        
        
        
        Text value, 
        
        
        
        Context context) 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        throws 
        
        
        
        IOException, 
        
        
        
        InterruptedException {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        // 
        
        
        
        上一个
        
        
        
        WordCount
        
        
        
        的输出格式是
        
        
        
        :a 100 b 20
        
        
        
        这样的形式
        
        
        
        ,
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        // 
        
        
        
        按行读取后
        
        
        
        ,
        
        
        
        行号作为
        
        
        
        key,
        
        
        
        每一行的内容作为
        
        
        
        value
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        String wordCountStr = value.
        
        
        
        toString();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        String[] wordCountArray = wordCountStr.
        
        
        
        split(
        
        
        
        "\t");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        String word = wordCountArray[
        
        
        
        0];
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			int 
        
        
        
        count = 
        
        
        
        Integer.valueOf(wordCountArray[
        
        
        
        1]);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        // 
        
        
        
        创建
        
        
        
        HBase
        
        
        
        中的
        
        
        
        RowKey
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			byte[] rowKey = 
        
        
        
        Bytes.toBytes(word);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        ImmutableBytesWritable rowKeyWritable = new 
        
        
        
        ImmutableBytesWritable(rowKey);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			byte[] family = 
        
        
        
        Bytes.toBytes(
        
        
        
        "cf");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			byte[] qualifier = 
        
        
        
        Bytes.toBytes(
        
        
        
        "count");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			byte[] hbaseValue = 
        
        
        
        Bytes.toBytes(
        
        
        
        count);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        // Put 
        
        
        
        用于列簇下的多列提交，若只有一个列，则可以使用
        
        
        
         KeyValue 
        
        
        
        格式
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        // KeyValue keyValue = new KeyValue(rowKey, family, qualifier,
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        // hbaseValue);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        Put put = new 
        
        
        
        Put(rowKey);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			put.add(family, qualifier, hbaseValue);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			context.write(rowKeyWritable, put);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        public 
        
        
        
        static void main(
        
        
        
        String[] args) 
        
        
        
        throws 
        
        
        
        Exception {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Long starttime = 
        
        
        
        System.currentTimeMillis();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Configuration hadoopConfiguration = new 
        
        
        
        Configuration();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		hadoopConfiguration.
        
        
        
        set(
        
        
        
        "fs.defaultFS", 
        
        
        
        "hdfs://192.168.1.31:9000");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        // hadoopConfiguration.set("mapreduce.map.memory.mb", "512");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        // hadoopConfiguration.set("mapreduce.reduce.memory.mb", "512");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        String[] dfsArgs = new 
        
        
        
        GenericOptionsParser(hadoopConfiguration, args).
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		getRemainingArgs();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        FileSystem fs = 
        
        
        
        FileSystem.
        
        
        
        get(hadoopConfiguration);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Path input = new 
        
        
        
        Path(
        
        
        
        "/tmp/xmr/hbase/test");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Path output = new 
        
        
        
        Path(
        
        
        
        "/tmp/xmr/resultdata/test");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        // Path input = new Path(dfsArgs[0]);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        // Path output = new Path(dfsArgs[1]);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Job convertWordCountJobOutputToHFileJob = new 
        
        
        
        Job(hadoopConfiguration, 
        
        
        
        "wordCount_bulkload");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		convertWordCountJobOutputToHFileJob.setJarByClass(
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        WorldCount_Hbase.
        
        
        
        class);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		convertWordCountJobOutputToHFileJob.setMapperClass(
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        ConvertWordCountOutToHFileMapper.
        
        
        
        class);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		convertWordCountJobOutputToHFileJob.setMapOutputKeyClass(
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        ImmutableBytesWritable.
        
        
        
        class);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		convertWordCountJobOutputToHFileJob.setMapOutputValueClass(
        
        
        
        Put.
        
        
        
        class);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        if (fs.exists(output)) {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			fs.delete(output);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        FileInputFormat.addInputPath(convertWordCountJobOutputToHFileJob, input);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        FileOutputFormat.setOutputPath(convertWordCountJobOutputToHFileJob, output);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        // 
        
        
        
        创建
        
        
        
        HBase
        
        
        
        的配置对象
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Configuration hbaseConfiguration = 
        
        
        
        HBaseConfiguration.create();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		hbaseConfiguration.
        
        
        
        set(
        
        
        
        "hbase.zookeeper.quorum", 
        
        
        
        "master,node001,node002");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		hbaseConfiguration.
        
        
        
        set(
        
        
        
        "hbase.zookeeper.property.clientPort", 
        
        
        
        "4180");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        System.out.
        
        
        
        println(hbaseConfiguration.
        
        
        
        toString());
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        // 
        
        
        
        创建目标表对象
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Admin admin = 
        
        
        
        ConnectionFactory.createConnection(hbaseConfiguration).getAdmin();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        if (!admin.isTableAvailable(
        
        
        
        TableName.valueOf
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		(
        
        
        
        "wordcount"))) {
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       			
        
        
        
        HTableDescriptor hbaseTable = new 
        
        
        
        HTableDescriptor(
        
        
        
        TableName.valueOf(
        
        
        
        "word1count"));
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			hbaseTable.addFamily(new 
        
        
        
        HColumnDescriptor(
        
        
        
        "cf"));
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        			admin.createTable(hbaseTable);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        HTable wordCountTable = new 
        
        
        
        HTable(hbaseConfiguration, 
        
        
        
        "word1count");
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        HFileOutputFormat.configureIncrementalLoad(
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		convertWordCountJobOutputToHFileJob, wordCountTable);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		int convertWordCountJobOutputToHFileJobResult =
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		convertWordCountJobOutputToHFileJob.waitForCompletion(
        
        
        
        true) ? 
        
        
        
        0
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        				: 
        
        
        
        1;
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        // 
        
        
        
        调用
        
        
        
        BulkLoad
        
        
        
        方式来将
        
        
        
        MR
        
        
        
        结果批量入库
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        LoadIncrementalHFiles loader = new 
        
        
        
        LoadIncrementalHFiles(hbaseConfiguration);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        // 
        
        
        
        第一个参数为第二个
        
        
        
        Job
        
        
        
        的输出目录即保存
        
        
        
        HFile
        
        
        
        的目录，第二个参数为目标表
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		loader.doBulkLoad(output, wordCountTable);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Long endtime = 
        
        
        
        System.currentTimeMillis();
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        System.out.
        
        
        
        println(
        
        
        
        "
        
        
        
        程序的执行时间为
        
        
        
        :" + (endtime - starttime));
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        System.exit(convertWordCountJobOutputToHFileJobResult);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	}
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        }

这里面需要注意的地方:

map的输出格式必须为ImmutableBytesWritable, Put或者ImmutableBytesWritable, KeyValue 如果有多个列就选用Put,如果只有一个列可以选用KeyValue
不用自己写reduce过程,自然也不用写reduce的输入输出路径
使用BulkLoad方法将生成的Hfile进行批量入库 // 调用BulkLoad方式来将MR结果批量入库


    
    
    
    
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        LoadIncrementalHFiles loader = 
        
        
        
        new LoadIncrementalHFiles(hbaseConfiguration);
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        // 第一个参数为第二个Job的输出目录即保存HFile的目录，第二个参数为目标表
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        loader.doBulkLoad(output, wordCountTable);

以上是对常用的几种批量入库方式进行的基本介绍,对于每一种方法,也用了几个G的数据进行过测试无误..

网上也能搜到一大堆雷同相似的代码,但是Hbase是用来存储海量数据的数据库,到了实际的应用中,面临很大数据量一大,也不会出问题么?

答案当然是NO,Hbase批量入库的坑才刚刚开始!!!我就被这些坑折腾的怀疑人生!!

那些奇奇怪怪的小问题在这里就不多赘述了,把使用BulkLoad进行批量入库遇到的最大的几个坑分享给大家!!!

首先就是reduce相关的问题:

在实际的应用中你就会发现,对于稍大一点的数据量,map过程的执行效率还是比较让人满意的,但是到了reduce阶段就会出现比较严重的卡顿,我的困惑就是?我的代码里明明没有reduce过程,为什么还会有reduce过程来影响我入库的效率呢?

于是,我尝试着在job里,设置reduce的数量,把它设置为0,可是重新执行的时候就会发现还是会有那个烦人的reduce过程, 既然设置它为0没有效果,那我把它的数量设置的多一点,提高它的并行度总能加快效率了吧于是我又修改了reduce的数量,执行的时候发现还是只有一个..... 后来我才知道, 在这种情况下,我们不用自己写reduce过程,但是会使用Hbase给我们提供的reduce,也就是说,无论你怎么设置reduce数量,都是无效的. 这样我也就释然了

效率严重低下的问题!!!

首先我用100M的数据量做测试,居然需要30s才能入库完毕!用几个G的数据量测试,效率也没有明显的提升! 也就是说平均每秒的插入速度还不到15000条.,这甚至比mysql的入库还要慢很多,这种效率在实际生产中是完全不能接受的说好的这是入库最快的方式呢?我不仅产生了怀疑.. 说到底,这种问题还是因为reduce数量只有一个这个蛋疼的问题所导致的,也就是说,不管你的集群有多牛,都值相当于单机版,这显然是不合适的...那么该如何解决这个问题呢????

就是在建表的时候进行合理的预分区!!!预分区的数目会决定你的reduce过程的数目!简单来说,在一定的范围内,进行合适预分区的话,reduce的数量增加多少,效率就提高多少倍!!!

有关于hbase的预分区,进行合适的预分区,实际上是一个很复杂的问题,也不是本篇文章讨论的重点. 感兴趣的话可以去看看这位大神写的东西,给了我很大的启发

大神的博客链接

我只简单介绍一下hbase建表时预分区的shell语句和执行的结果:

create 'XUE_BULKLOAD','info',{SPLITS => [ '1','2','3', '4','5','6','7','8','9']}

这样就成功的将表名为 'XUE_BULKLOAD',列簇名为'info'的表在建表时预分了10个分区

预分区结束之后进行测试:发现reduce的数量为预分区的数量+1,而且执行效率大大提高! 插入效率大致在10W/s~20W/s之间,已经勉强能达到实际工作的要求!

数据量超过某个范围就会导致插入数据库失败的问题!

经过各种各样的调试,效率已经可以接受! 然后开始调大数据量测试,发现哪怕几十个G的数据量,在执行完MapReduce过程之后都会报错,去表里面查看数据,一条记录都没有!!报错信息如下


    
    
    
    
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        Trying to 
        
        
        
        load more 
        
        
        
        than 
        
        
        
        32 hfiles 
        
        
        
        to one family 
        
        
        
        of one region
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        18 
        
        
        
        23:
        
        
        
        20:
        
        
        
        36 
        
        
        
        ERROR mapreduce
        
        
        
        .LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        more 
        
        
        
        than 
        
        
        
        32 hfiles 
        
        
        
        to family info 
        
        
        
        of region 
        
        
        
        with 
        
        
        
        start 
        
        
        
        key 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        Exception 
        
        
        
        in 
        
        
        
        thread 
        
        
        
        "main" java
        
        
        
        .io
        
        
        
        .IOException: Trying 
        
        
        
        to 
        
        
        
        load more 
        
        
        
        than 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        32 hfiles 
        
        
        
        to one family 
        
        
        
        of one region
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        at org
        
        
        
        .apache
        
        
        
        .hadoop
        
        
        
        .hbase
        
        
        
        .mapreduce
        
        
        
        .LoadIncrementalHFiles
        
        
        
        .doBulkLoad
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	(LoadIncrementalHFiles
        
        
        
        .java:
        
        
        
        377)
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        at hbase_Insert
        
        
        
        .Hbase_Insert
        
        
        
        .main(Hbase_Insert
        
        
        
        .java:
        
        
        
        241)
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        at sun
        
        
        
        .reflect
        
        
        
        .NativeMethodAccessorImpl
        
        
        
        .invoke0(
        
        
        
        Native Method)
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        at sun
        
        
        
        .reflect
        
        
        
        .NativeMethodAccessorImpl
        
        
        
        .invoke(
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	NativeMethodAccessorImpl
        
        
        
        .java:
        
        
        
        57)
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        at sun
        
        
        
        .reflect
        
        
        
        .DelegatingMethodAccessorImpl
        
        
        
        .invoke(
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	DelegatingMethodAccessorImpl
        
        
        
        .java:
        
        
        
        43)
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        at java
        
        
        
        .lang
        
        
        
        .reflect
        
        
        
        .Method
        
        
        
        .invoke(Method
        
        
        
        .java:
        
        
        
        606)
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        at org
        
        
        
        .apache
        
        
        
        .hadoop
        
        
        
        .util
        
        
        
        .RunJar
        
        
        
        .run(RunJar
        
        
        
        .java:
        
        
        
        221)
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       	
        
        
        
        at org
        
        
        
        .apache
        
        
        
        .hadoop
        
        
        
        .util
        
        
        
        .RunJar
        
        
        
        .main(RunJar
        
        
        
        .java:
        
        
        
        136)

报错的大致意思就是试图将超过32个Hfile文件导入到hbase里面的一个region导致失败那这个问题该如何解决呢?实际上就是两个重要的参数限制的一个是:

hbase.hregion.max.filesize

单个ColumnFamily的region大小，若按照ConstantSizeRegionSplitPolicy策略，超过设置的该值则自动split 默认的大小是1G hbase.mapreduce.bulkload.max.hfiles.perRegion.perFamily

允许的hfile的最大个数,默认配置是32 也就是说:这两个参数的默认值决定了,每次批量入库的数据量不能超过1*32也就是32个G,超过这个数量就会导致入库失败

可以在代码里,或者在hbase安装路径下conf目录下的hbase-site.xml里面针对这两个参数进行设置为了一劳永逸,我选择在hbase-site.xml里面进行设置,设置结果如下:


    
    
    
    
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        <property>
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        <name>hbase.hregion.max.filesize
        
        
        
        name> 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        <value>10737418240
        
        
        
        value> 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        property> 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        <property> 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        <name>hbase.mapreduce.bulkload.max.hfiles.perRegion.perFamily
        
        
        
        name> 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        <value>3200
        
        
        
        value>
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        property>

这样,每次能够批量入库的数据就达到了32个T,符合公司的数据量需要! 配置完毕后重启集群进行测试,不在报这个错误,执行结果如下:


    
    
    
    
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        17:
        
        
        
        31 INFO mapreduce.Job:  map 
        
        
        
        1% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        17:
        
        
        
        35 INFO mapreduce.Job:  map 
        
        
        
        2% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        17:
        
        
        
        42 INFO mapreduce.Job:  map 
        
        
        
        3% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        17:
        
        
        
        45 INFO mapreduce.Job:  map 
        
        
        
        4% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        17:
        
        
        
        51 INFO mapreduce.Job:  map 
        
        
        
        5% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        17:
        
        
        
        55 INFO mapreduce.Job:  map 
        
        
        
        6% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        17:
        
        
        
        59 INFO mapreduce.Job:  map 
        
        
        
        7% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        18:
        
        
        
        03 INFO mapreduce.Job:  map 
        
        
        
        8% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        18:
        
        
        
        06 INFO mapreduce.Job:  map 
        
        
        
        9% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        18:
        
        
        
        11 INFO mapreduce.Job:  map 
        
        
        
        10% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        18:
        
        
        
        16 INFO mapreduce.Job:  map 
        
        
        
        11% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        18:
        
        
        
        20 INFO mapreduce.Job:  map 
        
        
        
        12% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        18:
        
        
        
        27 INFO mapreduce.Job:  map 
        
        
        
        13% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        18:
        
        
        
        32 INFO mapreduce.Job:  map 
        
        
        
        14% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        18:
        
        
        
        37 INFO mapreduce.Job:  map 
        
        
        
        15% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        18:
        
        
        
        42 INFO mapreduce.Job:  map 
        
        
        
        16% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        18:
        
        
        
        47 INFO mapreduce.Job:  map 
        
        
        
        17% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        18:
        
        
        
        53 INFO mapreduce.Job:  map 
        
        
        
        18% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        18:
        
        
        
        58 INFO mapreduce.Job:  map 
        
        
        
        19% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        19:
        
        
        
        03 INFO mapreduce.Job:  map 
        
        
        
        20% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        19:
        
        
        
        08 INFO mapreduce.Job:  map 
        
        
        
        21% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        19:
        
        
        
        14 INFO mapreduce.Job:  map 
        
        
        
        22% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        19:
        
        
        
        18 INFO mapreduce.Job:  map 
        
        
        
        23% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        19:
        
        
        
        23 INFO mapreduce.Job:  map 
        
        
        
        24% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        19:
        
        
        
        29 INFO mapreduce.Job:  map 
        
        
        
        25% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        19:
        
        
        
        33 INFO mapreduce.Job:  map 
        
        
        
        26% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        19:
        
        
        
        38 INFO mapreduce.Job:  map 
        
        
        
        27% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        19:
        
        
        
        43 INFO mapreduce.Job:  map 
        
        
        
        28% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        19:
        
        
        
        48 INFO mapreduce.Job:  map 
        
        
        
        29% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        19:
        
        
        
        53 INFO mapreduce.Job:  map 
        
        
        
        30% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        19:
        
        
        
        58 INFO mapreduce.Job:  map 
        
        
        
        31% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        20:
        
        
        
        04 INFO mapreduce.Job:  map 
        
        
        
        32% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        20:
        
        
        
        08 INFO mapreduce.Job:  map 
        
        
        
        33% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        20:
        
        
        
        13 INFO mapreduce.Job:  map 
        
        
        
        34% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        20:
        
        
        
        17 INFO mapreduce.Job:  map 
        
        
        
        35% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        20:
        
        
        
        21 INFO mapreduce.Job:  map 
        
        
        
        36% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        20:
        
        
        
        25 INFO mapreduce.Job:  map 
        
        
        
        37% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        20:
        
        
        
        29 INFO mapreduce.Job:  map 
        
        
        
        38% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        20:
        
        
        
        33 INFO mapreduce.Job:  map 
        
        
        
        39% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        20:
        
        
        
        37 INFO mapreduce.Job:  map 
        
        
        
        40% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        20:
        
        
        
        41 INFO mapreduce.Job:  map 
        
        
        
        41% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        20:
        
        
        
        45 INFO mapreduce.Job:  map 
        
        
        
        42% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        20:
        
        
        
        50 INFO mapreduce.Job:  map 
        
        
        
        43% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        20:
        
        
        
        54 INFO mapreduce.Job:  map 
        
        
        
        44% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        20:
        
        
        
        58 INFO mapreduce.Job:  map 
        
        
        
        45% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        21:
        
        
        
        02 INFO mapreduce.Job:  map 
        
        
        
        46% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        21:
        
        
        
        06 INFO mapreduce.Job:  map 
        
        
        
        47% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        21:
        
        
        
        10 INFO mapreduce.Job:  map 
        
        
        
        48% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        21:
        
        
        
        14 INFO mapreduce.Job:  map 
        
        
        
        49% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        21:
        
        
        
        18 INFO mapreduce.Job:  map 
        
        
        
        50% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        21:
        
        
        
        22 INFO mapreduce.Job:  map 
        
        
        
        51% reduce 
        
        
        
        0%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        ........
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        29:
        
        
        
        12 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        81%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        29:
        
        
        
        24 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        82%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        29:
        
        
        
        36 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        83%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        29:
        
        
        
        48 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        84%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        30:
        
        
        
        00 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        85%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        30:
        
        
        
        12 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        86%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        30:
        
        
        
        23 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        87%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        30:
        
        
        
        33 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        88%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        30:
        
        
        
        45 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        89%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        30:
        
        
        
        59 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        90%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        31:
        
        
        
        11 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        91%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        31:
        
        
        
        21 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        92%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        31:
        
        
        
        33 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        93%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        31:
        
        
        
        45 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        94%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        31:
        
        
        
        57 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        95%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        32:
        
        
        
        10 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        96%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        32:
        
        
        
        28 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        97%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        32:
        
        
        
        57 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        98%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        33:
        
        
        
        28 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        99%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        34:
        
        
        
        43 INFO mapreduce.Job:  map 
        
        
        
        100% reduce 
        
        
        
        100%
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 INFO mapreduce.Job: Job job_1516347580021_0001 completed successfully
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 INFO mapreduce.Job: Counters: 
        
        
        
        52
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	File System Counters
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		FILE: Number of bytes read=
        
        
        
        87576726096
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		FILE: Number of bytes written=
        
        
        
        142193600747
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		FILE: Number of read operations=
        
        
        
        0
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		FILE: Number of large read operations=
        
        
        
        0
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		FILE: Number of write operations=
        
        
        
        0
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		HDFS: Number of bytes read=
        
        
        
        83582905128
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		HDFS: Number of bytes written=
        
        
        
        166475667426
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		HDFS: Number of read operations=
        
        
        
        5468
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		HDFS: Number of large read operations=
        
        
        
        0
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		HDFS: Number of write operations=
        
        
        
        39
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	Job Counters 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Failed map tasks=
        
        
        
        6
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Launched map tasks=
        
        
        
        1086
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Launched reduce tasks=
        
        
        
        10
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Other local map tasks=
        
        
        
        6
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Data-local map tasks=
        
        
        
        465
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Rack-local map tasks=
        
        
        
        615
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Total time spent by all maps in occupied slots (ms)=
        
        
        
        82454392
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Total time spent by all reduces in occupied slots (ms)=
        
        
        
        47463944
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Total time spent by all map tasks (ms)=
        
        
        
        10306799
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Total time spent by all reduce tasks (ms)=
        
        
        
        5932993
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Total vcore-seconds taken by all map tasks=
        
        
        
        10306799
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Total vcore-seconds taken by all reduce tasks=
        
        
        
        5932993
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Total megabyte-seconds taken by all map tasks=
        
        
        
        84433297408
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Total megabyte-seconds taken by all reduce tasks=
        
        
        
        48603078656
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	Map-Reduce Framework
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Map input records=
        
        
        
        568152966
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Map output records=
        
        
        
        568152966
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Map output bytes=
        
        
        
        228099087448
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Map output materialized bytes=
        
        
        
        54476960272
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Input split bytes=
        
        
        
        186120
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Combine input records=
        
        
        
        0
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Combine output records=
        
        
        
        0
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Reduce input groups=
        
        
        
        292435364
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Reduce shuffle bytes=
        
        
        
        54476960272
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Reduce input records=
        
        
        
        568152966
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Reduce output records=
        
        
        
        2339482912
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Spilled Records=
        
        
        
        1513624168
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Shuffled Maps =
        
        
        
        10800
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Failed Shuffles=
        
        
        
        0
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Merged Map outputs=
        
        
        
        10800
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        GC time elapsed (ms)=
        
        
        
        794607
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        CPU time spent (ms)=
        
        
        
        21363440
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Physical memory (bytes) snapshot=
        
        
        
        3038556569600
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Virtual memory (bytes) snapshot=
        
        
        
        9401710268416
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       		
        
        
        
        Total committed heap usage (bytes)=
        
        
        
        3512994889728
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	Shuffle Errors
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		BAD_ID=
        
        
        
        0
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		CONNECTION=
        
        
        
        0
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		IO_ERROR=
        
        
        
        0
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		WRONG_LENGTH=
        
        
        
        0
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		WRONG_MAP=
        
        
        
        0
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		WRONG_REDUCE=
        
        
        
        0
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	File Input Format Counters 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Bytes Read=
        
        
        
        83582349648
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        	File Output Format Counters 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        		Bytes Written=
        
        
        
        166475667426
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 INFO zookeeper.RecoverableZooKeeper: Process identifier=hconnection-
        
        
        
        0x71f30c76 connecting to ZooKeeper ensemble=node003:
        
        
        
        4180,node002:
        
        
        
        4180,node001:
        
        
        
        4180,master:
        
        
        
        4180,node009:
        
        
        
        4180,node008:
        
        
        
        4180,node007:
        
        
        
        4180,node010:
        
        
        
        4180,node006:
        
        
        
        4180,node005:
        
        
        
        4180,node004:
        
        
        
        4180
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 INFO zookeeper.ZooKeeper: Initiating client connection, connectString=node003:
        
        
        
        4180,node002:
        
        
        
        4180,node001:
        
        
        
        4180,master:
        
        
        
        4180,node009:
        
        
        
        4180,node008:
        
        
        
        4180,node007:
        
        
        
        4180,node010:
        
        
        
        4180,node006:
        
        
        
        4180,node005:
        
        
        
        4180,node004:
        
        
        
        4180 sessionTimeout=
        
        
        
        90000 watcher=hconnection-
        
        
        
        0x71f30c760x0, quorum=node003:
        
        
        
        4180,node002:
        
        
        
        4180,node001:
        
        
        
        4180,master:
        
        
        
        4180,node009:
        
        
        
        4180,node008:
        
        
        
        4180,node007:
        
        
        
        4180,node010:
        
        
        
        4180,node006:
        
        
        
        4180,node005:
        
        
        
        4180,node004:
        
        
        
        4180, baseZNode=/hbase
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 INFO zookeeper.ClientCnxn: Opening socket connection to server node004/
        
        
        
        192.168.1.38:
        
        
        
        4180. 
        
        
        
        Will not attempt to authenticate using SASL (unknown error)
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/01/20 12:38:02 INFO zookeeper.ClientCnxn: Socket connection established to node004/192.168.1.38:4180, initiating session
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/01/20 12:38:02 INFO zookeeper.ClientCnxn: Session establishment complete on server node004/192.168.1.38:4180, sessionid = 
        
        
        
        0x26001af8d8190002, negotiated timeout = 
        
        
        
        40000
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 WARN mapreduce.LoadIncrementalHFiles: Skipping non-directory hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/_SUCCESS
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 WARN mapreduce.LoadIncrementalHFiles: Trying to bulk 
        
        
        
        load hfile hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/28e47c53edaf4616a3dfc349d0f0e02a with size: 10931823633 bytes can be problematic as it may lead to oversplitting.
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 WARN mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        bulk 
        
        
        
        load hfile hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/5e6501ccb7554b82a2e93024d61dbe0e with size: 10931820982 bytes can be problematic as it may lead to oversplitting.
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 WARN mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        bulk 
        
        
        
        load hfile hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/6245730468534f85a428ef7fb7acd499 with size: 10931829083 bytes can be problematic as it may lead to oversplitting.
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 WARN mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        bulk 
        
        
        
        load hfile hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/a3b7225320b24e838559d5a5772bdd87 with size: 10931823391 bytes can be problematic as it may lead to oversplitting.
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 WARN mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        bulk 
        
        
        
        load hfile hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/a8306bc4ef3941f5bd131d47f0b1c2c3 with size: 10931822321 bytes can be problematic as it may lead to oversplitting.
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 WARN mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        bulk 
        
        
        
        load hfile hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/c163c568b1c24d88ac0ed7599b81ecba with size: 10931824861 bytes can be problematic as it may lead to oversplitting.
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 WARN mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        bulk 
        
        
        
        load hfile hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/d069683ce064411793640f2a0ec6ca98 with size: 10931822990 bytes can be problematic as it may lead to oversplitting.
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 WARN mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        bulk 
        
        
        
        load hfile hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/e5df664e18c54da7b84370b72506923b with size: 10931821709 bytes can be problematic as it may lead to oversplitting.
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 WARN mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        bulk 
        
        
        
        load hfile hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/fba38b4d0bd34f6782b844b288780e7b with size: 10931826385 bytes can be problematic as it may lead to oversplitting.
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        02 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        hfile=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/11e458c2c1f0465
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        4ae1783ec4e6576e8 
        
        
        
        first=
        
        
        
        459096918168596876155 
        
        
        
        last=
        
        
        
        4999999888024945828
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load h
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        file=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/78067c90799149db
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        b4a423ef556a4272 
        
        
        
        first=
        
        
        
        559078464243536377945 
        
        
        
        last=
        
        
        
        5999999888024945828
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        hfile=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/0049f16fd57b482
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        aa2e68ebe21a0cb72 
        
        
        
        first=
        
        
        
        15907887724999982915 
        
        
        
        last=
        
        
        
        19999999217611496331
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        hfile=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/28e47c53edaf461
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        6a3dfc349d0f0e02a 
        
        
        
        first=
        
        
        
        80100000359202982424 
        
        
        
        last=
        
        
        
        859088818898462383266
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        hfile=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/6245730468534f8
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        5a428ef7fb7acd499 
        
        
        
        first=
        
        
        
        401000000531957283573 
        
        
        
        last=
        
        
        
        459096917941294955954
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        hfile=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/18068da4a3f5469a804eee9f6921617a first=959083192452571451003 last=99999998239977206078
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        hfile=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/5e6501ccb7554b8
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        2a2e93024d61dbe0e 
        
        
        
        first=
        
        
        
        30100000359202982424 
        
        
        
        last=
        
        
        
        359081166786305137185
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load 
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        hfile=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/0cff66c092004d4
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        88db32c3bf549a1d1 
        
        
        
        first=
        
        
        
        0100000359202982424 
        
        
        
        last=
        
        
        
        0999998239977206078
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load hfile=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/c163c568b1c24d8
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        8ac0ed7599b81ecba 
        
        
        
        first=
        
        
        
        10100000359202982424 
        
        
        
        last=
        
        
        
        15907887393454423668
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
        
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load hfile=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/e5df664e18c54da7b84370b72506923b first=501000000531957283573 last=559078458337340744586
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load hfile=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/88df957d66e84b758583c47c9e6aec95 first=25908421410455709356 last=29999998239977206078
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO hfile.CacheConfig: CacheConfig:disabled
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load hfile=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/a8306bc4ef3941f5bd131d47f0b1c2c3 first=60100000359202982424 last=659079145929173333600
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load hfile=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/d28c5e918b784127a7faa8afee8b364d first=359081168652388606128 last=39999999217611496331
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load hfile=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/a3b7225320b24e838559d5a5772bdd87 first=701000000531957283573 last=759089489615157841144
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load hfile=hdfs:
        
        
        
        //192.168.1.31:9000/test_demo/result/test/info/d069683ce064411793640f2a0ec6ca98 first=20100000359202982424 last=25908421377193754247
       
       
       
       
      
      
      
      
     
     
     
     
      
      
      
      
       
       
       
       
      
      
      
      
      
      
      
      
       
       
       
       
        
        
        
        18/
        
        
        
        01/
        
        
        
        20 
        
        
        
        12:
        
        
        
        38:
        
        
        
        03 INFO mapreduce.LoadIncrementalHFiles: Trying 
        
        
        
        to 
        
        
        
        load hfile=hdfs:
        
        
        
        //192.168

你可能感兴趣的:(HBase)

HBase监控也想洒脱 JanusGraph hbase
Prometheus+Grafana搭建HBase监控参考https://blog.csdn.net/devcloud/article/details/115069449
HBase 监控 | HBase Metrics 初探（一）禅克
前言：对于任意一个系统而言，做好监控都是非常重要的，HBase也不例外。经常，我们会从JMX中获取相关指标来做展示、对HBase进行监控，那这些指标是怎么生成的呢？如果你想自定义自己的监控指标又该怎么做呢？基于好奇之心和学习的目的，最近打算学习一下HBase监控相关原理及实现，今天先简单捋一捋思路。1.如何下手？我一向比较喜欢先看项目所依赖的pom文件，打开HBase源码，有两个非常相关的模块：h
深入探索Hadoop技术：全面学习指南
引言在大数据时代，高效地存储、处理和分析海量数据已成为企业决策与创新的关键驱动力。Hadoop，作为开源的大数据处理框架，以其强大的分布式存储和并行计算能力，以及丰富的生态系统，为企业提供了应对大规模数据挑战的有效解决方案。本文旨在为初学者和进阶者提供一份详尽的Hadoop技术学习指南，涵盖HDFS、MapReduce、YARN等核心组件，以及Hive、Pig、HBase等生态系统工具，助您踏上H
Hbase - 表导出CSV数据 kikiki1
新鲜文章，昨天刚经过线上验证过的，使用它导出了3亿的用户数据出来，花了半个小时，性能还是稳稳的，好了不吹牛皮了，直接上代码吧。MR考查了Hbase的各种MR，没有发现哪一个是能实现的，如果有请通知我，我给他发红包。所以我们只能自己来写一个MR了，编写一个Hbase的MR，官方文档上也有相应的例子。我们用来加以化妆就得到我们想要的了。导出的CSV格式为admin,22,北京admin,23,天津依赖
ftp文件服务器有连接数限制,查看ftp服务器连接数命令赵承铭 ftp文件服务器有连接数限制
查看ftp服务器连接数命令内容精选换一换本章节适用于MRS3.x之前版本。Loader支持以下多种连接，每种连接的配置介绍可根据本章节内容了解。obs-connectorgeneric-jdbc-connectorftp-connector或sftp-connectorhbase-connector、hdfs-connector或hive-connectorOBS连接是Loa“数据导入”章节适用于
HBase总结
HBase1.HBase核心概念HBase的作用HBase主要用于存储和管理超大规模的结构化或半结构化数据（如PB级），特点包括：高扩展性：通过分布式架构横向扩展，支持数千台服务器高吞吐量：适合实时随机读写（如用户行为日志、实时分析）强一致性：保证同一行数据的原子性操作灵活的数据模型：支持动态列和稀疏存储典型应用场景：互联网公司的用户行为日志存储（如点击流数据）社交媒体的实时消息存储物联网设备时序
Hadoop核心组件最全介绍 Cachel wood 大数据开发 hadoop 大数据分布式 spark 数据库计算机网络
文章目录一、Hadoop核心组件1.HDFS(HadoopDistributedFileSystem)2.YARN(YetAnotherResourceNegotiator)3.MapReduce二、数据存储与管理1.HBase2.Hive3.HCatalog4.Phoenix三、数据处理与计算1.Spark2.Flink3.Tez4.Storm5.Presto6.Impala四、资源调度与集群管
HBase 开发：使用Java操作HBase 睡觉的时候我不困 hbase java python
第1关：创建表任务描述相关知识如何使用Java连接HBase数据库HBaseConfigurationConnectionFactory创建表HBase2.X创建表编程要求测试说明任务描述本关任务：使用Java代码在HBase中创建表。相关知识为了完成本关任务，你需要掌握：1.如何使用Java连接HBase数据库，2.如何使用Java代码在HBase中创建表。如何使用Java连接HBase数据库J
头歌作业-HBase 开发：使用Java操作HBase http_lizi hbase java python
第一关packagestep1;importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.HColumnDescriptor;importorg.apache.h
PostgreSql、Hbase的安装月光一族吖 postgresql hbase 数据库
在CentOS8中安装PostgreSQL和HBase，以下是详细步骤，包括使用sudo权限的命令：安装PostgreSQL更新系统包在两台CentOS8上运行以下命令，确保系统是最新的：sudodnfupdate-y安装PostgreSQLCentOS8默认仓库提供PostgreSQL。你可以直接安装所需版本的PostgreSQL：sudodnfinstall-ypostgresql-serve
HDFS与HBase有什么关系？ lucky_syq hdfs hbase hadoop
1、HDFS文件存储系统和HBase分布式数据库HDFS是Hadoop分布式文件系统。HBase的数据通常存储在HDFS上。HDFS为HBase提供了高可靠性的底层存储支持。Hbase是Hadoopdatabase，即Hadoop数据库。它是一个适合于非结构化数据存储的数据库，HBase基于列的而不是基于行的模式。
Hbase和关系型数据库、HDFS、Hive的区别别这么骄傲 hive hbase 数据库
目录1.Hbase和关系型数据库的区别2.Hbase和HDFS的区别3.Hbase和Hive的区别1.Hbase和关系型数据库的区别关系型数据库Hbase存储适合结构化数据，单机存储适合结构化和半结构数据的松散数据，分布式存储功能（1）支持ACID（2）支持join（3）使用主键PK（4）数据类型：int、varchar等（1）仅支持单行事务（2）不支持join，把数据糅合到一张大表（3）行键ro
大数据基础知识-Hadoop、HBase、Hive一篇搞定原来是猪猪呀 hadoop 大数据分布式
HadoopHadoop是一个由Apache基金会所开发的分布式系统基础架构，其核心设计包括分布式文件系统（HDFS）和MapReduce编程模型；Hadoop是一个开源的分布式计算框架，旨在帮助用户在不了解分布式底层细节的情况下，开发分布式程序。它通过利用集群的力量，提供高速运算和存储能力，特别适合处理超大数据集的应用程序。Hadoop生态圈Hadoop生态圈是一个由多个基于Hadoop开发的相
Hadoop、HDFS、Hive、Hbase区别及联系静心观复大数据 hadoop hdfs hive
Hadoop、HDFS、Hive和HBase是大数据生态系统中的关键组件，它们都是由Apache软件基金会管理的开源项目。下面将深入解析它们之间的区别和联系。HadoopHadoop是一个开源的分布式计算框架，它允许用户在普通硬件上构建可靠、可伸缩的分布式系统。Hadoop通常指的是整个生态系统，包括HadoopCommon（共享库和工具）、HadoopDistributedFileSystem(
大数据(1)-hdfs&hbase viperrrrrrr 大数据 hdfs hbase
hbase&hdfs一、体系结构HDFS是一个标准的主从(Master/Slave)体系结构的分布式系统；HDFS集群包含一个或多个NameNode(NameNodeHA会有多个NameNode)和多个DataNode(根据节点情况规划),用户可以通过HDFS客户端同NameNode和DataNode进行交互以访问文件系统。HDFS公开文件系统名称空间，并允许将用户数据存储在文件中。在内部，一个文
HBase 开发：使用Java操作HBase 第1关：创建表是草莓熊吖 hbase 大数据 Educoder hbase hadoop 大数据
为了完成本关任务，你需要掌握：1.如何使用Java连接HBase数据库，2.如何使用Java代码在HBase中创建表。如何使用Java连接HBase数据库Java连接HBase需要两个类：HBaseConfigurationConnectionFactoryHBaseConfiguration要连接HBase我们首先需要创建Configuration对象，这个对象我们需要通过HBaseConfig
Hbase-表操作红笺Code Hbase hbase 大数据数据分析非关系型数据库 zookeeper
目录一、创建表:1.创建表时指定列族的属性2.创建表时不指定列族的属性多学一招：克隆表二、查看表信息三、查看表四、停用和启用表1.停用表2.启用表多学一招：停用或启用多个表五、判断表1.exists命令2.is_enabled命令3.is_disabled命令六、修改表1.修改表属性（1）添加属性（2）删除属性2.修改列族（1）修改列族属性（2）添加列族（3）删除列族七、删除表drop命令多学一招
头歌当HBase遇上MapReduce 敲代码的苦13 头歌 hbase mapreduce 数据库
头歌当HBase遇上MapReduce第1关：HBase的MapReduce快速入门代码行：packagecom.processdata;importjava.io.IOException;importjava.util.List;importjava.util.Scanner;importorg.apache.hadoop.conf.Configuration;importorg.apache.
大数据集群架构hadoop集群、Hbase集群、zookeeper、kafka、spark、flink、doris、dataeas(二) 争取不加班！ hadoop hbase zookeeper 大数据运维
zookeeper单节点部署wget-chttps://dlcdn.apache.org/zookeeper/zookeeper-3.8.4/apache-zookeeper-3.8.4-bin.tar.gz下载地址tarxfapache-zookeeper-3.8.4-bin.tar.gz-C/data/&&mv/data/apache-zookeeper-3.8.4-bin//data/zoo
JT808教程：设置/查询终端参数
REDISANT提供互联网与物联网开发测试套件#互联网与中间件：RedisAssistantZooKeeperAssistantKafkaAssistantRocketMQAssistantRabbitMQAssistantPulsarAssistantHBaseAssistantNoSqlAssistantEtcdAssistantGarnetAssistant工业与物联网：MQTTAssist
Squirrel：通用SQL、NoSQL客户端 antui1957
安装配置数据库配置驱动配置连接如果你的工作中，需要使用到多个数据库，又不想在多种客户端之间切换来切换去。那么就需要找一款支持多数据库的客户端工具了。如果你要连接多个关系型数据库，你就可以使用NavicatPremium。但是如果你有使用到NOSQL（譬如HBase、MongoDB等），还是建议使用SquirrelSQLClient。1、安装下载地址：http://squirrel-sql.sour
使用datax进行mysql的表恢复是桃萌萌鸭~ mysql 数据库
DataXDataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台，实现包括MySQL、SQLServer、Oracle、PostgreSQL、HDFS、Hive、HBase、OTS、ODPS等各种异构数据源之间高效的数据同步功能。FeaturesDataX本身作为数据同步框架，将不同数据源的同步抽象为从源头数据源读取数据的Reader插件，以及向目标端写入数据的Writer插件，理论上Dat
hbase:meta 表解析有数的编程笔记 HBase
hbase:meta表中存储了Hbase集群中全部表的所有的region信息，在Hbase2.x之后新增了表的状态信息。hbase:meta表的结构非常简单，在Hbase2.x之前整个表只有一个名为info的ColumnFamily。在Hbase2.x新增表状态信息后，增加了名为table的ColumnFamily。HBase保证hbase:meta表始终只有一个Region，这是为了确保meta
Hadoop等大数据处理框架的Java API 扬子鳄008 Java hadoop java 大数据
Hadoop是一个非常流行的大数据处理框架，主要用于存储和处理大规模数据集。Hadoop主要有两个核心组件：HDFS（HadoopDistributedFileSystem）和MapReduce。此外，还有许多其他组件，如YARN（YetAnotherResourceNegotiator）、HBase、Hive等。下面详细介绍Hadoop及其相关组件的JavaAPI及其使用方法。HadoopHad
手把手教你玩转 Sqoop：从数据库到大数据的「数据搬运工」 AAA建材批发王师傅数据库 sqoop 大数据 hive hdfs
一、Sqoop是什么？——数据界的「超级搬运工」兄弟们，今天咱们聊个大数据圈的「搬运小能手」——Sqoop！可能有人会问：这玩意儿跟Flume啥区别？简单来说：Flume是专门搬日志数据的「快递员」而Sqoop是搬数据库数据的「搬家公司」它的名字咋来的？SQL+Hadoop，直接告诉你核心技能：在关系型数据库（比如MySQL）和Hadoop家族（HDFS、Hive、HBase）之间疯狂倒腾数据！核
【请关注】hBase要用的顺畅的思路 DoWeixin6 数据相关数据库
玩楞一下HBase，要让这玩意儿在大数据量下跑得顺，索引和优化可都是实打实的硬活。先说索引这块。HBase就认RowKey这个主索引，所有数据都按它排得明明白白。平时查数据，只要RowKey设计得好，直接就能定位到对应的Region，速度快得很。但RowKey要是拍脑袋瞎写，比如全按时间戳排序，那准得出大问题——数据全往一个Region挤，妥妥的热点，集群直接卡住。所以设计RowKey时，我一般会
【赵渝强老师】HBase的体系架构赵渝强老师 NoSQL数据库 hbase 架构数据库大数据 hadoop hdfs nosql
HBase是大表（BigTable）思想的一个具体实现。它是一个列式存储的NoSQL数据库，适合执行数据的分析和处理。简单来说，就是适合执行查询操作。从体系架构的角度看，HBase是一种主从架构，包含：HBaseHMaster、RegionServer和ZooKeeper，下图展示了这一架构。其中：HBaseHMaster负责Region的分配及数据库的创建和删除等操作。Regionserver负
大数据学习（141）-分布式数据库 viperrrrrrr 大数据学习分布式 clickhouse hdfs hbase
在分布式数据库中主要有hdfs、hbase、clickhouse三种。HDFS（HadoopDistributedFileSystem）、HBase和ClickHouse都是处理大数据的分布式系统，但它们的设计目标、架构和适用场景有所不同。一、HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生态系统的一部分，是一个高度容错的系统，适合存储大量数据。它被设计为
TiDB 替换 HBase 全场景实践指南 ——从架构革新到业务赋能 TiDB 社区干货传送门 tidb hbase 架构数据库大数据
作者：数据源的TiDB学习之路原文来源：https://tidb.net/blog/c687d474第一章：HBase的历史使命与技术瓶颈1.1HBase的核心价值与经典场景作为Hadoop生态的核心组件，HBase凭借LSM-Tree存储引擎和Region分片机制，在2010年代成为海量数据存储的标杆。其典型场景包括：日志流处理：支持Kafka每日TB级数据持久化，写入吞吐达百万级QPS（如某头
【Ambari3.0.0 部署】Step3—安装JDK17与JDK1.8-适用于el8 TTBIGDATA ambari bigtop hdp hidataplus edp 大数据 el8
如果有其他系统部署需求可以参考原文https://doc.janettr.com/install/manual/Step3—安装JDK17与JDK1.8Ambari3.0及部分Bigtop/Hadoop新组件强制要求JDK17，而HBase/Hive/Spark生态仍有组件长期依赖JDK1.8。因此推荐双版本共存方案，让集群灵活兼容各种大数据组件，满足未来升级和遗留需求。JDK17与JDK1.8可
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在