forever_ai

Hive中的InputFormat、OutputFormat与SerDe

自定义多行分隔，列分隔

转载：http://www.coder4.com/archives/4031

前言

Hive中，默认使用的是TextInputFormat，一行表示一条记录。在每条记录(一行中)，默认使用^A分割各个字段。

在有些时候，我们往往面对多行，结构化的文档，并需要将其导入Hive处理，此时，就需要自定义InputFormat、OutputFormat，以及SerDe了。

首先来理清这三者之间的关系，我们直接引用Hive官方说法：

SerDe is a short name for “Serializer and Deserializer.”
Hive uses SerDe (and !FileFormat) to read and write table rows.
HDFS files –> InputFileFormat –> –> Deserializer –> Row object
Row object –> Serializer –> –> OutputFileFormat –> HDFS files

总结一下，当面临一个HDFS上的文件时，Hive将如下处理（以读为例）：

(1) 调用InputFormat，将文件切成不同的文档。每篇文档即一行(Row)。
(2) 调用SerDe的Deserializer，将一行(Row)，切分为各个字段。

当HIVE执行INSERT操作，将Row写入文件时，主要调用OutputFormat、SerDe的Seriliazer，顺序与读取相反。

本文将对InputFormat、OutputFormat、SerDe自定义，使Hive能够与自定义的文档格式进行交互：

如上所示，每篇文档用和分割。文档之中的每行，为key=value的格式。

1、自定义InputFormat

Hive的InputFormat来源于Hadoop中的对应的部分。需要注意的是，其采用了mapred的老接口。

 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
           17 
         
           18 
         
           19 
         
           20 
         
           21 
         
           22 
         
           23 
         
           24 
         
          package 
           
          com 
          . 
          coder4 
          . 
          hive 
          ; 
         
          import 
          java 
          . 
          io 
          . 
          IOException 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          io 
          . 
          LongWritable 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          io 
          . 
          Text 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          mapred 
          . 
          TextInputFormat 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          mapred 
          . 
          FileSplit 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          mapred 
          . 
          InputSplit 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          mapred 
          . 
          JobConf 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          mapred 
          . 
          JobConfigurable 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          mapred 
          . 
          RecordReader 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          mapred 
          . 
          Reporter 
          ; 
         
          public 
           
          class 
           
          DocFileInputFormat 
           
          extends 
           
          TextInputFormat 
           
          implements 
         
          JobConfigurable 
           
          { 
         
          @ 
          Override 
         
          public 
           
          RecordReader 
          < 
          LongWritable 
          , 
           
          Text 
          > 
           
          getRecordReader 
          ( 
          InputSplit 
          split 
          , 
         
          JobConf 
          job 
          , 
           
          Reporter 
          reporter 
          ) 
           
          throws 
           
          IOException 
           
          { 
         
          reporter 
          . 
          setStatus 
          ( 
          split 
          . 
          toString 
          ( 
          ) 
          ) 
          ; 
         
          return 
           
          new 
           
          DocRecordReader 
          ( 
          job 
          , 
           
          ( 
          FileSplit 
          ) 
           
          split 
          ) 
          ; 
         
          } 
         
          }

在本文实现中，我们省略了压缩、解压缩等细节，如果需要，可以参考Hadoop官方的实现。

在上述的InputFormat中，只是简单的实现了接口。对文档进行切分的业务逻辑，在DocRecordReader中完成。

 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
           17 
         
           18 
         
           19 
         
           20 
         
           21 
         
           22 
         
           23 
         
           24 
         
           25 
         
           26 
         
           27 
         
           28 
         
           29 
         
           30 
         
           31 
         
           32 
         
           33 
         
           34 
         
           35 
         
           36 
         
           37 
         
           38 
         
           39 
         
           40 
         
           41 
         
           42 
         
           43 
         
           44 
         
           45 
         
           46 
         
           47 
         
           48 
         
           49 
         
           50 
         
           51 
         
           52 
         
           53 
         
           54 
         
           55 
         
           56 
         
           57 
         
           58 
         
           59 
         
           60 
         
           61 
         
           62 
         
           63 
         
           64 
         
           65 
         
           66 
         
           67 
         
           68 
         
           69 
         
           70 
         
           71 
         
           72 
         
           73 
         
           74 
         
           75 
         
           76 
         
           77 
         
           78 
         
           79 
         
           80 
         
           81 
         
           82 
         
           83 
         
           84 
         
           85 
         
           86 
         
           87 
         
           88 
         
           89 
         
           90 
         
           91 
         
          package 
            
          com 
          . 
          coder4 
          . 
          hive 
          ; 
         
          import  
          java 
          . 
          io 
          . 
          IOException 
          ; 
         
          import  
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          io 
          . 
          LongWritable 
          ; 
         
          import  
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          io 
          . 
          Text 
          ; 
         
          import  
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          mapred 
          . 
          FileSplit 
          ; 
         
          import  
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          mapred 
          . 
          JobConf 
          ; 
         
          import  
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          mapred 
          . 
          LineRecordReader 
          ; 
         
          import  
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          mapred 
          . 
          RecordReader 
          ; 
         
          public 
            
          class 
            
          DocRecordReader  
          implements 
            
          RecordReader 
          < 
          LongWritable 
          , 
            
          Text 
          > 
            
          { 
         
          // Reader 
         
          private 
            
          LineRecordReader  
          reader 
          ; 
         
          // The current line_num and lin 
         
          private 
            
          LongWritable  
          lineKey 
            
          = 
            
          null 
          ; 
         
          private 
            
          Text  
          lineValue 
            
          = 
            
          null 
          ; 
         
          // Doc related 
         
          private 
            
          StringBuilder  
          sb 
            
          = 
            
          new 
            
          StringBuilder 
          ( 
          ) 
          ; 
         
          private 
            
          boolean 
            
          inDoc 
            
          = 
            
          false 
          ; 
         
          private 
            
          final 
            
          String 
            
          DOC_START 
            
          = 
            
          "" 
          ; 
         
          private 
            
          final 
            
          String 
            
          DOC_END 
            
          = 
            
          "" 
          ; 
         
          public 
            
          DocRecordReader 
          ( 
          JobConf  
          job 
          , 
            
          FileSplit  
          split 
          ) 
            
          throws 
            
          IOException 
            
          { 
         
          reader 
            
          = 
            
          new 
            
          LineRecordReader 
          ( 
          job 
          , 
            
          split 
          ) 
          ; 
         
          lineKey 
            
          = 
            
          reader 
          . 
          createKey 
          ( 
          ) 
          ; 
         
          lineValue 
            
          = 
            
          reader 
          . 
          createValue 
          ( 
          ) 
          ; 
         
          } 
         
          @ 
          Override 
         
          public 
            
          void 
            
          close 
          ( 
          ) 
            
          throws 
            
          IOException 
            
          { 
         
          reader 
          . 
          close 
          ( 
          ) 
          ; 
         
          } 
         
          @ 
          Override 
         
          public 
            
          boolean 
            
          next 
          ( 
          LongWritable  
          key 
          , 
            
          Text  
          value 
          ) 
            
          throws 
            
          IOException 
            
          { 
         
          while 
            
          ( 
          true 
          ) 
            
          { 
         
          // get current line 
         
          if 
            
          ( 
          ! 
          reader 
          . 
          next 
          ( 
          lineKey 
          , 
            
          lineValue 
          ) 
          ) 
            
          { 
         
          break 
          ; 
         
          } 
         
          if 
            
          ( 
          ! 
          inDoc 
          ) 
            
          { 
         
          // not in doc, check if  
         
          if 
            
          ( 
          lineValue 
          . 
          toString 
          ( 
          ) 
          . 
          startsWith 
          ( 
          DOC_START 
          ) 
          ) 
            
          { 
         
          // reset doc status 
         
          inDoc 
            
          = 
            
          true 
          ; 
         
          // clean buff 
         
          sb 
          . 
          delete 
          ( 
          0 
          , 
            
          sb 
          . 
          length 
          ( 
          ) 
          ) 
          ; 
         
          } 
         
          } 
            
          else 
            
          { 
         
          // indoc, check if  
         
          if 
            
          ( 
          lineValue 
          . 
          toString 
          ( 
          ) 
          . 
          startsWith 
          ( 
          DOC_END 
          ) 
          ) 
            
          { 
         
          // reset doc status 
         
          inDoc 
            
          = 
            
          false 
          ; 
         
          // set kv and return 
         
          key 
          . 
          set 
          ( 
          key 
          . 
          get 
          ( 
          ) 
            
          + 
            
          1 
          ) 
          ; 
         
          value 
          . 
          set 
          ( 
          sb 
          . 
          toString 
          ( 
          ) 
          ) 
          ; 
         
          return 
            
          true 
          ; 
         
          } 
            
          else 
            
          { 
         
          if 
            
          ( 
          sb 
          . 
          length 
          ( 
          ) 
            
          != 
            
          0 
          ) 
            
          { 
         
          sb 
          . 
          append 
          ( 
          "\n" 
          ) 
          ; 
         
          } 
         
          sb 
          . 
          append 
          ( 
          lineValue 
          . 
          toString 
          ( 
          ) 
          ) 
          ; 
         
          } 
         
          } 
         
          } 
         
          return 
            
          false 
          ; 
         
          } 
         
          @ 
          Override 
         
          public 
            
          float 
            
          getProgress 
          ( 
          ) 
            
          throws 
            
          IOException 
            
          { 
         
          return 
            
          reader 
          . 
          getProgress 
          ( 
          ) 
          ; 
         
          } 
         
          @ 
          Override 
         
          public 
            
          LongWritable  
          createKey 
          ( 
          ) 
            
          { 
         
          return 
            
          new 
            
          LongWritable 
          ( 
          0 
          ) 
          ; 
         
          } 
         
          @ 
          Override 
         
          public 
            
          Text  
          createValue 
          ( 
          ) 
            
          { 
         
          return 
            
          new 
            
          Text 
          ( 
          "" 
          ) 
          ; 
         
          } 
         
          @ 
          Override 
         
          public 
            
          long 
            
          getPos 
          ( 
          ) 
            
          throws 
            
          IOException 
            
          { 
         
          return 
            
          reader 
          . 
          getPos 
          ( 
          ) 
          ; 
         
          } 
         
          }

如上的代码中，使用了LineRecordReader，用于读取Split的每一行。为了节省内存，这里对lineValue、lineKey进行了复用。

2、自定义OutputFormat

OutputFormat负责写入，这里要注意的是，不能再照抄Hadoop的对应接口了，需要实现HiveOutputFormat。

 
   
 
     
      
       
           1 
         

           2 
         

           3 
         

           4 
         

           5 
         

           6 
         

           7 
         

           8 
         

           9 
         

           10 
         

           11 
         

           12 
         

           13 
         

           14 
         

           15 
         

           16 
         

           17 
         

           18 
         

           19 
         

           20 
         

           21 
         

           22 
         

           23 
         

           24 
         

           25 
         

           26 
         

           27 
         

           28 
         

           29 
         

           30 
         
 
        
          package 
           
          com 
          . 
          coder4 
          . 
          hive 
          ; 
         

             
         
 
          import 
          java 
          . 
          io 
          . 
          IOException 
          ; 
         
 
          import 
          java 
          . 
          util 
          . 
          Properties 
          ; 
         

             
         
 
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          fs 
          . 
          FSDataOutputStream 
          ; 
         
 
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          fs 
          . 
          FileSystem 
          ; 
         
 
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          fs 
          . 
          Path 
          ; 
         
 
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          hive 
          . 
          ql 
          . 
          exec 
          . 
          FileSinkOperator 
          . 
          RecordWriter 
          ; 
         
 
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          hive 
          . 
          ql 
          . 
          io 
          . 
          HiveOutputFormat 
          ; 
         
 
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          io 
          . 
          Writable 
          ; 
         
 
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          io 
          . 
          WritableComparable 
          ; 
         
 
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          mapred 
          . 
          JobConf 
          ; 
         
 
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          mapred 
          . 
          TextOutputFormat 
          ; 
         
 
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          util 
          . 
          Progressable 
          ; 
         

             
         
 
          @ 
          SuppressWarnings 
          ( 
          { 
           
          "rawtypes" 
           
          } 
          ) 
         
 
          public 
           
          class 
           
          DocFileOutputFormat 
          < 
          K 
           
          extends 
           
          WritableComparable 
          , 
           
          V 
           
          extends 
           
          Writable 
          > 
         
 
                   
          extends 
           
          TextOutputFormat 
          < 
          K 
          , 
           
          V 
          > 
           
          implements 
           
          HiveOutputFormat 
          < 
          K 
          , 
           
          V 
          > 
           
          { 
         

             
         
 
               
          public 
           
          RecordWriter 
          getHiveRecordWriter 
          ( 
          JobConf 
          job 
          , 
           
          Path 
          outPath 
          , 
         
 
                       
          Class 
          < 
          ? 
           
          extends 
           
          Writable 
          > 
           
          valueClass 
          , 
           
          boolean 
           
          isCompressed 
          , 
         
 
                       
          Properties 
          tableProperties 
          , 
           
          Progressable 
          progress 
          ) 
         
 
                       
          throws 
           
          IOException 
           
          { 
         
 
                   
          FileSystem 
          fs 
           
          = 
           
          outPath 
          . 
          getFileSystem 
          ( 
          job 
          ) 
          ; 
         
 
                   
          FSDataOutputStream 
          out 
           
          = 
           
          fs 
          . 
          create 
          ( 
          outPath 
          ) 
          ; 
         

             
         
 
                   
          return 
           
          new 
           
          DocRecordWriter 
          ( 
          out 
          ) 
          ; 
         
 
               
          } 
         
 
          } 
         
 
      
 
     
   

类似的，业务逻辑在如下的RecordWriter中：

 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
           17 
         
           18 
         
           19 
         
           20 
         
           21 
         
           22 
         
           23 
         
           24 
         
           25 
         
           26 
         
           27 
         
           28 
         
           29 
         
           30 
         
           31 
         
           32 
         
           33 
         
           34 
         
           35 
         
           36 
         
           37 
         
           38 
         
           39 
         
          package 
            
          com 
          . 
          coder4 
          . 
          hive 
          ; 
         
          import  
          java 
          . 
          io 
          . 
          IOException 
          ; 
         
          import  
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          fs 
          . 
          FSDataOutputStream 
          ; 
         
          import  
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          hive 
          . 
          ql 
          . 
          exec 
          . 
          FileSinkOperator 
          . 
          RecordWriter 
          ; 
         
          import  
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          io 
          . 
          Writable 
          ; 
         
          public 
            
          class 
            
          DocRecordWriter 
            
          implements 
            
          RecordWriter 
            
          { 
         
          private 
            
          FSDataOutputStream  
          out 
          ; 
         
          private 
            
          final 
            
          String 
            
          DOC_START 
            
          = 
            
          "" 
          ; 
         
          private 
            
          final 
            
          String 
            
          DOC_END 
            
          = 
            
          "" 
          ; 
         
          public 
            
          DocRecordWriter 
          ( 
          FSDataOutputStream 
            
          o 
          ) 
            
          { 
         
          this 
          . 
          out 
            
          = 
            
          o 
          ; 
         
          } 
         
          @ 
          Override 
         
          public 
            
          void 
            
          close 
          ( 
          boolean 
            
          abort 
          ) 
            
          throws 
            
          IOException 
            
          { 
         
          out 
          . 
          flush 
          ( 
          ) 
          ; 
         
          out 
          . 
          close 
          ( 
          ) 
          ; 
         
          } 
         
          @ 
          Override 
         
          public 
            
          void 
            
          write 
          ( 
          Writable  
          wr 
          ) 
            
          throws 
            
          IOException 
            
          { 
         
          write 
          ( 
          DOC_START 
          ) 
          ; 
         
          write 
          ( 
          "\n" 
          ) 
          ; 
         
          write 
          ( 
          wr 
          . 
          toString 
          ( 
          ) 
          ) 
          ; 
         
          write 
          ( 
          "\n" 
          ) 
          ; 
         
          write 
          ( 
          DOC_END 
          ) 
          ; 
         
          write 
          ( 
          "\n" 
          ) 
          ; 
         
          } 
         
          private 
            
          void 
            
          write 
          ( 
          String 
            
          str 
          ) 
            
          throws 
            
          IOException 
            
          { 
         
          out 
          . 
          write 
          ( 
          str 
          . 
          getBytes 
          ( 
          ) 
          , 
            
          0 
          , 
            
          str 
          . 
          length 
          ( 
          ) 
          ) 
          ; 
         
          } 
         
          }

3、自定义SerDe or UDF？

在自定义InputFormat、OutputFomat后，我们已经将Split拆分为了多个Row（文档）。

接下来，我们需要将Row拆分为Field。此时，我们有两个技术选择：

(1) 写一个UDF，将Row拆分为kv对，以Map返回。此时，Table中只需定义一个STRING类型变量即可。
(2) 实现SerDe，将Row直接转化为Table对应的字段。

先来看一下UDF的这种方法，在Json解析等字段名不确定(或要经常变更) 的应用场景下，这种方法还是比较适用的。

 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
          package 
           
          com 
          . 
          coder4 
          . 
          hive 
          ; 
         
          import 
          java 
          . 
          util 
          . 
          Map 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          hive 
          . 
          ql 
          . 
          exec 
          . 
          UDF 
          ; 
         
          public 
           
          class 
           
          DocToMap 
           
          extends 
           
          UDF 
           
          { 
         
          public 
           
          Map 
          < 
          String 
          , 
           
          String 
          > 
           
          evaluate 
          ( 
          String 
           
          s 
          ) 
           
          { 
         
          return 
           
          Doc 
          . 
          deserialize 
          ( 
          s 
          ) 
          ; 
         
          } 
         
          }

其中Doc的deserilize只是自定义方法，无需重载方法或继承接口。

使用时的方法为：

 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
           17 
         
           18 
         
           19 
         
           20 
         
           21 
         
           22 
         
           23 
         
           24 
         
          CREATE  
          EXTERNAL  
          TABLE  
          IF 
            
          NOT 
            
          EXISTS  
          test_table 
         
          ( 
         
          doc  
          STRING 
         
          ) 
         
          STORED  
          AS 
         
          INPUTFORMAT 
            
          'com.coder4.hive.DocFileInputFormat' 
         
          OUTPUTFORMAT 
            
          'com.coder4.hive.DocFileOutputFormat' 
         
          LOCATION 
            
          '/user/heyuan.lhy/doc/' 
         
          ; 
         
          add  
          jar 
            
          / 
          xxxxxxxx 
          / 
          hive 
          - 
          test 
          . 
          jar 
          ; 
         
          CREATE  
          TEMPORARY  
          FUNCTION 
            
          doc_to_map  
          AS 
            
          'com.coder4.hive.DocToMap' 
          ; 
         
          SELECT 
         
          raw 
          [ 
          'id' 
          ] 
          , 
         
          raw 
          [ 
          'name' 
          ] 
         
          FROM 
         
          ( 
         
          SELECT  
         
          doc_to_map 
          ( 
          doc 
          ) 
            
          raw 
         
          FROM 
         
          test 
          _table 
         
          ) 
            
          t 
          ;

4、自定义SerDe

如果选择自定义SerDe，实现起来要略微麻烦一点。

这里主要参考了一篇Blog，和官方的源代码

http://svn.apache.org/repos/asf/hive/trunk/serde/src/java/org/apache/hadoop/hive/serde2/avro/AvroSerDe.java

http://blog.cloudera.com/blog/2012/12/how-to-use-a-serde-in-apache-hive/

 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
           17 
         
           18 
         
           19 
         
           20 
         
           21 
         
           22 
         
           23 
         
           24 
         
           25 
         
           26 
         
           27 
         
           28 
         
           29 
         
           30 
         
           31 
         
           32 
         
           33 
         
           34 
         
           35 
         
           36 
         
           37 
         
           38 
         
           39 
         
           40 
         
           41 
         
           42 
         
           43 
         
           44 
         
           45 
         
           46 
         
           47 
         
           48 
         
           49 
         
           50 
         
           51 
         
           52 
         
           53 
         
           54 
         
           55 
         
           56 
         
           57 
         
           58 
         
           59 
         
           60 
         
           61 
         
           62 
         
           63 
         
           64 
         
           65 
         
           66 
         
           67 
         
           68 
         
           69 
         
           70 
         
           71 
         
           72 
         
           73 
         
           74 
         
           75 
         
           76 
         
           77 
         
           78 
         
           79 
         
           80 
         
           81 
         
           82 
         
           83 
         
           84 
         
           85 
         
           86 
         
           87 
         
           88 
         
           89 
         
           90 
         
           91 
         
           92 
         
           93 
         
           94 
         
           95 
         
           96 
         
           97 
         
           98 
         
           99 
         
           100 
         
           101 
         
           102 
         
           103 
         
           104 
         
           105 
         
           106 
         
           107 
         
           108 
         
           109 
         
           110 
         
           111 
         
           112 
         
           113 
         
           114 
         
           115 
         
           116 
         
           117 
         
           118 
         
           119 
         
           120 
         
           121 
         
           122 
         
           123 
         
           124 
         
           125 
         
           126 
         
           127 
         
           128 
         
           129 
         
           130 
         
           131 
         
           132 
         
           133 
         
           134 
         
           135 
         
           136 
         
           137 
         
           138 
         
           139 
         
           140 
         
           141 
         
           142 
         
           143 
         
           144 
         
           145 
         
           146 
         
           147 
         
          package 
           
          com 
          . 
          coder4 
          . 
          hive 
          ; 
         
          import 
          java 
          . 
          util 
          . 
          ArrayList 
          ; 
         
          import 
          java 
          . 
          util 
          . 
          Arrays 
          ; 
         
          import 
          java 
          . 
          util 
          . 
          HashMap 
          ; 
         
          import 
          java 
          . 
          util 
          . 
          List 
          ; 
         
          import 
          java 
          . 
          util 
          . 
          Map 
          ; 
         
          import 
          java 
          . 
          util 
          . 
          Properties 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          commons 
          . 
          lang 
          . 
          StringUtils 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          conf 
          . 
          Configuration 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          hive 
          . 
          serde 
          . 
          Constants 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          hive 
          . 
          serde2 
          . 
          AbstractSerDe 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          hive 
          . 
          serde2 
          . 
          SerDeException 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          hive 
          . 
          serde2 
          . 
          SerDeStats 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          hive 
          . 
          serde2 
          . 
          objectinspector 
          . 
          ObjectInspector 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          hive 
          . 
          serde2 
          . 
          objectinspector 
          . 
          ObjectInspectorFactory 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          hive 
          . 
          serde2 
          . 
          typeinfo 
          . 
          PrimitiveTypeInfo 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          hive 
          . 
          serde2 
          . 
          typeinfo 
          . 
          TypeInfo 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          hive 
          . 
          serde2 
          . 
          typeinfo 
          . 
          TypeInfoUtils 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          io 
          . 
          Text 
          ; 
         
          import 
          org 
          . 
          apache 
          . 
          hadoop 
          . 
          io 
          . 
          Writable 
          ; 
         
          public 
           
          class 
           
          MySerDe 
           
          extends 
           
          AbstractSerDe 
           
          { 
         
          // params 
         
          private 
           
          List 
          < 
          String 
          > 
           
          columnNames 
           
          = 
           
          null 
          ; 
         
          private 
           
          List 
          < 
          TypeInfo 
          > 
           
          columnTypes 
           
          = 
           
          null 
          ; 
         
          private 
           
          ObjectInspector 
          objectInspector 
           
          = 
           
          null 
          ; 
         
          // seperator 
         
          private 
           
          String 
           
          nullString 
           
          = 
           
          null 
          ; 
         
          private 
           
          String 
           
          lineSep 
           
          = 
           
          null 
          ; 
         
          private 
           
          String 
           
          kvSep 
           
          = 
           
          null 
          ; 
         
          @ 
          Override 
         
          public 
           
          void 
           
          initialize 
          ( 
          Configuration 
          conf 
          , 
           
          Properties 
          tbl 
          ) 
         
          throws 
           
          SerDeException 
           
          { 
         
          // Read sep 
         
          lineSep 
           
          = 
           
          "\n" 
          ; 
         
          kvSep 
           
          = 
           
          "=" 
          ; 
         
          nullString 
           
          = 
           
          tbl 
          . 
          getProperty 
          ( 
          Constants 
          . 
          SERIALIZATION_NULL_FORMAT 
          , 
           
          "" 
          ) 
          ; 
         
          // Read Column Names 
         
          String 
           
          columnNameProp 
           
          = 
           
          tbl 
          . 
          getProperty 
          ( 
          Constants 
          . 
          LIST_COLUMNS 
          ) 
          ; 
         
          if 
           
          ( 
          columnNameProp 
           
          != 
           
          null 
           
          && 
           
          columnNameProp 
          . 
          length 
          ( 
          ) 
           
          > 
           
          0 
          ) 
           
          { 
         
          columnNames 
           
          = 
           
          Arrays 
          . 
          asList 
          ( 
          columnNameProp 
          . 
          split 
          ( 
          "," 
          ) 
          ) 
          ; 
         
          } 
           
          else 
           
          { 
         
          columnNames 
           
          = 
           
          new 
           
          ArrayList 
          < 
          String 
          > 
          ( 
          ) 
          ; 
         
          } 
         
          // Read Column Types 
         
          String 
           
          columnTypeProp 
           
          = 
           
          tbl 
          . 
          getProperty 
          ( 
          Constants 
          . 
          LIST_COLUMN_TYPES 
          ) 
          ; 
         
          // default all string 
         
          if 
           
          ( 
          columnTypeProp 
           
          == 
           
          null 
          ) 
           
          { 
         
          String 
          [ 
          ] 
           
          types 
           
          = 
           
          new 
           
          String 
          [ 
          columnNames 
          . 
          size 
          ( 
          ) 
          ] 
          ; 
         
          Arrays 
          . 
          fill 
          ( 
          types 
          , 
           
          0 
          , 
           
          types 
          . 
          length 
          , 
           
          Constants 
          . 
          STRING_TYPE_NAME 
          ) 
          ; 
         
          columnTypeProp 
           
          = 
           
          StringUtils 
          . 
          join 
          ( 
          types 
          , 
           
          ":" 
          ) 
          ; 
         
          } 
         
          columnTypes 
           
          = 
           
          TypeInfoUtils 
          . 
          getTypeInfosFromTypeString 
          ( 
          columnTypeProp 
          ) 
          ; 
         
          // Check column and types equals 
         
          if 
           
          ( 
          columnTypes 
          . 
          size 
          ( 
          ) 
           
          != 
           
          columnNames 
          . 
          size 
          ( 
          ) 
          ) 
           
          { 
         
          throw 
           
          new 
           
          SerDeException 
          ( 
          "len(columnNames) != len(columntTypes)" 
          ) 
          ; 
         
          } 
         
          // Create ObjectInspectors from the type information for each column 
         
          List 
          < 
          ObjectInspector 
          > 
           
          columnOIs 
           
          = 
           
          new 
           
          ArrayList 
          < 
          ObjectInspector 
          > 
          ( 
          ) 
          ; 
         
          ObjectInspector 
          oi 
          ; 
         
          for 
           
          ( 
          int 
           
          c 
           
          = 
           
          0 
          ; 
           
          c 
           
          < 
           
          columnNames 
          . 
          size 
          ( 
          ) 
          ; 
           
          c 
          ++ 
          ) 
           
          { 
         
          oi 
           
          = 
           
          TypeInfoUtils 
         
          . 
          getStandardJavaObjectInspectorFromTypeInfo 
          ( 
          columnTypes 
         
          . 
          get 
          ( 
          c 
          ) 
          ) 
          ; 
         
          columnOIs 
          . 
          add 
          ( 
          oi 
          ) 
          ; 
         
          } 
         
          objectInspector 
           
          = 
           
          ObjectInspectorFactory 
         
          . 
          getStandardStructObjectInspector 
          ( 
          columnNames 
          , 
           
          columnOIs 
          ) 
          ; 
         
          } 
         
          @ 
          Override 
         
          public 
           
          Object 
           
          deserialize 
          ( 
          Writable 
          wr 
          ) 
           
          throws 
           
          SerDeException 
           
          { 
         
          // Split to kv pair 
         
          if 
           
          ( 
          wr 
           
          == 
           
          null 
          ) 
         
          return 
           
          null 
          ; 
         
          Map 
          < 
          String 
          , 
           
          String 
          > 
           
          kvMap 
           
          = 
           
          new 
           
          HashMap 
          < 
          String 
          , 
           
          String 
          > 
          ( 
          ) 
          ; 
         
          Text 
          text 
           
          = 
           
          ( 
          Text 
          ) 
           
          wr 
          ; 
         
          for 
           
          ( 
          String 
           
          kv 
           
          : 
           
          text 
          . 
          toString 
          ( 
          ) 
          . 
          split 
          ( 
          lineSep 
          ) 
          ) 
           
          { 
         
          String 
          [ 
          ] 
           
          pair 
           
          = 
           
          kv 
          . 
          split 
          ( 
          kvSep 
          ) 
          ; 
         
          if 
           
          ( 
          pair 
          . 
          length 
           
          == 
           
          2 
          ) 
           
          { 
         
          kvMap 
          . 
          put 
          ( 
          pair 
          [ 
          0 
          ] 
          , 
           
          pair 
          [ 
          1 
          ] 
          ) 
          ; 
         
          } 
         
          } 
         
          // Set according to col_names and col_types 
         
          ArrayList 
          < 
          Object 
          > 
           
          row 
           
          = 
           
          new 
           
          ArrayList 
          < 
          Object 
          > 
          ( 
          ) 
          ; 
         
          String 
           
          colName 
           
          = 
           
          null 
          ; 
         
          TypeInfo 
          type_info 
           
          = 
           
          null 
          ; 
         
          Object 
           
          obj 
           
          = 
           
          null 
          ; 
         
          for 
           
          ( 
          int 
           
          i 
           
          = 
           
          0 
          ; 
           
          i 
           
          < 
           
          columnNames 
          . 
          size 
          ( 
          ) 
          ; 
           
          i 
          ++ 
          ) 
           
          {

C++11中的std::function
文章转载自：http://www.jellythink.com/archives/771看看这段代码先来看看下面这两行代码：std::functiononKeyPressed;std::functiononKeyReleased;这两行代码是从Cocos2d-x中摘出来的，重点是这两行代码的定义啊。std::function这是什么东西？如果你对上述两行代码表示毫无压力，那就不妨再看看本文，就当温
ETL可视化工具 DataX -- 简介( 一) dazhong2012 软件工具数据仓库 datax ETL
引言DataX系列文章：ETL可视化工具DataX–安装部署(二)ETL可视化工具DataX–DataX-Web安装(三)1.1DataX1.1.1DataX概览DataX是阿里云DataWorks数据集成的开源版本，在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、
AWS 管理秘籍（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/cf1c4e1db999839ba88fc56df4011156译者：飞龙协议：CCBY-NC-SA4.0序言AWS平台的增长速度非常快，正在被各行各业广泛采用。正如俗话所说，朋友不会让朋友建立数据中心。不管从哪个角度看，按需计算、网络和存储的模式将持续存在。尤其是当你看到AWS平台在功能和增强方面的更新速度时，很难再去反对站在巨人的肩膀上，尤其是
AWS Terraform 架构指南（二）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/8b2d222956a050c7632b9eee086dadcf译者：飞龙协议：CCBY-NC-SA4.0第七章：7在项目中实现Terraform您准备好开始使用Terraform开发您的AWS基础设施了吗？在本章中，您将学习Terraform的基础知识，并了解如何在AWS中部署您的第一个模板。我们将介绍选择合适的AWS提供商和选择满足您项目需求的
Hive简介
文章目录Hive简介Hive特点Hive和RDBMS的对比Hive的架构Hive的数据组织Hive数据类型Hive简介1、Hive由Facebook实现并开源2、是基于Hadoop的一个数据仓库工具3、可以将结构化的数据映射为一张数据库表4、并提供HQL(HiveSQL)查询功能5、底层数据是存储在HDFS上6、Hive的本质是将SQL语句转换为MapReduce任务运行7、使不熟悉MapRedu
精益敏捷之道（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/0b2addbef6e2afb0ce49d44d7300959a译者：飞龙协议：CCBY-NC-SA4.0前言“精益敏捷之道：通过价值流管理释放企业潜力”一书源于首席作者塞西尔·‘加里’·鲁普与尊敬的同事理查德·克纳斯特、史蒂夫·佩雷拉和艾尔·沙洛韦的合作努力。他们的目标是为IT专家、商业专业人士以及各行业和组织的领域专家提供一本关于现代精益敏捷和
Python DevOps 实用指南（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/0228db3442938136abc9262d5596d201译者：飞龙协议：CCBY-NC-SA4.0序言欢迎阅读本书！让我们来谈谈本书的内容以及你将从中学到的东西。本书涉及两件事：DevOps和Python。它讲述了这两者是如何相互作用的——无论你称它们为实体、哲学、框架，或者其他任何名称。本书将帮助你在技术层面上理解Python，同时也在概
Python 取证学习指南第二版（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/46c71d4b3d6fceaba506eebc55284aa5译者：飞龙协议：CCBY-NC-SA4.0前言在编写《学习Python取证》一书时，我们有一个目标：以一种方式教授Python在取证中的应用，使得没有编程经验的读者可以立即跟随并开发出可以用于案件工作中的实用代码。但这并不意味着本书仅适合Python新手；在整个过程中，我们会逐步让读者
Python 取证学习指南第二版（三）
原文：annas-archive.org/md5/46c71d4b3d6fceaba506eebc55284aa5译者：飞龙协议：CCBY-NC-SA4.0第七章：模糊哈希哈希是DFIR中最常见的处理过程之一。这个过程允许我们总结文件内容，并分配一个代表文件内容的独特且可重复的签名。我们通常使用MD5、SHA1和SHA256等算法对文件和内容进行哈希。这些哈希算法非常有价值，因为我们可以用它们进行
低版本hive(1.2.1)UDF实现清除历史分区数据 ༺水墨石༻ hive hive UDF hive hadoop 数据仓库
目标：通过UDF实现对表历史数据清除入参：表名、保留天数N一、pom文件4.0.0com.examplehive-udf-example1.0-SNAPSHOTjarhive-udf-exampleHiveUDFfordeletingpartitionsbydateUTF-81.81.8org.apache.hivehive-exec1.2.1org.apache.hivehive-metasto
shell脚本实现Hive库表迁移 docsz hive Linux shell
1、获取hive所有库的建表语句#获取hive所有库的建表语句#!/bin/bashmkdir-p~/hive/tables/tablesDDL#获取库名hive-e"showdatabases;">~/hive/databases.txtsed-i'1,3d'~/hive/databases.txtsed-i'$d'~/hive/databases.txtcat~/hive/databases.
HIVE（二） 2301_78012738 hive 数据仓库
目录访问HIVE的三种方式DDLDML数据操作向表中装载数据数据导出常用函数Like和RLike分组Join排序分区表和分桶表访问HIVE的三种方式启动Hive命令，CtrlC退出客户端，执行测试语句，与sql一致[wyc@hadoop102hive]$bin/hive经验小结：在hive中执行语句报错：ExecutionError,returncode2fromorg.apache.hadoop
debian 安装 mysql5.7 你会忘记吃饭吗 debian 运维
cd/usr/local/src:wgethttps://downloads.mysql.com/archives/get/p/23/file/mysql-server_5.7.29-1debian10_amd64.deb-bundle.tartar-xvfxx.tarcdxx:执行dpkg-imysql-community-client_5.7.29-1debian10_amd64.deb返回S
HTB academy -- Linux Privilege Escalation --Service-based Privilege Escalation 网络安全小吗喽 linux 服务器网络安全测试工具
VulnerableServices#!/bin/bash#screenroot.sh#setuidscreenv4.5.0localrootexploit#abusesld.so.preloadoverwritingtogetroot.#bug:https://lists.gnu.org/archive/html/screen-devel/2017-01/msg00025.html#HACKTH
Python 强化学习算法实用指南（三）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/e3819a6747796b03b9288831f4e2b00c译者：飞龙协议：CCBY-NC-SA4.0第十一章：理解黑盒优化算法在前几章中，我们研究了强化学习（RL）算法，从基于价值的方法到基于策略的方法，以及从无模型方法到基于模型的方法。在本章中，我们将提供另一种解决序列任务的方法，那就是使用一类黑盒算法——进化算法（EA）。EAs由进化机制
Python 强化学习算法实用指南（二）
原文：annas-archive.org/md5/e3819a6747796b03b9288831f4e2b00c译者：飞龙协议：CCBY-NC-SA4.0第六章：学习随机优化与PG优化到目前为止，我们已经探讨并开发了基于价值的强化学习算法。这些算法通过学习一个价值函数来找到一个好的策略。尽管它们表现良好，但它们的应用受限于一些内在的限制。在本章中，我们将介绍一类新的算法——策略梯度方法，它们通过
ftp文件服务器有连接数限制,查看ftp服务器连接数命令赵承铭 ftp文件服务器有连接数限制
查看ftp服务器连接数命令内容精选换一换本章节适用于MRS3.x之前版本。Loader支持以下多种连接，每种连接的配置介绍可根据本章节内容了解。obs-connectorgeneric-jdbc-connectorftp-connector或sftp-connectorhbase-connector、hdfs-connector或hive-connectorOBS连接是Loa“数据导入”章节适用于
android nodejs cike110120
本文参照了http://www.blogjava.net/jelver/articles/143082.html，http://www.blogjava.net/athrunwang/archive/2011/09/28/359680.html，《androidSDK开发范例大全(第2版)》上次做了一个demo，试验如何用node.js响应getpost请求，http请求使用的浏览器。我现在正在学
CYW43: 无线网络开发套件指南阮曦薇Joe
CYW43:无线网络开发套件指南cyw43ARCHIVED--movedintothemainEmbassyrepoathttps://github.com/embassy-rs/embassy项目地址:https://gitcode.com/gh_mirrors/cy/cyw43项目介绍CYW43是一个基于Rust的开源项目，专门用于驱动CypressCYW43xx系列WiFi和蓝牙芯片。它提供
spring-data-jpa+spring+hibernate+druid配置
参考链接：http://doc.okbase.net/liuyitian/archive/109276.htmlhttp://my.oschina.net/u/1859292/blog/312188最新公司的web项目需要用到spring-data-jpa作为JPA的实现框架，同时使用阿里巴巴的开源数据库连接池druid。关于这两种框架的介绍我在这里就不多赘述。直接进入配置页面：spring的配置
Hive 事务表(ACID)问题梳理
文章目录问题描述分析原因什么是事务表概念事务表和普通内部表的区别相关配置事务表的适用场景注意事项设计原理与实现文件管理格式参考博客问题描述工作中需要使用pyspark读取Hive中的数据，但是发现可以获取metastore，外部表的数据可以读取，内部表数据有些表报错信息是：AnalysisException:org.apache.hadoop.hive.ql.metadata.HiveExcept
Hive适用语法 `whyYa hive hadoop 数据仓库
一、日期处理函数总结1.trunc()–取日期中当月第一天trunc(‘2022-12-05’,‘MM’)--取当月第一天2022-12-01trunc(‘2022-12-05’,‘Q’)--季度中的第一天2022-10-01trunc(‘2022-12-03’,‘YEAR’)–取当年第一天20222.last_day()–取当月最后一天last_day(‘2022-12-03’)3.month(
debian安装docker Sahas1019 debian docker eureka
debian安装docker/dev/null对于Debian11(bullseye)或更新版本：echo\"deb[arch=$(dpkg--print-architecture)signed-by=/usr/share/keyrings/docker-archive-keyring.gpg]https://download.docker.com/linux/debian\$(lsb_relea
Ubuntu22.04安装cudnn详细步骤大鹏的NLP博客深度学习 cudnn
下载指定版本的cudnnhttps://developer.nvidia.com/rdp/cudnn-archive#a-collapse804-111安装sudodpkg-icudnn-local-repo-ubuntu2204-8.9.7.29_1.0-1_amd64.deb根据上步提示：sudocp/var/cudnn-local-repo-ubuntu2204-8.9.7.29/cudnn
Docker安装部署MySQL+Canal+Kafka+Camus+HIVE数据实时同步是小南啊_- Java java centos docker kafka hadoop
因为公司业务需求要将mysql的数据实时同步到hive中，在网上找到一套可用的方案，即MySQL+Canal+Kafka+Camus+HIVE的数据流通方式，因为是首次搭建，所以暂时使用伪分布式的搭建方案。一、安装docker安装docker的教程网上一搜一大把,请参考：centos下docker安装教程二、docker安装MySQL安装教程网上也有很多，请参考:docker安装MySQL1.开启
assembly : maven assembly打包报错：maven to create assembly : unable to obtain archiver for extension 九师兄工具-maven
原因是没有添加org.apache.maven.plugins<artifactId
使用Java实现MP3音乐播放器
原文链接：http://www.cnblogs.com/haoxia/archive/2009/06/03/1495419.html使用Java实现MP3音乐播放器JavaSound是一个小巧的低层API，支持数字音频和MIDI数据的记录/回放。在JDK1.3.0之前，JavaSound是一个标准的Java扩展API，但从Java2的1.3.0版开始，JavaSound就被包含到JDK之中。由于J
零基础 Qt 6 在线安装教程程序员乐逍遥 Qt框架 MFC框架高级编程 qt 开发语言 qt6 C++安装
1.首先给你们Qt5.14.2的安装地址,有需要的可以安装Indexof/archive/qt/5.14/5.14.22.首先下载Qt6的在线安装包https://d13lb3tujbc8s0.cloudfront.net/onlineinstallers/qt-online-installer-windows-x64-4.10.0.exe3.安装运行程序
Docker快速构建Hive测试环境静谧星光 docker hive 容器编程
Docker是一种流行的容器化平台，可以帮助我们快速构建和管理应用程序的环境。在本文中，我们将学习如何使用Docker快速构建Hive测试环境。Hive是一个基于Hadoop的数据仓库基础设施，它提供了一种类似于SQL的查询语言，用于分析和处理大规模数据集。步骤1：安装Docker和DockerCompose首先，我们需要安装Docker和DockerCompose。您可以根据您的操作系统类型，从
Docker快速部署Hive服务长路 ㅤ 运维 Docker配置 Hive环境大数据远程调试
文章目录前言Docker快速配置hive环境资料获取前言博主介绍：✌目前全网粉丝4W+，csdn博客专家、Java领域优质创作者，博客之星、阿里云平台优质作者、专注于Java后端技术领域。涵盖技术内容：Java后端、大数据、算法、分布式微服务、中间件、前端、运维等。博主所有博客文件目录索引：博客目录索引(持续更新)CSDN搜索：长路视频平台：b站-Coder长路Docker快速配置hive环境Ap
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL

Hive中的InputFormat、OutputFormat与SerDe

前言

1、自定义InputFormat

2、自定义OutputFormat

3、自定义SerDe or UDF？

4、自定义SerDe

你可能感兴趣的:(hive)