基于Cloudera Manager5配置HIVE压缩

[Author]: kwu

基于Cloudera Manager5配置HIVE压缩,配置HIVE的压缩,实际就是配置MapReduce的压缩,包括运行结果及中间结果的压缩。

1、基于HIVE命令行的配置

set hive.enforce.bucketing=true;
set hive.exec.compress.output=true;
set mapred.output.compress=true;
set mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;
set io.compression.codecs=org.apache.hadoop.io.compress.GzipCodec;

在hive的命令下行运行如上代码即可,这里用的是Gzip压缩。


2、基于xml文件的压缩配置

mapred-site.xml


  mapred.output.compress
  true
  Should the job outputs be compressed?
  


  mapred.output.compression.codec
  org.apache.hadoop.io.compress.GzipCodec
  If the job outputs are compressed, how should they be compressed?
  

hive-site.xml


  hive.enforce.bucketing
  true


  hive.exec.compress.output
  true


  io.compression.codecs
  org.apache.hadoop.io.compress.GzipCodec

3、 基于Cloudera Manager5配置HIVE压缩

1) 基于yarn的MR配置

基于Cloudera Manager5配置HIVE压缩_第1张图片


2) hive的配置

基于Cloudera Manager5配置HIVE压缩_第2张图片

增加如下内容


  hive.enforce.bucketing
  true


  hive.exec.compress.output
  true


  io.compression.codecs
  org.apache.hadoop.io.compress.GzipCodec

配置完毕,MapReduce包括hive运行结果以GZip进行压缩。


你可能感兴趣的:(基于Cloudera Manager5配置HIVE压缩)