hive 查看一个表的总文件大小方法

要查看一个hive表文件总大小时,我们可以通过一行脚本快速实现,其命令如下:

 

$ hadoop fs -ls  /user/hive/warehouse/test_table/ds=20151111|awk -F ' ' '{print $5}'|awk '{a+=$1}END{print a}'

32347122009

 

这样可以省去自己相加,下面命令是列出该表的详细文件列表

hadoop fs -ls  /user/hive/warehouse/test_table/ds=20151111

 

方法二:查看该表总容量大小,单位为G

 hadoop fs -du /user/hive/warehouse/test_table|awk ' { SUM += $1 } END { print SUM/(1024*1024*1024) }'

你可能感兴趣的:(hive)