关于hive中文本存储格式与RCFile格式

之前因为为了完成业务逻辑,所以忽略了很多细节的处理,最近进行了RCFile格式与文本格式的处理。

 

发现采用RCFile格式比之前的文本格式还慢,要598秒,如下图:

 

而之前的格式,这个job运行完成在480秒左右。

目前暂没看出RCFile任何明显的优势。不知道是否是没找到适合的使用场景。

后来在网上看到,RCFile的写速度要慢与文本格式的写速度,说它的读速度高于文本格式,后续将给出测试结果。

你可能感兴趣的:(存储)