Same query, different results --Tez,MR

问题描述:通过MR、Tez运行同一个SQL,发现获得的结果不一致,MR有数据,而Tez没数据
原因:tez内部的优化,默认批处理,导致没数据

解决方案:https://issues.apache.org/jira/browse/HIVE-13330 

Ps:
SET hive.vectorized.execution.enabled=false;

 SET hive.optimize.index.filter=true;

 

spark ,tez查询都有数据,mr查询没数据

1、show create table xxxx;找出表的位置

2、hadoop fs -ls 查看表存储数据的文件是否有 HIVE_UNION_SUBDIR_X这类型的目录存在

解决方案:

set hive.mapred.supports.subdirectories=true;

set mapreduce.input.fileinputformat.input.dir.recursive=true;

 

 

 

你可能感兴趣的:(hadoop)