impala条件查询问题

  使用impala查询hbase时,如果是“=”条件查询,如果不添加is not null条件,则会把该列没有值的记录也查询出来(空字符串不会),比如:

   Select * from user where name=’xiao wang’,该语句会查询出name等于xiao wangnull的数据。

   Select * from user where name=’xiao wang’ and name is not null 则不会查询出namenull的记录

 

  在hbase中通过SingleColumnValueFilter过滤器实现“=”条件时如果不设置filterIfMissing也会有如此效果,当设置setFilterIfMissing(true);后会过滤掉null的记录,比如:

    SingleColumnValueFilter filter = new SingleColumnValueFilter("fml".getBytes(), "name".getBytes(),        CompareOp.EQUAL, "xiao wang".getBytes());

   filter.setFilterIfMissing(true);//默认值为false,需设置为true

 

 

  但是impala似乎不是采用的hbase的过滤器实现的条件查询,看impala的架构介绍应该是内存比较,从现象看匪夷所思,具体原因还需后续调查,先记录在案。

你可能感兴趣的:(impala,大数据,hbase)