Pyhive连接impala执行sql的问题

背景

使用pyhive连接impala并执行sql语句,发现总是sql执行总是异常。

原因

经过跟踪源代码发现,pyhive执行sql的函数execute(),虽然指定了同步执行,但是同步只适用于执行hive的sql,对于impala来说,并没有起作用,导致实际执行的impala sql为异步的,则会出现异常情况。

方案

可人为判断sql执行情况,实现同步执行。
通过poll()函数,获取TOperationState,有如下几种状态:

    INITIALIZED_STATE = 0
    RUNNING_STATE = 1
    FINISHED_STATE = 2
    CANCELED_STATE = 3
    CLOSED_STATE = 4
    ERROR_STATE = 5
    UKNOWN_STATE = 6
    PENDING_STATE = 7
    TIMEDOUT_STATE = 8

判断为FINISHED_STATE,再往下执行即可。

你可能感兴趣的:(大数据技术)