HIVE出现“ java.lang.UnsupportedOperationException”的解决办法

在HIVE中执行如下语句:

select * from test where concat(year, month, day, hour) = '2020032412' limit 5;

提示如下错误:

Failed with exception java.io.IOException:org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.UnsupportedOperationException: Cannot inspect org.apache.hadoop.hive.serde2.io.DoubleWritable

查看“test”表结构,发现是parquet存储格式,难道parquet不支持double?自己都要被自己的结论给惊呆了,查阅官方文档,果然不存在这么惊人的结论!

在网上搜索一番,也没发现有用的结论,于是切换到spark-sql客户端,依旧出错,但错误信息更多。

Caused by: java.lang.UnsupportedOperationException: Cannot inspect org.apache.hadoop.hive.serde2.io.DoubleWritable
        at org.apache.hadoop.hive.ql.io.parquet.serde.primitive.ParquetStringInspector.getPrimitiveJavaObject(ParquetStringInspector.java:77)

但依旧没什么鸟用,突然想起,是不是类型转换错误,于是对比parquet写入的类声明与表声明,发现如下差异:

类声明 表声明
Double string

于是执行修改表语句:

alter table test change `value` `value` double;

提示无法将“StringType”改为“DoubleType”,无奈之下,只好删除重建,问题解决。

其他

在这个表创建后,我执行了大量的“group by”语句,一直工作非常良好,但偶然需要获取样本数据时,才发现问题,所以测试数据的质量时,别忘了试试“select * from”语句,能检验字段的合法性。

你可能感兴趣的:(大数据,Spark)