hive开发遇到的问题

问题1:问下,hive 数据通过discp 拷贝后 ,数据为啥查不出来,新的集群在拷贝前已创建新库(是分区表)
解决方法:修复下分区就好了
msck repair table table_name

问题2:hive insert into 插入数据后表中原来的数据丢失了
是否在表名加了这种`号
如果是建议你使用以下这种方式处理转义字符,可以正常insert into
DatabaseName.TableName
例如,insert into
db.tableAselect t.a, t.b from tableB t
问题原因:使用
DatabaseName.TableName`时语法解析为OVERWRITE,该问题为apache社区问题。在当前版本的hive中还未修复

使用分区时,注意点
当使用 count(distinct col)而同时col是分区列时,存在结果为0的bug
因此在设计表结果时需要考虑到分区字段是否会被count

你可能感兴趣的:(hive)