Doris_Doris导入常见问题

Doris数据导入错误 :the length of input is too larger than schema

可能原因:varchar长度设置过短

Doris_Doris导入常见问题_第1张图片

Doris表字段乱序

导入palo表中的csv本身无schema信息,csv与palo表字段顺序必须一致,否则会错乱

Doris数据文件中字段比表字段多 :actual column number is more than schema column number.actual number

可能原因:字符串等存在特殊字符,与分隔符重复

解决方法 :palo导入前替换制表符等特殊字符

检测方法 :利用sublime搜索制表符

Reason: actual column number is more than schema column number.actual number: 40, column separator: [	], line delimiter: [
], schema number: 39; . src line [20230821	2023-08-21	all	12746105196	8.21	五期破风生鲜99-19	all	all	1985001	盛亚福源牛肉店	20157304372	上脑肉4斤清真黄牛肉牛外脊可以做烤肉、炒菜、牛排	all	新	13	13	247.0	1547.0	1794.0	119.0	9.9	9.9	147.9	572.9	9.9	9.9	147.9	572.9	1	1	2	5	1	1	2	4	0.07692307692307693	0.07692307692307693	0.15384615384615385	0.3076923076923077]; 
Reason: actual column number is more than schema column number.actual number: 40, column separator: [	], line delimiter: [
], schema number: 39; . src line [20230821	2023-08-21	all	all	8.21	五期破风生鲜99-19	生鲜	水产肉类/新鲜蔬果/熟食	1985001	盛亚福源牛肉店	20157304372	all	短小融合	老	8	8	152.0	952.0	1104.0	119.0	239.8	239.8	274.70000000000005	629.2	307.8	307.8	374.70000000000005	794.2	3	3	4	9	3	3	3	5	0.375	0.375	0.375	0.625]; 
Reason: actual column number is more than schema column number.actual number: 40, column separator: [	], line delimiter: [
], schema number: 39; . src line [20230821	2023-08-21	all	all	8.21	五期破风生鲜99-19	all	all	42172036	柒天商贸经销部	all	【30-40活虾速冻】巨无霸规格新鲜食用海捕3斤15-18包邮	all	新	13	13	247.0	1040.0	1287.0	80.0	0.0	197.0	197.0	266.9	0.0	207.0	207.0	276.9	0	2	2	3	0	1	1	2	0.0	0.07692307692307693	0.07692307692307693	0.15384615384615385]; 

解决方法,在前序逻辑加工时处理,如在hive侧进行处理 :

regexp_replace(budget_id_all,'\\n|\\r|\\t',' ') as batch_id_all, --平台券id

参考文章 :hive替换数据中的制表符和换行符_hive 替换换行符-CSDN博客

你可能感兴趣的:(spark)