hive tez出现java堆内存溢出进行调优

运行hive任务的时候出现了错误,日志如下:

ERROR : FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.tez.TezTask. Vertex failed, vertexName=Map 1, vertexId=vertex_1608805116045_1296_1_04, diagnostics=[Task failed, taskId=task_1608805116045_1296_1_04_000010, diagnostics=[TaskAttempt 0 failed, info=[Error: Error while running task ( failure ) : java.lang.OutOfMemoryError: Java heap space

[2020-12-25 15:17:34,519] {bash_operator.py:127} INFO -  at java.nio.HeapByteBuffer.(HeapByteBuffer.java:57)

这个时候需要我们调整tez的参数,如下

--修改tez container大小由2G调到8G

hive.tez.container.size=8192

--TEZ MAP split最小值由16M调为64M

tez.grouping.min-size=67108864 (需要在hive-site文件中自定义新增)

--tez 设置输出排序内存大小由512M调整至2G

tez.runtime.io.sort.mb=2048

--表小于2G时把join转为MAPJOIN

hive.auto.convert.join.noconditionaltask.size=2147483648

--使用的缓冲区大小

tez.runtime.unordered.output.buffer.size-mb=512

参数调整完毕,问题解决。

你可能感兴趣的:(hive tez出现java堆内存溢出进行调优)