Hue 简单使用笔记

1. 查询语句可以加上一句:

-- 定义job名字
SET mapred.job.name='customer_rfm_analysis_L1';

这样在job任务列表里可以第一眼找到自己的任务。

 

2. 少用distinct, 因为会把数据弄在一个reduce中,造成数据倾斜。

尽量用group by,distinct数据数量大于1000条时。

 

3. 

你可能感兴趣的:(Hue 简单使用笔记)