DataStage中merge、lookup、join的区别与联系

三者功能类似,都可以将表连接起来进行输出。

区别主要体现在性能上。

lookup就是一个表在另一个表中找,处理过程都在内存进行,因此占用内存较多,一般大事实表和小纬表用这种方式关联效率高。

merge和join的处理过程不需用占大量内存。不同在于merge要先把key值排序在做join,因此要求key不能重复,Merge的输出集可以设为多个。

转载于:https://www.cnblogs.com/genezhao/p/6894199.html

你可能感兴趣的:(DataStage中merge、lookup、join的区别与联系)