Pentaho Data Integration (Kettle)是Pentaho生态系统中默认的ETL工具。通过非常直观的图形化编辑器(Spoon),您可以定义以XML格式储存的流程。在Kettle运行过程中,这些流程会以不同的方法编译。用到的工具包括命令行工具(Pan),小型服务器(Carte),数据库存储库(repository)(Kitchen)或者直接使用IDE(Spoon)。
Talend Open Studio是 Talend 开发的ETL工具——Talend 是一家主营数据集成和数据管理解决方案的企业。Talend 采用用户友好型,综合性很强的IDE(类似于Pentaho Kettle 的 Spoon)来设计不同的流程。这些流程可以在IDE内部测试并编译成Java 代码。您可以随时查看并编辑生成的Java代码,同时实现强大的控制力和灵活性。
两者都非常优秀,都属于用户友好型的交叉平台(基于Java的)工具。它们的主要差异在于Kettle 将 ELT 流程编译为 XML 格式,然而Talend Open Studio 则生成 Java 代码。
Kettle 和 Talend 都提供图形化工具使工作更加简便快捷。这些工具可以帮助您迅速设计并测试出可靠的 ETL 流程。
Pentaho Kettle 学起来十分简单,但与 Talend 的产品相比功能略少。Talend Open Studio 更难掌握,但是一旦您熟悉的它的 IDE,您就可以享受到这个工具强大的灵活与效力。使用 Talend Open Studio 的一个要求是正确定义您要处理的数据的 schema,在这个工程中,它的 IDE 大有助益。而在这一点上,Kettle 限制更少,因此您可以更快地建立起流程来。而且定义元数据对 Talend 来说是一个重要的功能,因为这会帮助您在生产环境中做出更可靠的流程。
Talend Open Studio 和 Pentaho Kettle 都是用户友好型,拥有丰富文档和强大社区支持的产品。只不过 Talend Open Studio 需要您投入稍大的精力来熟悉。但是,一旦您入门了,您就可以享受到这个工具的强大和潜力。
Pentaho 和 Talend 的解决方案都非常可靠,成熟,而且发展迅速。实际运用中两者实现的功能有所趋同。经由订阅您可以获得支持服务,也可以按照需求取得直接的咨询服务。