Pentaho
Pentaho商业智能套件提供企业级报表制作、分析、数据挖掘、数据集成与工作流功能。还可以利用其灵活与完整的基础框架来构建自定义的BI应用套件。
SpagoBI
商务智能套件SpagoBI提供一个基于J2EE的框架用于管理BI对象如报表、OLAP分析、仪表盘、记分卡以及数据挖掘模型等。它提供的BI管理器能够控制、校验、验证与分发这些BI对象。 SpagoBI特性包括支持Portal、report、OLAP、QbE、ETL、dashboard、文档管理、元数据管理、数据挖掘与地理信息分析。
JasperSoft BI
基于模块化设计的JasperSoft BI套件提供了报表整合,分析,报表制作,ETL与数据集成等功能模块。
OpenI
OpenI一个用于制作OLAP报表的Web应用程序。它可以部署在任何J2EE服务器中,支持交互式OLAP报表的发布。OpenI能够使用关系型数据源和基于XMLA的数据源。
JPivot
JPivot是一个JSP标签库用于操作OLAP Table,让用户可以执行基本的OLAP操作,如切片、切块、上钻、下钻等。JPivot使用Mondrian作为它的OLAP服务器但也支持XMLA数据源访问。
Weka
Weka是一组用于数据挖掘的机器学习(machine learning)算法。这些算法可以直接应用于数据集,也可以从Java代码中调用。Weka包含的工具可以用于数据预处理,分类,聚类,关联规则,可视化。它还非常适用于开发新的机器学习方法。
OLAP4J
OLAP4J一个类似于JDBC驱动,能够用于访问任何OLAP服务器的Java公共类包。所以你可以开发一个应用程序来实现一个OLAP服务器与另一个服务器的交互。
RapidMiner(YALE)
RapidMiner(YALE)的组合式operator设计思想能够设计出复杂嵌套的operator链来解决运用快速原型技术所遇到的大量问题。该项目包含400多个可任意组合的数据挖掘operator,能够用于文本挖掘,多媒体挖掘,数据流挖掘等。RapidMiner还可以与Weka相结合。
Mondrian
Mondrian是一个采用java开发的OLAP服务器,能够分析存储在SQL数据库中的海量数据而不需要编写任何SQL脚本。Mondrian用于数据的多维探测。它支持把MDX(Multi-Dimensional eXpression)语言转换成SQL。
Rex
Rex是一个Java客户端提供易于使用的GUI用于浏览支持XMLA协议的多维数据源(Mondrian,Microsoft Analysis Services)。此外Rex还包括MDX Editor与MDX Builder Tool。
Jdbc4Olap
Jdbc4Olap是一个用于访问OLAP数据源的JDBC Type4驱动器,但只实现了部分JDBC3.0规范。通过XMLA协议能够直接与大部分OLAP数据库交互比如:SAP BW,Microsoft Analysis Services,Mondrian等。除此之外Jdbc4Olap还提供SQL-MDX转换器和OLAP数据库的虚拟关系映射。
KNIME
KNIME是一个基于Eclipse平台开发,模块化的数据挖掘系统。它能够让用户可视化创建数据流(也就常说的pipeline),选择性的执行部分或所有分解步骤,然后通过数据和模型上的交互式视图研究执行后的结果。
Apatar Data Integration/ETL
Apatar是一个开源的数据抽取、转换、 装载(ETL)项目。模块化的架构。提供可视化的Job设计器与映射工具,支持所有主流数据源,提供灵活的部署选项(GUI,Server Engine或embedded)。
olap4cloud
olap4cloud是一个基于Hadoop/HBase/MapReduce的OLAP引擎。它构建服务于包含分组和聚合的OLAP查询。以下是olap4cloud提供的典型查询服务。
select d3, sum(m1), min(m2) from facts where d1 in (1,2) and d2 in (2,3) group by d3;
SQL Power Wabit
Wabit是一个易于使用,多功能智能报表和分析工具。它可以让业务人员执行Ad hoc query:即席查询,生成标准报表等。它还提供其它特性比如:一个可拖拉的playpen,实时数据集更新,全局搜索,WYSIWYG报表格式化。只要点一下鼠标,查询结果将立即转换成一个优雅的报表,并可进一步定制的字体,颜色,页眉,页脚,Logo等。Wabit已经支持标准报表和自定义仪表盘,即席查询和钻取OLAP多维数据集和实时BI报表。
DataCleaner
DataCleaner是一个开源的应用程序用于数据分析,转换和清洗。能够帮助你管理和监测你的数据质量。
ETL工具 Talend
Talend (踏蓝) 是第一家针对的数据集成工具市场的ETL(数据的提取Extract、传输Transform、载入Load)开源软件供应商。Talend以它的技术和商业双重模式为ETL服务提供了一个全新的远景。它打破了传统的独有封闭服务,提供了一个针对所有规模的公司的公开的,创新的,强大的灵活的软件解决方案。最终,由于Talend的出现,数据整合方案不再是被大公司所独享。
商业智能分析环境 Stado
Stado 提供一个强大而且灵活的分析环境,允许用户处理大量的数据而无需商业的数据仓库解决方案。大并行处理的体系结构用在常规硬件上进行商业智能分析处理。
引自: OpenSource