转-Pentaho技术白皮书中文版(二)--BI平台入门

Pentaho BI 平台是一个以流程为中心的,工作流驱动的,可扩展平台,用于解决商业智能问题。这篇文档使你可在 10 分钟内获得 Pentaho BI 平台,并在本机运行,也便于商业或技术专业人员直接快速浏览平台的功能。

这篇文档描述了:

l         如何下载 demo 以及哪个版本满足你的需要。

l         如何安装和设置产品

l         如何尝试使用 samples。samples 显示了单独的功能如何工作,以及如何结合不同功能达到不同效果。

这篇文档只覆盖了平台的预配置安装发布包。如果你想做些更有挑战的尝试,例如从源码构建平台,或将我们的 web 应用部署进你自己的应用服务器,那么请参考文档 Manual Deployment of Pentaho

预配置安装是一个完整的服务器安装包,允许你评估 Pentaho BI 平台的功能。它包括一个预配置的应用服务器/web 服务器,预配置的和 pre-populated 应用数据库,sample 数据和 fully-functional samples。

如果你想评估 MS Windows 计算机上的 Pentaho BI 平台的功能,依据这些 'tip' 图标的指示。如果你使用 *nix 或Mac OS/X,也请阅读中间的那部分。

 

许可证

Pentaho BI 平台是在 Mozilla Public License (MPL) 下的开放源码。license 的副本位于http://www.mozilla.org/MPL/MPL-1.1.txt.

其他资源

除了这篇文档,还有一些其它可用的下载,文档等等资源:

资源

位置

Pentaho 网站

产品信息

Pentaho.org

技术白皮书

这个文档描述了 Pentaho BI 平台的体系结构,以及为何它是唯一的。

可以 PDF 格式下载:

http://sourceforge.net/project/showfiles.php?group_id=140317

手动配置指南

这篇文档提供了在平台安装过程中出现的一些问题的答案,以及如何从源码构建平台,以及配置信息。

Manual Deployment of Pentaho

创建 Pentaho Solutions

这篇文档提供了如何构建 Pentaho solutions 的详细信息。

Creating Pentaho Solutions

产品 Roadmap

我们的开发 roadmap 是公开的,位于:

Ø         在线报告(每日更新)

Ø         可下载的 PDF

Ø         交互式网站

• Roadmap

• SourceForge

• http://jira.pentaho.org:8080

Community

这个网站提供了最新信息,论坛,F.A.Q.s (一些其实不是那么常见的问题),以及额外设计文档。

Community

 

01. 获得 Pentaho BI 平台

 

This page last changed on Dec 04, 2006 by bhagan.

 

Pentaho BI 平台有多种分发形式。最适合你的取决于你的环境。这里我们讨论的唯一选项是预配置安装包。

如果你的操作系统是 Windows,访问 Sourceforge 上的项目站点,点击 'Files'。下载最新的 pentaho_demo-x.x.x.x。这个下载包含一个预配置的 JBoss(http://www.jboss.com)应用服务器以及 samples,数据和一个 Sun Microsystems JRE (version 1.4.2.08)。下载和安装这个包意味着你已经接受了 Mozilla Public License 的条款。忽略这一节剩余部分,直接进入下一节,预配置安装。

如果你的操作系统是 *nix flavor 或 Mac,下载最新的 pentaho-demo-x.x.x.x rpm 文件。这个下载包括一个预配置的 JBoss (http://www.jboss.com) 应用服务器以及 samples 和数据。下载和安装这个包意味着你已经接受了 Pentaho Public License 的条款。你也需要安装一个 Java SDK。Pentaho BI 平台是在 Java SDK 1.4 上构建和测试的,在以下网址上有很多平台的版本:http://java.sun.com/j2se/1.4.2/download.html。确保环境变量‘JAVA_HOME’ 指向 JDK 被安装的目录。

02. 其他可用的 Distributions

This page last changed on Dec 05, 2006 by bhagan.

以下文档描述了可用 distributions 的子集。可用下载的完整列表,请查看:http ://sourceforge. net/project/showfiles. php?group id= 140317

Source Distribution

Pentaho source distribution 不再被维护(截至此时)。一开始创建它是一个权宜之计,直到我们有了一个 public subversion。既然我们已经有了一个 public subversion,你应该从那里获取最新源码。我们的 subversion repository 允许匿名用户访问,位于 svn://source.pentaho.org/svnroot。

Java Archive (JAR) Distribution

Java Archive (JAR) distribution 是 Pentaho 平台二进制类和子系统配置文件的一个 archive。这个 distribution 位于 SourceForge,名为 '1pentahojars-<version>.zip'1。 平台 Java Archive (JAR) distribution 是很有用的,如果你想在 standalone 应用中用平台 Application Programming Interface (API) 进行编码,或想在你自己的 web 应用中包含这些类。

Solutions Distribution

solutions distribution 是 sample 和 test solution 文档的一个 archive,其可用作你自己的 solutions 的起点,和/或放进你的平台的定制配置里。这个 distribution 位于 SourceForge,名为'1pentaho_solutions-<version>.zip'1。如何构建 Pentaho solutions 和理解 solution document schemas 的更多信息请参考 Solution Building Guide。

Data Distribution

data distribution 是几个 Hypersonic 数据库的一个 archive,其包含运行我们的预配置 distributions 和solutions 所必需的所有应用和 sample 数据。这个位于 SourceForge,名为 '1pentaho_data-<version>.zip'1。下载 data distribution,如果你想从源码构建平台,或想运行 sample solutions。

Styles Web Application Distribution

styles web application 包含 images 和 cascading style sheets,其格式化平台接口的展示。为了使平台的定制简化和可维护,我们将展现分割成它自己的 web 应用,这样当你升级平台自身时,就不会被覆盖。如果你想在从源码构建之后,配置平台 samples,或需要一个 place 来启动你自己的定制时,那么你应该构建 pentaho-style.war。

Javadoc 文档 Distribution

Javadoc 文档 distribution 是 Pentaho 平台 Java 类的 Javadoc。这个 distribution 位于 SourceForge,名为 "pentaho-javadoc-<version>.zip"。

03. 预配置安装

This page last changed on Apr 17, 2007 by wgorman.

这个安装的性能依赖于很多因素,但是它应该可在几乎所有的平台和配置下运行。

安装

在你的硬盘上创建一个新的目录。建议你选择一个容易记住的名字和位置。注意:不管你将 Pentaho-demo装在哪里,确保它的上层目录中不要出现空格。不然,在运行某些实例时,会出现问题。

使用你最喜欢的 unzip 工具,将你下载的文件解压进你的新目录。

你下载的文件解压进你选择的目录。Windows XP 带有一个解压工具,名为 “Compressed Folders”,你可通过右键点击选择 Open With… menu 打开它。如果你使用 Windows 的较老版本,那你需要使用一个压缩工具,例如WinZip

 

数据库配置

如果你选择安装的是 Hypersonic 版本的预配置安装包,那么安装过程已经完成了。如果你选择安装的是预配置安装包的 MySQL 版本,你必须配置 MySQL.

预配置安装包没有自带 MySQL。首先,使用默认配置将 MySQL 安装在本机,使用端口 3306。作为一个 MySQL 管理员,编辑文件 "data/SampleDataDump_MySql.sql"。这个文件将在你的本机 MySQL 安装上,安装适当的用户和数据库。

预配置安装期望 MySQL 运行于本机的标准 MySQL 端口,3306。

 

配置

 

应用和 Sample 数据

我们在自配置的数据库中提供了所必需的所有 application 和 sample 数据。使用几个提供的 Hypersonic 数据库来提供数据。对于这种安装,Hypersonic 是很理想的,因为:

Ø         数据库不需要配置

Ø         仅当你开始安装时,启动数据库(如下),而不是当你的计算机启动时。

Ø         当你停止服务器(如下)时,数据库也会停止,并且不会在内存留下任何东西。

如果你不想将 Pentaho BI 平台用于 demos 和 evaluation,我们建议你使用一个不同的数据库系统。稍后的版本将提供完成这个功能的数据库脚本。平台 persistence API 基于 Hibernate,它将会大大简化大多数 DBMS 上的操作。

运行服务器

看一下你将预配置安装包解压至的目录。你应该看到一个目录,pentaho-demo。在 pentaho-demo 目录下,有几种其它目录和几个文件。关于预配置安装包的内容的更多信息,请参考 Pentaho的手动配置。

根目录的脚本将启动和停止平台服务器,以及平台运行所必需的数据库服务。

为在 Windows 机器上启动服务器,使用 Windows explorer 浏览至 pentaho-demo 目录,并双击 start-pentaho.bat 文件。

为在 *nix 机器上启动服务器,打开一个终端窗口,浏览至 pentaho-demo 目录,并运行 start-pentaho.sh 文件。(你必须有以下文件的 'execute' 权限来启动它:'start-pentho.sh','data/start_hypersonic.sh' 和'jboss/bin/run .sh')

脚本运行后,你应该打开2个命令窗口(或终端),30秒左右后,一个窗口的最后一行是如下信息:‘Pentaho BI Platform server ready’。你在其它窗口看到的消息来自数据库服务器。

启动 BI 平台的用户账户需要有在 pentaho-demo/pentaho-solutions/system/content 目录中创建目录和文件的权限。如果将 JBoss 安装为一个服务,启动服务的用户账户也需要有 create 权限。

 

停止服务器

看一下你将预配置安装包解压至的目录。你应该看到一个目录,pentaho-demo。在 pentaho-demo 目录中,有几个其它目录和脚本。关于预配置安装内容的更多信息,请参考高级安装指南。

根目录的脚本将启动和停止平台服务器,以及平台运行所必需的数据库服务。

为在 *nix 机器上停止服务器,打开一个终端窗口,浏览至 pentaho-demo 目录,并运行 stop-pentaho.sh 文件(你必须有运行它的权限)。

脚本运行后,应该关闭两个命令行窗口(或终端),并退出系统。

为在 Windows 机器上停止服务器,只要打开一个命令行(或 Windows Explorer),浏览至 pentaho-demo 目录,并运行 stop-pentaho.bat 文件。

 

卸载

如果你想从你的计算机上删除这个安装,你可以删除你将之安装至的目录。这将从你的机器上删除应用。如果你安装了一个 Java SDK,你将不得不单独删除它。

试用 Samples

如果现在一切运行正常,你应该能将你的浏览器指向你最新安装的 Pentaho BI 平台服务器,并运行 samples。samples 显示了如何将 Pentaho BI 组件嵌入进网页,包括 Portal 页面和定制的 Java Server Pages。这些 sample 页面绝不是你访问和使用 BI 组件的唯一方式。

如果你将应用安装在一个本地机器上(例如你启动 client browser 的相同机器),那么访问平台 samples 的 URL 是:http://localhost:8080/

如果从远程机器访问 samples(物理上没有安装平台的任何机器),URL 是 http://<YourHostName>:8080/,用你安装了平台的机器的名字,IP 地址或 DNS 名替换<YourHostName>。

你应该看到一个类似如下截图的一个网页。如果看不到,请查看问题解决一节。这是顶层内容浏览页面。

使用你常用的浏览器(我们已经测试了 Firefox 1.5Firefox 2.0Netscape 7.2Opera 7.5Safari Microsoft Internet Explorer 6.0),浏览至 http://localhost:8080/

没有网页?

Pentaho 平台使用端口 8080 作为运行服务器的默认端口。这是在很多 web 应用和应用服务器中通常使用的默认端口。如果服务器控制台中出现了带有 Bind – port already in use 的错误信息,很可能是因为另一个应用正使用端口 8080。最简单的解决办法是找到使用端口 8080 的应用,然后在你运行期间关闭那个应用。如果这样不起作用,请参考 04. Changing Server Port 获取如何改变默认端口的详细信息。

配置 E-Mail

This page last changed on Nov 29, 2006 by mbatchelor.

Pentaho BI 平台使用一个 SMTP 服务器发送 email 消息。在它可发送任何 emails 前,平台需要知道你被授权使用的一个 SMTP 服务器的地址。在大多数情况下,它也需要一个 user id,password 和一个有效的应答 email 地址。如果你不知道你本地 SMTP 服务器的地址,询问你的系统管理员。你也可以查看你的 email 程序的配置设置来搞清楚。通常它如下所示:smtp.some-company.com。

为修改你的设置,请编辑 email_config.xml 文件,其默认路径是:/pentaho-demo/pentaho-solutions/system/smtp-email/email_config.xml。

如果你使用 Google Gmail,在 smtp-email 目录中有一个 sample email_config_gmail.xml 文件。它提供了 Gmail 需要的设置的一个实例。

使用一个 XML 或文本编辑器,如下为你的安装插入值:

Ø         mail.smtp.host -你被授权使用的 SMTP 服务器的 DNS 或 IP 地址。

Ø         mail.smtp.auth -如果你的服务器在发送 email 时,需要一个 user id 和 password,将之设置为 true。大多数情况下,应该为 true。如果 authentication 不是必需的,设置成 false。

Ø         mail.from.default -当 Pentaho BI 平台发送一个email 时,如果没在 action sequence document 中指定其它的地址,这个地址将作为 from 地址出现。大多数 SMTP 服务器要求这是一个有效的 email 地址。

Ø         mail.userid -如果 mail.smtp.auth 设置为 true,必须在此处为你的 email 服务器设置一个有效的 user id。

Ø         mail.password -如果 mail.smtp.auth 设置为 true,必须在此处为以上的 user id 设置 password。

小心不要删除这个 xml 文档中的任何其它字符。当完成时,它应该如下所示:

<email-smtp> <properties>

<!-- This is the address of your SMTP email server for sending email. --> <!-- e.g. smtp.pentaho.org -->

<mail. smtp. host>smtp. internetking. com</mail . smtp . host>

<!-- This is the port of your SMTP email server. Usually this is 25. --> <!-- For GMail this is 587 -->

<mail. smtp.port>25</mail. smtp.port>

<!-- The transport for accessing the email server. Usually this is smtp. --> <!-- For GMail this is smtps -->

<mail. transport .protocol>smtp</mail . transport .protocol>

<!-- Usually this is 'false'. For GMail it is 'true' --> <mail. smtp. starttls .enable>false</mail. smtp. starttls .enable>

<!-- Set to true if the email server requires the sender to authenticate --> <mail. smtp. auth>true</mail. smtp . auth>

<!-- This is true if the email server requires an SSL connection. Usually 'false'. --> <!-- For GMail this is 'true' -->

<mail. smtp. ssl>false</mail. smtp.ssl>

<!-- Output debug information from the JavaMail API -->

<mail. debug>true</mail. debug> </properties>

<!-- The is the address of your POP3 email server for receiving email. --> <!-- e.g. pop.pentaho.org -->

<!-- It is currently not used -->

<mail.pop3></mail.pop3>

<!-- This is the default 'from' address that emails from the Pentaho BI Platform will appear to come from -->

<!-- e.g. [email protected] -->

<mail. from. default>[email protected]</mail. from. default>

<!-- This is the user id used to connect to the email server for sending email. --> <!-- It is only required if email-authenticate is set to true. -->

<!-- This is never sent or shown to anyone -->

<mail. userid>hsimpson</mail.userid>

<!-- This is the password used to connect to the email server for sending email. --> <!-- It is only required if email-authenticate is set to true. -->

<!-- This is never sent or shown to anyone -->

<mail .password>mmmdonuts</mail.password>

</email-smtp>

配置端口

This page last changed on Jan 28, 2007 by bhagan.

服务器使用默认端口 8080。如果这不可用,例如如果 Tomcat 或其它 servlet 应用正运行于你的机器上,你可以:

1.    停止端口 8080 上的 应用,并重启 Pentaho。

2.  改变 Pentaho 使用的端口。如何改变请参考 04. 改变服务器端口。

04. 改变服务器端口

This page last changed on May 31, 2007 by cedric.claidiere.

To Do

改变端口 8080

 Windows 上,改变 RMI 端口 1098  1099

为改变端口 8080:

1.       打开文件/pentaho-preconfiguredinstall/server/default/deploy/jbossweb-tomcat55.sar/server.xml

2.       在下面行中修改端口号(例如标准端口 80)。

<Connector port="8080" address="${ jboss.bind.address}" maxThreads="250" strategy="ms" maxHttpHeaderSize="8192" emptySessionPath=" true"

enableLookups="false" redirectPort="8443" acceptCount="100" connectionTimeout="20000" disableUploadTimeout="true"/>

 

 linux 

如果在 Linux 上,你将端口改成了 80,你必须以 root 身份启动服务器。

 

警告

不要忘记编辑/pentaho-preconfiguredinstall/server/default/deploy/pentaho.war 中的 web.xml 文件。

 

配置 Publish

This page last changed on Feb 21, 2007 by cedric.claidiere.

Pentaho BI 平台提供了能力,将内容从 Pentaho 客户端工具发布到 Pentaho 服务器。为允许客户端工具(Report Design Wizard,Cube Design Wizard 等) 发布到服务器,必须在 Pentaho BI 平台上配置一个 "Publish Password"。这是一种安全措施,防止恶意内容被发布到 Pentaho 服务器。

为设置 publish password,编辑文件 publisher_config.xml,其默认路径是: /pentaho-demo/pentaho-solutions/system/publisher_config.xml。

在以下节点中输入它来定义 password:

<publisher-password>your_password</publisher-password>

 

部署配置

This page last changed on Nov 29, 2006 by mbatchelor.

预配置安装包被设计成 standalone 运行于一台机器上,使用 http://localhost:8080/pentaho 作为base URL。如果你不需要从其他计算机访问服务器,你可跳过 "Running as a server" 这一步。

 

作为一个服务器运行

为允许其他计算机访问 Pentaho BI 平台,必须在 web.xml 文件中设置 base URL

1.       定位文件 web.xml,其缺省路径是:pentaho-demo/jboss/server/default/deploy/pentaho.war/WEB-INF

2.        XML 或文本编辑器打开 web.xml

3.       用服务器的 URL 设置 context 参数 "base-url"  param-valueURL 应该有机器的 DNS 名或 IP 地址,端口默认是 8080context  "pentaho"。如果你想改变服务器使用的端口,请参考高级安装指南。

最终结果应该如下所示:

<context-param>

<param-name>bas e-url< /param-name>

<param-value>http: //myserver.pentaho.org: 8080/pentaho</param-value> </context-param>

 

许可证(专业版功能)

This page last changed on Nov 29, 2006 by mbatchelor.

仅限于 Pentaho Professional BI Platform 的功能

这一节仅仅适用于 Pentaho 专业 BI 平台。如果你没使用这个版本,可以跳过这一节。

Pentaho Professional BI 平台需要一个 license key。如果你没有 license key,但是已经购买了一个 license,请发 e-mail 到 [email protected]如果你想使用试用专业版,发送e-mail到[email protected]

license key 的安装涉及到 system solution 中的一个 XML 文件的编辑和创建。可在这篇文档以及创建 Pentaho Solutions 文档中找到关于 system solution 的信息。按照下面的步骤输入你的license key。

1.       在 system solution 中定位文件 license.xml。这个文件的缺省路径是: ${pentaho-home}/pentaho-professional/pentaho-solutions/system/license.xml。

2.       使用一个文本编辑器编辑文件,插入你的 license key。例如,如果你的 license key 是 123456,license.xml 应该如下所示:

<pentaho-license> <key>12345 6</key> </pentaho-license>

如果 license key 无效,过期,或不能找到,Pentaho Professional BI 平台不会执行任何 business intelligence processes,但将在应用服务器的日志文件中记录详细信息。对于 out-of-the-box 安装,日志文件位于:${pentaho-home}/pentaho-professional/jboss/server/default/server.log。

04. 浏览 Pentaho

This page last changed on Feb 14, 2007 by sbarkdull.

Home

这是 Pentaho 的主页,用于演示当用户访问 business intelligence 应用时,他会看到什么。它包含一个交互式的 dashboard,浏览区域,以浏览报表和执行管理类型的任务,还包含访问Pentaho News,Training,Demos,Forums,Downloads 等的链接。这页可被修改以包含你的相关信息或被删除。

Go > Solutions

Solutions 是逻辑上分组的 Pentaho 文件夹和文档的集合。默认的,会安装 "Sample" Solution,其包含working 实例,其演示了平台的功能。

Go> My Workspace

在 My Workspace 中,你可看到你的报表运行的历史记录,如果使用 'tRun in background't 的话,你可看到正运行的那些。

Go> My Workspace - Subscriptions (专业版)

如果你使用专业版本,你会看到一个额外区域,此处列出了你的 subscriptions,允许你管理它们。Subscriptions 允许终端用户选择他们需要的 specific repor(s),设置一个 regular delivery schedule,指定报表参数,选择一个 delivery 格式。

Go> Portal

这将演示如何使用 JBoss Portal 来 deliver dashboards,以及运行报表的报表浏览的另一种方法。

Admin

在 Navigation Bar 上点击 Admin,可找到以下管理任务。

Admin 服务

Scheduler Admin

Pentaho BI 平台有一个内置 scheduler,用于调度任务,如报表生成和 delivery。Scheduler 管理员显示scheduler 的当前状态,列出当前 scheduled jobs,使得你可 suspend 和 resume scheduled jobs。

Refresh

Solution Repository

Publish 你创建或下载的新内容,使之对执行来说是可见和可选择的。

Shark 工作流引擎

Publish 任何新的或修改的 XPDL 文档到 Shark 工作流引擎。

系统设置

从系统 XML 文件更新设置。

Global Actions

执行 Pentaho.xml 中定义的所有.global system actions。关于创建和配置新内容的更多信息请参考创建 Pentaho Solutions。

Admin (专业版)

在 Navigation Bar 上点击 Admin 可看到以下管理任务。

Admin 服务

Scheduler Admin

Pentaho BI 平台有一个内置的 scheduler,用于 scheduling 任务,如报表生成和 delivery。Scheduler Administrator 显示 scheduler 的当前状态,列出当前 scheduled jobs,使你可 suspend 和resume scheduled jobs。

Audit Reporting (专业版)

Audit reports 帮助管理员理解和优化他们的 business intelligence 应用。Audit reports 提供对 user activity,系统性能,最受欢迎的报表等的即时审查。在 tracking compliance 并确保根据公司政策来使用资源方面,这些 audit reports 很有用。除了这些,理解系统性能和最受欢迎的报表允许管理员逐步调优配置,确保商业用户有他们最需要的信息:

?     Ad-Hoc Audit Reports 允许管理员创建自己的查询来监控使用和性能。

?     Audit Reports 包含 pre-canned 报表,其监控报表使用,组件活动等。

?     Update Audit Tables from Audit Log File 用于创建 audit log 文件中的 audit 表,并为Ad-Hoc Audit Reporting 和 Audit Reports 组装它们。

?     Update Pentaho Audit Logs 用于更新 audit 表,其额外 activity 来自适合于 Ad-Hoc Audit Reporting 和 Audit Reports. 的 audit log。

内容过期(专业版)

内容过期帮助确保一致性,通过自动删除比指定日期老的内容。

Ø         Clean Repository 基于天数,立即删除 content repository 中的文档。

Ø         Content Repository 的 Schedule Cleaning。

Permissions (专业版)

Report-level 安全使得管理员完全可以控制终端用户对敏感 BI 信息的访问。管理员可定义用户,组,和角色,并使用这些定义来控制对内容的访问。例如,有些报表仅有 '1Managers'1 才可看到,或一个 business rule 仅仅允许 sales managers 查看他们自己的特定区域的结果。

Subscription Admin (专业版)

Subscription 管理使得系统管理员能控制最终用户的 subscription 弹性,使得管理员可为用户restrict subscriptions 的 timing,内容或格式。

版本控制(专业版)

这使之易于和一个版本控制系统同步,如 CVS。通常,系统管理员不愿意修改 production BI 系统,因为害怕系统 outage 或其他错误。生命周期管理允许管理员在测试或开发系统中进行修改,验证这些修改,然后将那些修改配置到 production BI 系统。它包含 system repository 的版本,这样在出现错误时,可以恢复到之前的配置,或为了兼容性的目的进行 audited。

Refresh

Solution Repository

Publish 你创建或下载的新内容,使之对于执行可见和可选择。

Shark 工作流引擎

将任何新的或修改过的 XPDL 文档发布到 Shark 工作流引擎。

系统设置

从系统 XML 文件更新设置。

Global Actions

执行 Pentaho.xml 中定义的 all.global system actions。

创建和配置新内容的更多信息请参考创建 Pentaho Solutions。

05. Business 用户 Samples

This page last changed on Dec 04, 2006 by bhagan.

Steel Wheels

Steel Wheels 实例是一个完整的 BI solution,用于一个虚构的公司。它演示了很多不同种类的报表,具有各种不同的输出格式(pdf,xls,html),几个不同分析 views 来 slice and dice OLAP 数据,和一些交互式的dashboards。

Reporting

Inventory 报表

让我们运行我们的第一个报表,一个 inventory 报表,其是一个标准 group/detail 报表,由 product 和 supplier 组成,提供详细信息,如 SKU,产品名,描述,cost per unit,retail price 和 amount on hand。

运行报表的另一种方式是简单的选择报表的图标,或从列表中选择报表的名字。

允许你选择你的报表输出,仅查看你需要的。这个报表提供了提示信息,其基于产品过滤信息,选择报表格式,PDF,Excel 或一个网页。请选择 "Classic Cars","Motorcycles" 和 "Ships"。然后为报表格式选择 "Web Page"。

选择 Go > Solution。然后向下浏览到 Steel Wheels\Pentaho Reporting。

注意每个文件夹和报表有他们自己的 URL 地址,允许你直接链接到 Pentaho 中的任何报表或位置。

点击报表名或图标,出现一个 panel。

选择 lightning bolt 图标,然后选择 "Run"。

运行报表的另一种方式是仅仅选择报表的图标或在列表中选择报表的名字。

运行你选择你的报表输出,仅查看你需要的内容,这个报表基于产品行提供了 filter 信息的提示,选择报表格式:PDF, Excel 或网页。请选择 "Classic Cars","Motorcycles" 和 "Ships"。报表格式选择"Web Page"。

在报表上,你可能有看到产品图片的需求。Report Designers 可在报表的任意位置动态创建超链接。在这个报表上,他们被放在产品名上。选择 "1968 Ford Mustang"。

你应该在 Google Images 中看到产品的一张图片。关闭 Google Images 浏览器窗口。你也可重新运行报表,在 PDF 报表类型上执行这个步骤。

Billing Statements

此处将运行一个operational/production style report,一个 billing statement。这个报表依据 Customer 和Invoice Number 组织。对于每个 customer,报表包含额外信息,如 contact name 和地址。对于每个Invoice Number,报表包含 Account Number,Order Date 和 Ship Date 信息。

从列表中选择 "Billing Statements"。当出现提示信息时,从 Customers 中选择 "AV Stores, Co." 和 "Alpha Cognac",将 Report Output 设置成 "PDF"。

你的 report run 应该如下所示。如你所见,在如何布局和设计报表上你有很大的自由。

为显示 PDF 和 Excel 输出的质量。再次运行报表,选择 '1Excel'1 作为 Report Output。每个 invoice 在一个单独的 sheet 上。

Income Statement

更高级的布局是一个财会报表,其基于数据,变化对象在报表上的位置。例如,基于一类,如 income,expense,net income,other income 等,确定一个对象会出现在报表的什么位置。

从列表中选择 "Income Statement"。这个报表不会出现提示信息,会立即运行。此处你可看到,对于每类(revenue,cost of goods,expense等),会显示不断变化的相应的值。

Sales by Customer

这个报表显示了如何从一个 summary 类型的报表出发,并深入细节。从列表中选择 "Sales by Customer" 报表。对于这个报表,在提示信息中使用默认设置。选择 "Ok"。

到第 2 页查看 chart。

回到第一页。选择顾客 '1La Rochelle Gifts'1。会显示这个顾客所有订单的一张报表。

Sales by Territory

下一系列的报表显示如何将 context 从一个报表传送到另一个。在 "EMEA" 那行选择 "Product Lines"。

Sales by Productline

注意 Context 被设置成 '1EMEA'1。从 Classic Cars row 中选择 '1Sales Reps'1

Sales by Employee

注意 context 被设置成 '1EMEA'1 和 '1Classic Cars'1

Burst Sales by Customer Report

<<description>> <<screenshot>>

Analysis

<<description>>

Territory Analysis

Product Line 分析

Dashboards

主页- Top Ten Customers

这个交互的 dashboard 允许你快速查看每个 territory 或产品线中的前十个客户。

简单选择 pie charts 中的任意 slice。基于选中的 slices,会出现柱状图,显示适当的前十个客户。

Google Maps Dashboards

<<description>>

<<text>>

Pentaho 报表

This page last changed on Dec 01, 2006 by kcruzada.

06. Technical Samples

This page last changed on Nov 30, 2006 by kcruzada.

Reporting 实例

使用 breadcrumb 菜单向上浏览至 "Samples"。点击 "Reporting Examples"。这演示了 relational,olap 和XML datasource 上的报表。一些 samples 使用带参数的和不带参数的报表,生成HTML,PDF 和 Excel 内容。

Business Rules 实例

Pentaho 目前支持 2 种类型的 business rules:query rule 和 JavaScript rule。query rule 仅仅是一个 SQL 查询,它返回可被迭代,并可被其他组件操作的数据行。JavaScript rule 允许你为必需的功能编写脚本。

Printing 实例

printing 实例显示了报表或其他被生成的内容如何发送到一个打印机或打印设备(比如一个网络传真服务器)。打印服务器必须对 Pentaho BI 平台服务器,而不是客户端可见。

Bursting 实例

Bursting 允许你 break 一个较大的任务(如传送报表给部门经理)成针对每个单独 case 反复执行的一个简单 process。决定了内容创建和传送的 cases 和 processes 的 rules 可被定制,以满足需求。

*Setup Step 1: *在运行这组中的任何实例之前,确保你已经成功运行了 Getting Started  组中的 Hello World Email。这将验证你已经设置了你的 email,并且它是有效的。

*Setup Step 2:*预配置安装包自带的测试数据包含虚构的 email 地址,在运行这组中的 samples 之前,必须修改这个。点击 step 1 – Setup,它将允许你编辑 query rules 用来将 regions 映射到managers 和 email 地址的数据。将 email 地址修改成有效地址,如果你愿意的话,可以给 managers 付与新的名字。即使你给所有的 managers 都输入相同的 email 地址,也没关系,如果你想让他们均使用一个(可能是你的) email 帐号的话。BurstDesintation .jpg | align =center!

*Example 2* Burst Using Action Sequence Document 使用 Action Sequence 文档执行 rule,并在 managers 和 regions 列表上循环,对于每个 manager,报表引擎为他生成一个 pdf 报表,并使用 email 组件将之发送出。对于快速构建一个 burst sequence 来说,这是一个好的设计,但是扩展型不是很好,而且不容错。

*Example 3* Burst Using Workflow 使用 Shark 工作流引擎管理生成报表和发送 email。对于大型的 bursts,这是管理生成和传送的精深部分的更健壮的方式。工作流图自身是很简单的,可以图解Shark 集成。已经忽略了错误处理和 deadline 处理。!WorkFlowEmail.jpg|align=center!

Datasource 实例

datasource samples 是不同 OLAP 和 RDBMS 数据源返回的 data sets 的实例。当前实例集合演示了数据的一个 MDX 查询,一个 SQL 查询和一个 XML 查询(XQuery)。

Chart 实例

chart 实例演示了显示多种数据的不同 chart 类型。这些 charts 包括一个 bar chart,line chart,area chart,pie chart 和一个 dashboard dial。

Secure Filters 实例

这些实例显示了如何为报表设置安全的过滤器。这些过滤器可用于指定用户可从中选择的有效选择,用于应用安全以确保不会作无效选择。Filters 可是 user-specific,application-wide,可一个报表一个报表的定义。

Analysis 实例

这显示了如何使用 JPivot 将 pivot 视图集成进 Pentaho。Pivot 视图允许用户研究一个多维模型中定义的一组数据。用户可 drill-down,expand,collapse 和 move 数据元素 (维)。

ETL 实例

这个实例演示了 Kettle ETL 组件的 Extraction,Transformation 和 Loading。

SVG 实例

这个实例显示了 SVG 如何被用于图形化的显示数据。查看这个 sample,需要 Firefox 1.5,Opera 8,或 Microsoft IE 上的 Adobe SVG viewer 插件。

Web 服务实例

这个实例演示了如何以一个 Web 服务来执行一个 Pentaho Action Sequence。在这个实例中,执行一个 query rule,以一个 SOAP message 返回结果。

06. Portal Demo

This page last changed on Nov 30, 2006 by kcruzada.

预配置安装包有一个 JBoss Portal V2.0 的配置。这个 portal 是 JSR-168 兼容的 Portal 服务器的一个开放源码实现。JSR-168 是被很多开放源码和商业 Portal 服务器所支持的一个标准。你可使用页面顶部的菜单条浏览至 samples。

'Dashboard' 页面包含实例,其演示了 drill-thru to a pivot table。首先,你必须登录到服务器。在 'Home' 页面上有一个登录链接。你以 Suzy 或 Joe 身份登录。为你选择的用户,会运行一个security filter,你会在 'Dashboard' 页面上看到不同的 regions。一旦你选择了一个 region 和一个 department,并点击了'Update...",你会看到一个 pie chart,一些 dials 和一个嵌入式报表。你可在嵌入式报表中,点击一个 pie chart slice,dial,或 row header,将你的选择传送至一个 pivot table view。

07. 问题解决

This page last changed on Dec 04, 2006 by bhagan.

如果首页(http://localhost:8080/pentaho/Home)上的图表没有出现,你需要验证是否配置好了 solutions。点击 Go->Solutions,然后点击 Getting Started。Getting Started 中的 samples 将检查系统的不同部分。以下列的顺序依次进行检查:

Hello World

平台上显示一段欢迎文本。如果成功,那么你的 solution repository 就完全配置好了。

没有 'Hello World...

如果没有成功运行 "Hello World",且你用于访问它的 URL 不以 http://localhost 开头,请参考运行服务器。

其他可能的原因是服务器没有找到 solutions 目录。通常,当 solutions 路径不同于默认路径(pentaho-demo/pentaho-solutions)时,就会出现这种情况。

1.    定位 web.xml 文件,其缺省位置是:/pentaho-demo/jboss/server/default/deploy/pentaho.war/WEB-INF

2.    在一个 XML 或文本编辑器中打开 web.xml

3.   用你的 solutions 目录的路径,编辑上下文参数 "solution-path"  param-value

<context-param>

<param-name>solution-path< /param-name>

<param-value>/my-directory/pentaho-solutions/< /param-value>

</context-param>

 

Hello World Email

平台发送的一封 email 的提示信息。如果成功,那么你的 email 服务器也配置好了。

没有 email 消息

如果在合理的时间段内,你没有收到一封 email(一些服务器不立即转发)或你遇到了一条错误信息,最可能的原因是没有配置好 SMTP 服务器。参考配置 E-Mail 中的步骤来解决问题。

一些 SMTP 服务器在允许 email 转发之前,要求发送方机器在相同的 domain  subnet 中。

一些 SMTP 服务器要求 "from" 地址被设置成已知的,有效的 email 地址

 

Sample 数据

在 sample 数据库上执行一个查询,返回 4 个 regions 的一个列表。如果成功,那么你的数据库访问和 sample 数据已经完全配置好了。

数据库错误?

如果你遇到了一个数据库错误,通常意味着 Hypersonic 数据库没有成功启动。停止服务器一章所述停止服务器,如运行服务器一章所述启动服务器。你应该看到两个命令(或终端窗口。检查名为 "Hypersonic Start" 的窗口中的错误信息。

一旦你已经运行了 Getting Started 实例,验证了你的安装完全配置好了,有更多的可运行 samples 和实例。

你可能感兴趣的:(转-Pentaho技术白皮书中文版(二)--BI平台入门)