qq85609655

Mondrian中聚合表的应用

最近在项目中使用了开源OLAP引擎——Mondrian实现一个多维分析系统，在项目后期系统优化阶段使用了Mondrian中的聚合表机制。这里结合 Mondrian官方资料和个人使用经验，对Mondrian中聚合表的概念、应用场景、如何使用、注意事项等内容做一个总结。

1. OLAP相关概念

Mondrian是一个基于Java语言的开源OLAP引擎，它通过MDX语句执行查询，从关系型数据库RDBMS中读取数据，以多维度的形式展示查询结果。

Mondrian通过Schema来定义一个多维数据库，它是一个逻辑概念上的模型，其中包含Cube（立方体）、Dimension（维度）、Hierarchy（层次）、Level（级别）、Measure（度量），这些被映射到数据库物理模型。Mondrian中Schema是以XML文件的形式定义的。

Cube（立方体）是一系列Dimension和Measure的集合区域，它们共用一个事实表。
Dimension（维度）是一个Hierarchy的集合，维度一般有其相对应的维度表，它由Hierarchy（层次）组成，而Hierarchy（层次）又是由组成Level（级别）的。
Hierarchy（层次）是指定维度的层级关系的，如果没有指定，默认Hierarchy里面装的是来自立方体中的真实表。
Level（级别）是Hierarchy的组成部分，使用它可以构成一个结构树，Level的先后顺序决定了Level在结构树上的位置，最顶层的 Level 位于树的第一级，依次类推。
Measure（度量）是我们要进行度量计算的数值，支持的操作有sum、count、avg、distinct-count、max、min等。

概括总结一下：在多维分析中，关注的内容通常被称为度量(Measure)，而把限制条件称为维度(Dimension)。多维分析就是对同时满足多种限制条件的所有度量值做汇总统计。包含度量值的表被称为事实表(Fact Table)，描述维度具体信息的表被称为维表(Dimension Table)，同时有一点需要注意：并不是所有的维度都要有维表，对于取值简单的维度，可以直接使用事实表中的一列作为维度展示。

下面是Mondrian中一个简单的Schema文件：

<Schema>
<Cube name="Sales">
<Table name="sales_fact_1997"/>
<Dimension name="Gender" foreignKey="customer_id">
<Hierarchy hasAll="true" allMemberName="All Genders" primaryKey="customer_id">
<Table name="customer"/>
<Level name="Gender" column="gender" uniqueMembers="true"/>
</Hierarchy>
</Dimension>
<Dimension name="Time" foreignKey="time_id">
<Hierarchy hasAll="false" primaryKey="time_id">
<Table name="time_by_day"/>
<Level name="Year" column="the_year" type="Numeric" uniqueMembers="true"/>
<Level name="Quarter" column="quarter" uniqueMembers="false"/>
<Level name="Month" column="month_of_year" type="Numeric" uniqueMembers="false"/>
</Hierarchy>
</Dimension>
<Measure name="Unit Sales" column="unit_sales" aggregator="sum" formatString="#,###"/>
<Measure name="Store Sales" column="store_sales" aggregator="sum" formatString="#,###.##"/>
<Measure name="Store Cost" column="store_cost" aggregator="sum" formatString="#,###.00"/>
<CalculatedMember name="Profit" dimension="Measures" formula="[Measures].[Store Sales] - [Measures].[Store Cost]">
<CalculatedMemberProperty name="FORMAT_STRING" value="$#,##0.00"/>
</CalculatedMember>
</Cube>
</Schema>

其中包含一个名为“Sales”的Cube，立方体中有两个维度：“Gender”和“Time”，两个度量值：“Unit Sales”和“Store Sales”。有关Mondrian的Schema文件的具体编写规则，可以参考官方文档：如何编写Schema。

2. 什么是聚合表

下图描述了一个数据库的结构。该数据库中共有五张表，分别是：Sales表，Customer表，Time表，Product表和Mfr表。这个数据库的作用是存储每一笔交易：包括这笔交易发生在什么时间，交易的产品类型，进行交易的客户信息，交易方式，交易了多少件产品以及成交金额是多少。

星型模型中有一张事实表（Sales），两个度量列（units和dollars），四个维度表（Product, Mfr, Customer, Time）。在这个星型模型的最顶层，我们创建了以下多维模型：

[Sales]立方体包含[Unit sales]和[Dollar sales]两个度量值；
[Product]维度包含[All Products]，[Manufacturer]，[Brand]，[Prodid]四个级别；
[Time]维度包含[All Time]，[Year]，[Quarter]，[Month]，[Day]五个级别；
[Customer]维度包含[All Customers]，[State]，[City]，[Custid]四个级别；
[Payment Method]维度包含[All Payment Methods]，[Payment Method]两个级别。

其中，大部分维度都有一个对应的维度表，除了两个地方：[Product]维度是一个雪花维度，它会把Product和Mfr两张表展开；[Payment Method]维度是一个退化的维度，直接使用事实表中的payment列作为维度属性，因此不需要一个单独的维表。

假设现在我们要对交易做一些统计，例如，某一件特定产品在某一个时间段内以某种特定方式总共卖出多少件或多少钱，这时成交产品数和成交金额是我们最终关注的内容，其他的因素例如时间、产品、方式等都只是对我们最终关注内容进行统计的限制条件。

在上面的例子中，限制条件有时间、产品类型、用户类型和交易方式，有时我们并不需要同时使用所有的限制条件，例如，当我们只想知道指定产品的成交总金额时，那么除了产品类型之外其他三个限制条件都是多余的，而在查询时，需要在整个事实表中执行查询，找出产品类型为指定类型的所有产品然后再做统计，为了提高查询效率，我们可以新建一张表，这张表按照产品类型把事实表中的行合并到一起，合并的方式是抛弃其他维，把度量值按特定的方式（max，min，sum，count或avg）整合到一起。这种表被叫做聚合表(Aggregate Table)。

3.聚合表的应用场景

事实表中的行构成了一个集合，每一维（或若干维）按照其取值的不同可以将事实表这个全集划分成若干个不相交的子集。聚合表所做的工作实际上就是把划分出的子集归为数据库表中的一行，这样做一方面可以减少数据库表的行数，另一方面也省去了查询时所需要做的一些统计工作，从而提高查询时的效率。

4. 如何在Mondrian中使用聚合表

在Mondrian应用中加入聚合表需要进行以下工作：

4.1. 定义聚合表

在Mondrian中，一张事实表可以有多张聚合表，但每个聚合表只对应一个事实表。目前Mondrian中支持两种聚合表：lost dimension和collapsed dimension。

1. lost dimension

lost dimension表示有维度完全消失的聚合表，举个例子，例如一个包含有时间、地域、产品三个维度，以及度量值sales的立方体，那么如果有一个聚合表不包含维度，那么就被称为lost dimension，这里度量sales会被聚合为所有地域下的值。一个聚合表可以把所有维度都消失掉，这个聚合表将只包含一行记录，代表所有时间、地域、产品维度下的sales总和。

fact table
    time_id
    product_id
    location_id
    measure
 
lost (location_id) dimension table
    time_id
    product_id
    measure (aggregated over location)
    fact_count
 
fully lost dimension table
    measure (aggregated over everything)
    fact_count

其中，聚合表中的fact_count列是一个附加列，表示事实表中有多少行记录被聚合到了聚合表中的这一行。

2. collapsed dimension

collapsed dimension表示有维度被退化的聚合表，所谓退化是指某个维度在聚合表中只包含了这个维度的若干级别（Level）。举个例子，时间维度下包含了day，month，quarter，year级别，而在聚合表中退化成了只包含month这个级别，那么聚合表中不会包含time_id列，而是包含month，quarter和year列。当MDX查询语句可以用到这个聚合表时，就不再查询时间维度的维表，而是直接通过聚合表查询所有有关时间的信息（month，quarter和year）。

time dimension table
    time_id
    day
    month
    quarter
    year
 
fact table
    time_id
    measure
 
collapsed dimension table
    month
    quarter
    year
    measure (aggregated to month level)
    fact_count

4.2. 数据库中创建聚合表

在创建聚合表时，只对聚合表的表名称和列名称有所要求。聚合表的名称以它所对应的事实表的名称为后缀。聚合表的名称由三部分组成：

agg_[第二部分]_[对应的事实表的名字]

其中，第二部分原则上的要求是至少包含一个字符，可以以字母、数字或下划线，但通常会用第二部分说明聚合表的类型并且对聚合表进行编号。例如，事实表的名称是customer，那么下面这些都是合法的、对应于该事实表的聚合表名：

agg_01_sales
agg_02_sales
agg_l_01_sales
agg_l_02_sales
agg_c_01_sales
agg_lc_01_sales

通常，我们会使用类似后面四个这样的聚合表名，在聚合表名的第二部分，首先是l或c或lc（分别表示包含lost dimension，collapsed dimension或者同时包含两者的聚合表），然后是一个下划线，接着后面是聚合表的数字编号。

在给聚合表的列命名时，只要使聚合表中的列名称和类型与事实表或维表中对应列的名称一致即可。除此之外，在聚合表中必须新加一列，这一列的名称会由Schema中的<AggFactCount>标签所指定（下面会有详细说明），这一列的作用是统计聚合表中一行聚合了事实表中的行的数目。

另外，聚合表还可以增加一些度量值，增加的度量值所在列的名字由度量方法（sum, max, min, avg)加下滑线再加对应的事实表中的列名字组成。例如，在上图中的事实表有一个名为units的度量值，在聚合表中如果我们想对这个值求和，那么聚合表中保存对units求和结果的列的名字就可以被命名为sum_units。更具体的内容可以参考：聚合表与事实表的表名和列名匹配规则。

聚集表必须被构建，一般来说，聚合表示非实时的，它们需要被重新构建，例如每天凌晨重新构建一次，供第二天分析。

下面是个简单的例子，这里有一张sales_fact_1997事实表：

sales_fact_1997
    product_id
    time_id
    customer_id
    promotion_id
    store_id
    store_sales
    store_cost
    unit_sales

首先我们构建一个时间维度消失了的lost dimension聚合表：

CREATE TABLE agg_l_05_sales_fact_1997 (
    product_id INTEGER NOT NULL,
    customer_id INTEGER NOT NULL,
    promotion_id INTEGER NOT NULL,
    store_id INTEGER NOT NULL,
    store_sales DECIMAL(10,4) NOT NULL,
    store_cost DECIMAL(10,4) NOT NULL,
    unit_sales DECIMAL(10,4) NOT NULL,
    fact_count INTEGER NOT NULL);
 
CREATE INDEX i_sls_97_cust_id ON agg_l_05_sales_fact_1997 (customer_id);
CREATE INDEX i_sls_97_prod_id ON agg_l_05_sales_fact_1997 (product_id);
CREATE INDEX i_sls_97_promo_id ON agg_l_05_sales_fact_1997 (promotion_id);
CREATE INDEX i_sls_97_store_id ON agg_l_05_sales_fact_1997 (store_id);
 
INSERT INTO agg_l_05_sales_fact_1997 (
    product_id,
    customer_id,
    promotion_id,
    store_id,
    store_sales,
    store_cost,
    unit_sales,
    fact_count)
SELECT
    product_id,
    customer_id,
    promotion_id,
    store_id,
    SUM(store_sales) AS store_sales,
    SUM(store_cost) AS store_cost,
    SUM(unit_sales) AS unit_sales,
    COUNT(*) AS fact_count
FROM
    sales_fact_1997
GROUP BY
    product_id,
    customer_id,
    promotion_id,
    store_id

接下来构建一个collapsed dimension聚合表，其中时间维度退化为月级别：

CREATE TABLE agg_c_14_sales_fact_1997 (
    product_id INTEGER NOT NULL,
    customer_id INTEGER NOT NULL,
    promotion_id INTEGER NOT NULL,
    store_id INTEGER NOT NULL,
    month_of_year SMALLINT(6) NOT NULL,
    quarter VARCHAR(30) NOT NULL,
    the_year SMALLINT(6) NOT NULL,
    store_sales DECIMAL(10,4) NOT NULL,
    store_cost DECIMAL(10,4) NOT NULL,
    unit_sales DECIMAL(10,4) NOT NULL,
    fact_count INTEGER NOT NULL);
 
CREATE INDEX i_sls_97_cust_id ON agg_c_14_sales_fact_1997 (customer_id);
CREATE INDEX i_sls_97_prod_id ON agg_c_14_sales_fact_1997 (product_id);
CREATE INDEX i_sls_97_promo_id ON agg_c_14_sales_fact_1997 (promotion_id);
CREATE INDEX i_sls_97_store_id ON agg_c_14_sales_fact_1997 (store_id);
 
INSERT INTO agg_c_14_sales_fact_1997 (
    product_id,
    customer_id,
    promotion_id,
    store_id,
    month_of_year,
    quarter,
    the_year,
    store_sales,
    store_cost,
    unit_sales,
    fact_count)
SELECT
    BASE.product_id,
    BASE.customer_id,
    BASE.promotion_id,
    BASE.store_id,
    DIM.month_of_year,
    DIM.quarter,
    DIM.the_year,
    SUM(BASE.store_sales) AS store_sales,
    SUM(BASE.store_cost) AS store_cost,
    SUM(BASE.unit_sales) AS unit_sales,
    COUNT(*) AS fact_count
FROM
    sales_fact_1997 AS BASE, time_by_day AS DIM
WHERE
    BASE.time_id = DIM.time_id
GROUP BY
    BASE.product_id,
    BASE.customer_id,
    BASE.promotion_id,
    BASE.store_id,
    DIM.month_of_year,
    DIM.quarter,
    DIM.the_year

4.3. 在Schema中声明聚合表

在Schema中声明聚合表时，需要把声明内容放到<table>标签中。声明聚合表时常用的标签及其含义如下：

<AggName> 和一个聚合表的声明相关的内容都放在这个标签内，并且通过这个标签的name属性，可以把这部分声明与数据库中的一个聚合表对应起来。例如，数据库中有一个聚合表的名字为：agg_l_01_sales，那么在Schema中可以这样声明这个聚合表：<AggName name=”agg_l_01_sales”> … </AggName>，其中…表示声明的其他部分，这部分由下面的一个或若干个标签组成，下面的标签都在<AggName>中使用，并且它们是平级的，不会相互出现在其他标签内。

<AggFactCount> 通过这个标签的column属性可以指定一个聚合表中用来统计每一行聚合了事实表中多少行的列的名字，例如：<AggFactCount name=”fact_count” />表示在这个聚合表中用一个名为fact_count的列来统计聚合表的一行聚合了事实表的多少行。

<AggForeignKey> 这个标签用来把事实表中的一个外键同聚合表中含义相同的标签匹配起来，例如<AggForeignKey factColumn=”product_id” aggColumn=”product_id” />表示在事实表中有一个外键product_id，而在该事实表所对应的聚合表中与它功能相同（是同一张维表的主键)的外键名字是 product_id。其中factColumn指定事实表中外键的名字，aggColumn指定聚合表中相匹配的外键的名字。

<AggLevel> 如果聚合表中的维不是一个外键，那么需要用这个标签来声明聚合表中的这一维。这里举两个例子来说明它的用法：

当聚合表中的这一维也是事实表中的一维时（例如上图中payment那一列），可以这样写：

其中name属性由两部分组成，首先是事实表的这一维在Schema中声明时的维的名称（由<Dimension>标签的name属性所指定），然后加上一个.最后再加上这一维的层次结构(Hierarchy)的名字（由<Dimension>标签内的<Hierarchy>标签的name属性所指定）即可。而column属性则是聚合表中这一列的名字，此处标签只指定聚合表中列的名字而没有指定事实表中相对应列的名字是因为Mondrian会根据列名字匹配规则自动在事实表中查找相匹配的列。

当聚合表中的这一维是维表中的一维时（例如上图中month那一列），与上一种情况写法完全相同即可，并不因为聚合表中这一列对应的是维表中的列而有所不同：

<AggMeasure> 用来声明聚合表中度量值和事实表中度量值的匹配关系，例如：

其中的name属性的写法是[Measures].后面跟上度量值在Schema中声明时所使用的名字，它由<Measure>标签中的name属性所指定。而column的值是聚合表中一列的名字。

5. 在Mondrian中使用聚合表的注意事项

5.1. 在什么情况下Mondrian会使用聚合表

当需要查询的度量值的维是一张聚合表所包含的维的子集时，这张聚合表就可能会被使用。这里说可能被使用是因为其他聚合表可能也满足使用条件，这时 Mondrian会首先选择满足条件且维数与行数之乘积最少的聚合表，如果有多张满足条件的聚合表维数相同，Mondrian会选择一个行数最少的聚合表。如果没有聚合表满足条件，Mondrian会从事实表中进行查询。详细内容参考Mondrian配置属性：mondrian.rolap.aggregates.ChooseByVolume。

5.2. Mondrian的聚合表与事实表数据同步的问题

一般来说，事实表中的数据是静态不变的，目前，Mondrian并不提供聚合表和事实表同步的机制，聚合表的数据需要自己批量导入后计算生成。

也就是说，当事实表被修改时，Mondrian不会对聚合表做相应的更改，Mondrian不提供根据事实表向聚合表中导入数据和同步数据的功能。因此，如果自己的应用场景中事实表中数据是动态变化的，就需要自己考虑如何做到事实表和聚合表的同步更新。

6. Mondrian中聚合表的例子

6.1. 第一个例子

建立一个聚合表Agg_1，结构如下图所示：

其中，

Time维度被退化，只提取year、quarter列，忽略month和day列；
Product相关的两个维度也在聚合表中被退化；
Customer维度被丢掉；
对于事实表中的每个度量列(units，dollars)，聚合表中可以有一个或多个聚合列(sum units，min units，max units，sum dollars)；
同时聚合表中还有个度量列row count，表示出现的次数。

聚合表Agg_1对应的Schema声明如下：

<Cube name="Sales">
<Table name="sales">
<AggName name="agg_1_sales">
<AggFactCount column="row count"/>
<AggMeasure name="[Measures].[Unit Sales]" column="sum units"/>
<AggMeasure name="[Measures].[Min Units]" column="min units"/>
<AggMeasure name="[Measures].[Max Units]" column="max units"/>
<AggMeasure name="[Measures].[Dollar Sales]" column="sum dollars"/>
<AggLevel name="[Time].[Year]" column="year"/>
<AggLevel name="[Time].[Quarter]" column="quarter"/>
<AggLevel name="[Product].[Mfrid]" column="mfrid"/>
<AggLevel name="[Product].[Brand]" column="brand"/>
<AggLevel name="[Product].[Prodid]" column="prodid"/>
</AggName>
</Table>
<!-- Rest of the cube definition -->
</Cube>

6.2. 第二个例子

建立一个聚合表Agg_2，结构如下图所示：

其中，

Time维度被退化为year、quarter和month级别；
Customer维度被退化为state级别；
Payment Method被退化为Payment Method级别；
Product维度保持了原始的雪花模型关系。

聚合表Agg_2对应的Schema声明如下：

<Cube name="Sales">
<Table name="sales">
<AggName name="agg_2_sales">
<AggFactCount column="row count"/>
<AggForeignKey factColumn="prodid" aggColumn="prodid"/>
<AggMeasure name="[Measures].[Unit Sales]" column="sum units"/>
<AggMeasure name="[Measures].[Min Units]" column="min units"/>
<AggMeasure name="[Measures].[Max Units]" column="max units"/>
<AggMeasure name="[Measures].[Dollar Sales]" column="sum dollars"/>
<AggLevel name="[Time].[Year]" column="year"/>
<AggLevel name="[Time].[Quarter]" column="quarter"/>
<AggLevel name="[Time].[Month]" column="month"/>
<AggLevel name="[Payment Method].[Payment Method]" column="payment"/>
<AggLevel name="[Customer].[State]" column="state"/>
</AggName>
</Table>
<Dimension name="Product">
<Hierarchy hasAll="true" primaryKey="prodid" primaryKeyTable="Product">
<Join leftKey="mfrid" rightKey="mfrid">
<Table name="Product"/>
<Table name="Mfr"/>
</Join>
<Level name="Manufacturer" table="Mfr" column="mfrid"/>
<Level name="Brand" table="Product" column="brand"/>
<Level name="Name" table="Product" column="prodid"/>
</Hierarchy>
</Dimension>
<Dimension name="Day" foreignKey="day">
<Hierarchy hasAll="true" primaryKey="day">
<Table name="Time" />
<Level name="Year" column="year" type="Numeric" uniqueMembers="true" />
<Level name="Quarter" column="quarter" uniqueMembers="false" />
<Level name="Month" column="month" type="Numeric" uniqueMembers="false" />
</Hierarchy>
</Dimension>
<Dimension name="Customer" foreignKey="custid">
<Hierarchy hasAll="true" primaryKey="custid">
<Table name="Customer" />
<Level name="City" column="city" uniqueMembers="ture" />
<Level name="State" column="state" uniqueMembers="true" />
</Hierarchy>
</Dimension>
<Dimension name="Payment method">
<Hierarchy hasAll="true">
<Level name="Payment method" column="payment" uniqueMembers="ture" />
</Hierarchy>
</Dimension>
<AggMeasure name="Unit Sales" aggregator="sum" />
<AggMeasure name="Min Units" aggregator="min" />
<AggMeasure name="Max Units" aggregator="max" />
<AggMeasure name="Dollar Sales" aggregator="sum" />
</Cube>

其中，<AggForeignKey>标签用于声明prodid列连接到维表的prodid列，其他的所有列仍然从Product和Mfr维表中获取。

7. 总结

1. 使用Mondrian做大数据量（如>100W行）的OLAP分析时，考虑是否可以使用聚合表进行优化。

2. 然而Mondrian的优化方式又不限于聚合表这一种，是否要进行聚合表优化，要根据实际情况来决定。

3. Mondrian目前并不提供对聚合表的数据同步机制，如果要做实时OLAP，需要自己实现聚合表和事实表中的数据同步。

8. 参考资料

1. Mondiran在线文档

2. Mondiran Technical Guide

你可能感兴趣的:(mondrian)

深入解析Pentaho源代码：架构、设计与实践 openbiox
本文还有配套的精品资源，点击获取简介：Pentaho是一个开源的商业智能平台，包含数据集成、报表、分析和数据可视化等多功能模块。本文深入分析了Pentaho的源代码，详述了其核心架构和模块，如数据集成引擎Kettle，报表设计工具PRD，MondrianOLAP服务器，以及数据可视化BIServer的实现和设计模式。此外，还探讨了插件机制、分布式架构、安全性、持续集成与测试，以及Pentaho社区
mondrian+jpivot源码导入eclipse并配置数据源郎岳樟 eclipse jdbc access string servlet 数据库
导入mondrian源码步骤如下:1)下载mondrian-3.0.0.10550和jpivot1.8.0,mondrian-3.0.0以后的版本和jpivot的源码整合不到一起.jpivot好久没更新了!!!!下载地址:http://mondrian.pentaho.com/2)在eclipse里新建个web工程,命名mondrian.3)解压mondrian-3.0.0.10550/mondr
皮特•蒙德里安想瘦的胖砸
彼埃·蒙德里安（英文：PietCorneliesMondrian，1872年3月7日-1944年2月1日），荷兰画家，风格派运动幕后艺术家和非具象绘画的创始者之一，对后世的建筑、设计等影响很大。蒙德里安是几何抽象画派的先驱，以几何图形为绘画的基本元素，与德士堡等创立了“风格派”，提倡自己的艺术“新造型主义”。他还认为艺术应根本脱离自然的外在形式，以表现抽象精神为目的，追求人与神统一的绝对境界，也就
海牙市立博物馆-荷兰海牙-20180106 英天
我们于2018年1月6日参观了荷兰海牙省的海牙市立博物馆，内有大量荷兰现代派大师蒙德里安（Mondrian）的作品。爬行又像是婴儿，又像是猴子，是讲人怎样一步步进化的吗？海边海牙边的建筑，浑然天成海天一色顿感大自然的廖远宽阔壮大，海天一色的美景令人赞叹。海上冲帆好酷啊！摩天轮内部摩天轮上的夜景博物馆口奇怪的建筑萌萌哒猫头鹰穿山甲猴子的飞吻点歌机我们端详了好久都没想到是什么，后来才看明白，原来是点歌
在Java Web项目中引入Mondrian多维分析框架不知道方向只知道前行 java 大数据 MDX Mondrian框架 java
本文完全转载自：http://www.linuxidc.com/Linux/2014-09/107008.htm我也是初学，为了方便以后查看，所以转到自己博客上了。----------------------------------------------------------------------------------一，Mondrian简介Mondrian是一个开源项目，一个用Java写
彼埃·蒙德里安爱吃草莓的乖兔子
皮特·科内利斯·蒙德里安（英文：PietCorneliesMondrian，1872年3月7日－1944年2月1日），荷兰画家，风格派运动幕后艺术家和非具象绘画的创始者之一，对后世的建筑、设计等影响很大。蒙德里安是几何抽象画派的先驱，以几何图形为绘画的基本元素，与杜斯堡等创立了“风格派”，提倡自己的艺术“新造型主义”。他还认为艺术应根本脱离自然的外在形式，以表现抽象精神为目的，追求人与神统一的绝对
kylin套_Kylin正式发布：面向大数据的终极OLAP引擎方案 weixin_39842744 kylin套
《走近OLAP引擎--ApacheKylin》1、OLAP简介联机分析处理Molap百度百科tableauMondrian2、Kylin非常好的学习博客OLAP引擎——Kylin介绍3、Kylin基本常识Kylin百度百科Kylin正式发布：面向大数据的终极OLAP引擎方案大数据分析界的“神兽”ApacheKylin有多牛？渣外有渣之大数据OLAP平台KYLIN1.5.3(一)2019独角兽企业重
将您的SQL Server工作负载迁移到PostgreSQL –第3部分寒冰屋数据库 SQL Server PostgreSQL 迁移
目录实际迁移入门模式迁移迁移工具免费/开源工具ETL工具手动迁移模式数据迁移开源工具ETL工具手动迁移数据ETL/ELT注意事项TalendPentaho报表平台JasperReportsBIRTPentaho报表OLAP（分析）平台PentahoMondrianApacheKylin调度选项应用程序/服务迁移技术堆栈/组件/驱动程序（Java，.NET驱动程序）Java应用程序.NET应用程序实
2018-10-30 YAMI_1d00
PreparationSystemRequirementJava1.7orhigherMondrian(recommended)oranyotherXMLAbasedOLAPserverwhichissupportedbyOlap4J.MavenProjectSetupIfyou'reusingMaven,updateyourpom.xmlasbelow:4.0.0some-projectsome
MDX&Mondrian介绍迷雾总会解大数据数据库大数据 OLAP
文章目录MDXMDX数据库基本概念维度(Dimensions)、级别(Levels)、成员(Members)和度量值(Measures)轴维度和切片器维度单元(Cell)、元组(Tuple)和集合(Set)基本语法MDX与SQL的区别维度成员成员范围全部成员下级成员成员属性集合操作NONEMPTYCROSSJOINFILTERORDER计算成员命名集合主要函数Mondrian介绍表现层(thepr
etl-bigdata NEO_X
从本文开始，将开始介绍针对大数据平台的ETL方法，并搭建相关的环境，构建两种数据仓库模型。更多信息查看:https://blue-shadow.top开源方案–Mondrian+其他的开源数据库商业方案–SQLServer等其他商业数据库大数据方案–Hadoop大数据环境其中会涉及到不同方案中使用的ETL工具，但以大数据平台为主，调度处理通过编写Python脚本执行。涉及两种数据仓库模型：多维分析
转租 - 草稿杰妈_5415
因本人有事回国，现有2居室公寓转租。公寓就在学校旁边的小区，环境安静，阳光充足双阳台，有一储物间可以放很多东西。赠送3次空调清洗，如需要转网可赠送2月网费。地址:21woodleighclose#12-04parcMondrian图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图
巴黎歌剧院: «Agon»和«Grand Miroir» 病没友
«Agon»(图1-3)这是我第一次观看Balanchine的这部作品。剧目被分成数个小段。除了第一段和最后一段为群舞外，其它小段都只有两三位舞者。Stravinsky的音乐对编舞来说是一个巨大的挑战。无布景和简单的着装，将观众的注意力完全集中在舞者的动作上。形式语言完全成为主导。简介封面甚至渗透了Mondrian的作品~整部作品像是一部高难度舞蹈研习生练级必修课。看似简单的编舞其实要求舞者必须要
olap mysql_MySQL与OLAP：分析型SQL查询最佳实践探索探索者19 olap mysql
搞点多维分析，糙快猛的解决方式就是使用ROLAP(关系型OLAP)了。数据经维度建模后存储在MySQL，ROLAP引擎(比方开源的Mondrian)负责将OLAP请求转化为SQL语句提交给数据库。OLAP计算分析功能导致MySQL须要进行较多复杂SQL查询，性能调优不可缺少，本文总结了一些有用原则。OLAP特点OLAP的典型应用包含复杂动态报表，须要支持钻取(上卷和下钻)、切片、切块和旋转操作。下
标签再使用时总是报错 piaoxue820 java编程
2013-9-29问题：标签再使用时总是报错。当我运行mondrian的demo时没有问题，自己想照着写一个的时候，放到tomcat下运行，就会报错！！解决办法：1。改为2.添加对应的jar文件：缺少jstl.jarstandard.jar两个包
saiku的简单配置及使用柏树id 项目
一saiku的配置及使用1saiku主要页面介绍2saiku配置步骤3数据查询的简单使用示例4saiku相关博客资料推荐一、saiku的配置及使用Saiku提供了一个多维分析的用户操作界面，可以通过简单拖拉拽的方式迅速生成报表。Saiku的主要工作是根据事先配置好的schema，将用户的操作转化成MDX语句提供给Mondrian引擎执行1.1saiku主要页面介绍1，2，3不同三个主要界面（查询页
springboot 中使用devtools导致的类型转换异常，RestartClassLoader，AppClassLoader。loader constraint violation 苏小演后台 java
我的报错是这样的：java.lang.LinkageError:loaderconstraintviolation:whenresolvingmethod"mondrian.parser.MdxParserImpl.(Lmondrian/parser/MdxParserValidator$QueryPartFactory;Lmondrian/server/Statement;Ljava/lang/
快捷下载 sourceForge下的资源 weixin_34378922
一些开源项目通常会放在sourceforge.net下面发布。然而，这个网站有时候出现卡顿，并且需要点击几次页面才能下载到自己想要的资源。这里有个好办法，一步列出所有可下载的资源：sourceforge网站链接快捷下载链接https://sourceforge.net/projects/mondrian/改成https://qa.debian.org/watch/sf.php/mondrian/h
Saiku Mondrian Schema雪花模型写法 freud.wy saiku
现在的场景是fact表为t_line_query(记录每条线路被查询的次数),维度表为t_lines(记录所有的线路),t_cities（所有的城市表）t_line_query外键line_id连接t_lines的主键id,t_lines的外键city_id连接t_cities主键id，整个维度分为3个level：city,lineName,direction正确的写法如下：
Mondrian Schema设计教程 sgmcumt OLAP
文章目录1什么是模式？2模式文件(Schemafiles)2.1注释3逻辑模型(Logicalmodel)3.1多维数据集(cube)3.2度量（Measures）3.3维度(Dimensions)，层次结构(Hierarchies)，级别(levels)3.3.1将维和层次映射到表上(Mappingdimensionsandhierarchiesontotables)3.3.2'all'成员（T
关于树与思维导图的联想慢魚爱立刻
本文为接续《让思维不再阻碍你的创意及梦想》的“器”篇，期望能透过思维导图这个工具让梦想落地。对后世建筑及设计影响巨大的荷兰画家彼埃·蒙德里安PietCorneliesMondrian，最有名的就是树系列油画：比之第一张的画家看见世界外貌，最后一张把树抽离成黑色(线条)/白色(光线)/三原色(蓝红黄)，纯净无噪声，表达出树的本质。我觉得这是好的思维导图该追求的境界。先发散想法，然后用现实的眼光审视、
MONDRIAN支持的常用mysql函数仔仔1993 mondrian
数值函数MAXCaclulatedmember实现MINCaclulatedmember实现AVGCaclulatedmember实现SUMCaclulatedmember实现PERCENT（分解为toppercent,bootompercent）采用Namedset实现字符串函数CONCAT（ColumnDefs）实现，然后放在维度中UPPERLOWERTRIMLENGTH时间函数DATE_AD
不同数据库之间的数据复制使用ETL来实现? yawooh
也许ETL对主从复制的实时性要求不高？如果将来打造一套BI系统：1.数据源包括txt文件和SQLServer2005结构化数据并存2.用ETL工具比如kettle抽取数据到PostgreSQL做数据仓库3.将PostgreSQL数据库集群（或进一步实现主从复制）来提高容错和并发处理能力4.在其上架设OLAP服务器如Mondrian5.在OLAP客户端使用报表工具如JPivot,BIRT等进行展现其
Mondrian中聚合表的应用 weixin_34348805
最近在项目中使用了开源OLAP引擎——Mondrian实现一个多维分析系统，在项目后期系统优化阶段使用了Mondrian中的聚合表机制。这里结合Mondrian官方资料和个人使用经验，对Mondrian中聚合表的概念、应用场景、如何使用、注意事项等内容做一个总结。1.OLAP相关概念Mondrian是一个基于Java语言的开源OLAP引擎，它通过MDX语句执行查询，从关系型数据库RDBMS中读取数
kylin介绍 youbo_sun 大数据技术
转载：http://www.mamicode.com/info-detail-1015006.htmlKylin是ebay开发的一套OLAP系统，与Mondrian不同的是，它是一个MOLAP系统，主要用于支持大数据生态圈的数据分析业务，它主要是通过预计算的方式将用户设定的多维立方体缓存到HBase中（目前还仅支持hbase），这段时间对mondrian和kylin都进行了使用，发现这两个系统是时
MDX相关语法 Rocky-Young BI 人工智能 MDX
MDX（MultidimensionalExpressions）是多维数据库（OLAP数据库）的查询语言.Mondrian会解析MDX，转换成SQL来查询关系数据库（可能是多条查询）。MDX的内容很多，功能强大，这里只介绍最基础和最重要的部分。1基本语法以下是里两条MDX查询语句及其查询结果ð语句1：SELECT{[Measures].[DollarSales],[Measures].[UnitS
15 MDX samples of foodmart yifan268 MDX
在pentaho中国社区中看到有关mdx的15个例子，然后参照例子在mondrian-2.4.2.9831中测试，发现有些例子运行不了，现在整理如下：3、4、9,10中使用冒号“:”标识符测试没有通过，现在冒号使用还有bug，http://sourceforge.net/tracker/index.php?func=detail&aid=1751352&group_id=35302&atid=41
MySQL与OLAP：分析型SQL查询最佳实践探索 _猪头饼_ NoSQL&SQL DB ~MySQL
搞点多维分析，糙快猛的解决方案就是使用ROLAP（关系型OLAP）了。数据经维度建模后存储在MySQL，ROLAP引擎（比如开源的Mondrian）负责将OLAP请求转化为SQL语句提交给数据库。OLAP计算分析功能导致MySQL需要进行较多复杂SQL查询，性能调优必不可少，本文总结了一些实用原则。OLAP特点OLAP的典型应用包括复杂动态报表，需要支持钻取（上卷和下钻）、切片、切块和旋转操作。下
数据模式(Schema)定义 xbynet 数据
数据模式(Schema)定义Created星期一24十月2016模式（Schema）定义了一个多维数据库，它包一个含逻辑模型，并定义了逻辑模型到物理模型的映射。物理模型包含多维数据的存储方式：事实表、维表及其结构等。逻辑模型包含了用于MDX查询的结构，如数据立方体、维度、层次、成员、度量等。Mondrian使用一个XML文件来描述模式。Mondrian包含一个创建、修改模式文件的Java桌面应用s
多维数据模型总结和归纳萧萧兮24 mondrian OLAP mdx
开源OLAP引擎：Mondrian在Mondrian里面的cube是以XML的形式定义的。(MDX)Mondrian本身是不存储数据的，通过MDX语句（一个类似于SQL的查询语言）来获取数据，Mondrian运行的时候要连数据库，并且还要有一个数据模型配置文件（Mondrian叫schema），其实就是一个取数据的规则；由此可知Mondrian只不过是把MDX翻译成了SQL然后从数据库中把数据拿出
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方