Kylin操作手册

在读此文章前建议读一下核心概念:

Kylin多维分析核心概念树立

1.创建项目Project;

2.导入数据

  • load hive table 通过表名导入数据;

  • load hive table from tree 可以直接选择表;

  • 最后是实时数据接入,Kafka等;

3.创建模型

  • 输入模型名称,注意模型名称在整个Kylin应用下具有唯一性,而不是只在单个项目下的唯一性;

  • 下一步的话选择维度表盒事实表,事实表是唯一的,我们选择后单击Add Lookup Table,选择维度表;然后添加四个维度表,添加维度表的时候选择连接的类型Inner还是Left,然后选择主键和外键,这里也支持多主键;

  • 选择维度和度量列,度量只能在事实表中选择,维度表在事实表和维度表中选择,一个列只能是维度或度量中的一个。这里只是选择一个范围,不代表这些列将来一定要用做Cube的维度和度量,你可以把所有可能用到的列都选进来,后续创建Cube的时候,将只能从这些列中进行选择;

  • 最后一步是为了模型补充分割时间列信息和过滤条件。如果此模型中事实表记录是按时间增长的,那么可以指定一个日期/时间列作为模型的分割时间列,从而可以让Cube按此列做增量构建,如果想做全局构建,这一步就不用填,我们选择增量构建;

  • 过滤(Filter)条件是指,如果想把一些记录忽略掉,那么这里可以设置一个过滤条件。Kylin在向Hive请求源数据的时候,会带上次过滤条件。比如要过滤掉价格小于0的列,只需要在Filter中带上条件Price > 0;

  • 最后点击Save保存即可完成模型创建;

你可能感兴趣的:(大数据挖掘与大数据应用案例)