六十四、Kylin的初体验

上一篇文章我们介绍了Kylin以及Kylin的安装,本文我们通过一个简单的例子来初探一下Kylin的使用。关注专栏《破茧成蝶——大数据篇》,查看更多相关的内容~


目录

一、需求分析

二、数据准备

三、创建Kylin项目

3.1 登录系统

3.2 创建项目

3.3 选择数据源

3.4 创建Model

3.5 创建Cube


一、需求分析

需求:现有员工信息和部门信息两个文件,实现按照部门统计员工工资。

二、数据准备

1、将数据文件上传到服务器中,其目录与数据大体如下图所示:

六十四、Kylin的初体验_第1张图片

2、在Hive中创建表

(1)创建dept表并加载数据

create external table if not exists xzw.dept(
dept_no int,
dept_name string,
loc int
)
row format delimited fields terminated by '\t';



load data local inpath '/root/files/dept.txt' into table xzw.dept;

(2)创建emp表并加载数据

create external table if not exists xzw.emp(
emp_no int,
emp_name string,
job string,
mgr int,
hiredate string, 
sal double, 
comm double,
dept_no int)
row format delimited fields terminated by '\t';


load data local inpath '/root/files/emp.txt' into table xzw.emp;

(3)查看表数据

六十四、Kylin的初体验_第2张图片

三、创建Kylin项目

3.1 登录系统

输入下面的网址打开Kylin:

http://master:7070/kylin

登录系统:

六十四、Kylin的初体验_第3张图片

3.2 创建项目

1、点击“+”创建新的项目:

六十四、Kylin的初体验_第4张图片

2、填写项目名称和项目描述,点击提交进行项目创建:

六十四、Kylin的初体验_第5张图片

3.3 选择数据源

1、选择加载数据源的方式

六十四、Kylin的初体验_第6张图片

2、选择要同步的表,点击同步

六十四、Kylin的初体验_第7张图片

3.4 创建Model

1、创建一个New Model

六十四、Kylin的初体验_第8张图片

2、添加Model名称和描述点击Next

六十四、Kylin的初体验_第9张图片

3、选择事实表

六十四、Kylin的初体验_第10张图片

4、添加维度表

六十四、Kylin的初体验_第11张图片

5、选择添加的维度表及join字段

六十四、Kylin的初体验_第12张图片

6、添加维度信息

六十四、Kylin的初体验_第13张图片

7、选择度量信息

六十四、Kylin的初体验_第14张图片

8、添加分区信息和过滤信息后选择保存。这里因为是初体验,所以这两种信息暂时先不选

六十四、Kylin的初体验_第15张图片

9、Model创建完成

六十四、Kylin的初体验_第16张图片

3.5 创建Cube

1、点击New选择New Cube

六十四、Kylin的初体验_第17张图片

2、选择Model并填写Cube的名称,点击Next

六十四、Kylin的初体验_第18张图片

3、添加维度

六十四、Kylin的初体验_第19张图片

4、选择维度

六十四、Kylin的初体验_第20张图片

5、添加需要预计算的内容

六十四、Kylin的初体验_第21张图片

6、因为本文是初探,下面的设置暂时选择默认,一直点击Next直至完成Cube的创建即可。

六十四、Kylin的初体验_第22张图片

7、触发预算

六十四、Kylin的初体验_第23张图片

8、点击Monitor查看Build进度

六十四、Kylin的初体验_第24张图片

9、构建完成

六十四、Kylin的初体验_第25张图片

10、点击Insight查询测试

六十四、Kylin的初体验_第26张图片

 

以上就是本文的所有内容,比较简单。你们在此过程中遇到了什么问题,欢迎留言,让我看看你们都遇到了哪些问题~

你可能感兴趣的:(破茧成蝶——大数据篇,大数据,kylin)