我们kylin环境安装成功之后,我们就可以在hive当中创建数据库以及数据库表,然后通过kylin来实现数据的查询
第一步:创建hive数据库以及表并加载以下数据
将以上两份文件上传到node03服务器的/kkb/install路径下,然后执行以下命令,创建hive数据库以及数据库表,并加载数据
cd /kkb/install/hive-1.1.0-cdh5.14.2/
bin/beeline
创建数据库并使用该数据库
create database kylin_hive;
use kylin_hive;
(1)创建部门表
create external table if not exists kylin_hive.dept(
deptno int,
dname string,
loc int )
row format delimited fields terminated by '\t';
(2)创建员工表
create external table if not exists kylin_hive.emp(
empno int,
ename string,
job string,
mgr int,
hiredate string,
sal double,
comm double,
deptno int)
row format delimited fields terminated by '\t';
(3)查看创建的表
jdbc:hive2://node03:10000> show tables;
OK
tab_name
dept
emp
(4)向外部表中导入数据导入数据
load data local inpath '/kkb/install/dept.txt' into table kylin_hive.dept;
load data local inpath '/kkb/install/emp.txt' into table kylin_hive.emp;
查询结果
jdbc:hive2://node03:10000> select * from emp;
jdbc:hive2://node03:10000> select * from dept;
第二步:访问kylin浏览器界面,并创建project
直接在浏览器界面访问
http://node02:8066/kylin/login 并登录kylin,用户名 ADMIN,密码KYLIN
点击页面 + 号,来创建工程
输入工程名称以及工程描述
为工程添加数据源
添加数据源表
第三步:为kylin添加models
1、回到models页面
2、添加new models
3、填写model name之后,继续下一步
4、选择事实表
这里就选择emp作为事实表
5、添加维度表
添加我们的DEPT作为维度表,并选择我们的join方式,以及join连接字段
6、选择聚合维度信息
7、选择度量信息
8、添加分区信息及过滤条件之后“Save”
第四步:通过kylin来构建cube
前面我们已经创建了project和我们的models,接下来我们就来构建我们的cube
1、页面添加,创建一个new cube
2、选择我们的model以及cube name
3、添加我们的自定义维度
4、添加统计维度
5、设置多个分区cube合并信息
因为我们这里是全量统计,不涉及多个分区cube进行合并,所以不用设置历史多个cube进行合并
6、高级设置
高级设置我们这里暂时也不做任何设置,后续再单独详细讲解
7、额外的其他的配置属性,这里也暂时不做配置
8、完成,保存配置