阿里云大数据ACA认证考试总结

刚参加完阿里云大数据助理工程师认证(ACA)考试,趁还有点记忆,总结一下。在官网上没有找到ACA的考试大纲和样题,遂看了ACP的,结果有点误导。ACP考试大纲说maxcompute占55%,dataworks占20%,其他占25%,结果我就花了大半时间看maxcompute,但是考试一开始就全是Dataworks,而且考的很细,坑。

主要考的知识点或题目

一、分析型数据库

1.表组的概念

2.维度表和普通表(事实表)的概念、特性。例如维度表是自动生成,不能修改及删除;维度表可以与任意表关联;普通表的分区设置等。

3.如果表里的某一列被频繁查询,应该如何做

4.分析型数据库没有事务的概念,支持标准mysql协议。

5.配置maxcompute数据源的细节

6.判断:分析型数据库是基于maxcompute之上的

7.multivalue多值列的查询

二、Dataworks

1.任务图是怎么展示的

2.角色和权限。运维人员的权限:发布及线上运维

3.任务调度依赖关系

4.某个任务要执行的三个前提条件

5.多节点之间串行的任务是什么任务

6.生产环境、测试环境和开发环境的隔离与关联

因为这部分的题目我不太会,所以没记得几道。。。

三、Maxcompute

1.数据类型:bigint、string、boolean、double、datetime、edecimal

2.客户端工具。考题:有图形化界面的客户端是哪几个

3.tunnle上传下载。重点:语法格式;分区表的上传下载;列分隔符、行分隔符和转义字符分隔符

4.maxcompute使用场景,适合做数据挖掘等实时性不强的业务。

5.task和instance的概念及关系

6.创建表时as和like的区别

7.更新数据:insert into/overwrite

8.mapjoin的特点:只允许and关联的等值条件

9.内置函数。日期运算类:日期相加dateadd日期相减datediff。字符串函数:字符串连接contac的结果

10.Graph计算框架:主要用来处理网络关系数据

11.用户、角色授权。admin用户的权限。

12.项目空间保护。控制本项目内的数据能否流入别的项目,project protection开启保护,add trustproject prj2;增加信任项目。只能在本项目里授权别人,单向授权。

四、Quick BI

1.在某个场景下应该用什么图表,具体是对比两个用户的购买转化率,应该用旋风漏斗图。

2.当上传本地文件到Quick BI中展现时,数据被保存到了Quick BI自带的探索空间。

五、Datav

不记得

六、机器学习API

考了两道关于分类算法和聚类算法的题。分类算法是有监督,例如决策树、KNN、RandomForest;聚类算法是无监督,K-Means、DBSCAN。

七、其他

比如阿尔法围棋(AlphaGo)的胜利标志着什么,谷歌大数据的三驾马车等基础知识,可视化的原则等。

总的来说考的知识点比较细也比较杂,备考一是要看视频做实验,二是要看产品文档,三是有基本的大数据相关知识。再次强调一下Dataworks一定要多看。

你可能感兴趣的:(阿里云)