数仓岗位常见面试问题

1.自我介绍
2.说下最近的项目,你当时负责的哪个岗位?是甲方还是乙方,就是IT部门是吧,你负责的前台处理还是后台etl的处理?
3.你主要用的一些etl工具有哪些?调度呢?自己有没有配置调度文档之类的?
4.从原系统的数据抽过来到我们数据仓库这个系统,一般分哪几种场景去抽这个数据?是每天调,还是一个月调,还是一次性调完?
5.那你在抽数的过程中有没有碰到过哪些数据问题或者性能问题?比如数据量变少,或者数据有问题,或者数据报错,或者数据类型有问题,
或者数据的维度缺失,或者数据来源为空?有没有碰到过这种问题,你怎么解决的?举个例子,描述一下细节
6.除了数据量的问题,还有没有数据的维度,或者质量,还有什么类型不匹配其他的问题?
举个例子,比如原系统的数据为varchar类型,BI这边我们可能把它设置为number类型,或者说这个数据字段有好多个来源,123个来源,不同的数据来源字符类型
可能不一样,在BI这边我可能把它固定成一个number类型,这种问题你怎么处理?统一表结构的规则是什么?规则是由谁定的?就是你要把这个数据模型统一起来,
统一起来谁说了算?
7.那你说每天抽数,还有按月抽数的,有没有碰到哪些性能问题的?就是说数据抽不过来,数据量很大这种问题有没有?
比如说每天抽过来的数据就上百万,这种数据量我觉得还是挺大的,有性能问题要怎么去处理?表分区?你一天建一个分区吗?建分区能解决性能问题吗?
之前有没有做过类似的案例?
我说做过SQL优化,他说对于抽数的优化你有没有做过?那就说说SQL优化?
8.我们写sql无非就是表对表的关联,我们写关联一般是用哪种方式是比较好的?,还是说不同场景有不同的使用方式?
9.读表的时候有哪几种方式去读表?
10.比如说有1个大表1个小表应该怎么去找?你的执行计划里面怎么去指定,有没有用hints去改变它的执行计划?
11.比如我要给这个表指定顺序,走索引还是全表,给他一个提示,有没有写过提示?
12.如果指定小表用什么?
13.怎么去读懂这个执行计划,有没有去读过这个执行计划?执行计划的分析做过没有?
14.你工作5年了,前面几年做的测试,讲一下你当时做测试岗位工作内容的理解,包括个人收获和体会?
15.那你觉得你在测试的过程中起到了什么主要的作用?
16.那你觉得一个测试和开发关系是怎么样的
17.如果要提高我们的测试质量你觉得应该从哪些方面去做改善?
18.从原系统抽数到BI仓库主要做了哪些数据的加工处理?就是你要把这个数据拿过来做分析系统,原系统已经有数据了为什么不在原系统做而把它抽过来做.
最主要的区别就是我们在BI系统做了哪些数据的加工处理?做了哪些逻辑指标的加工?你主要的etl逻辑,IT手段?
18.这个(ODS-DW)只是一个大的粗的过程,能不能具体详细点?比如说对数据做了什么处理?比如数据过来1个a,出去是1个b,a到b做了哪些具体的处理?
19.那你算指标,原系统有指标,我们数据仓库也有指标,你的指标是怎么来的?通过什么方式把它算出来的?比如设备收入这个指标怎么得出来的?通过我们什么IT
方法把它加工出来?
19.那你当时从测试转开发,还有从甲方转乙方,这种岗位的变化你是怎么想的怎么考虑的?
20.你未来个人的期望是什么样的?
21.简单讲一下你做存储过程开发的一些经验总结吧?或者你当时做的一个存储过程你是怎么做的?从头到尾是怎么开发的?
比如说里面用到的游标具体怎么写?
22.表分区有哪几种?你用过的最熟练的是哪个?有没有建过组合分区?比如你要把分区的数据删除掉sql怎么写?
23.说说你在项目中怎么和同事合作沟通的?
23.如果要提高我们的工作质量,你觉得作为IT人员哪几个能力是比较重要的?
24.你自己性格怎么样?
25.你现在离职是吧?讲下你离职的原因?
26.华为的项目你了解吗?
27.你期望的工作环境是怎么样的?
28.你期望的薪资多少?

你可能感兴趣的:(SQL,Hive)