面试官告诉你:大数据究竟该怎么学

如何提高自己的实习期产出,快速在实习期有表现?

语兴回答

  1. 先熟悉业务可以跟mentor沟通也可以找下游业务去问,也可以从app使用中理解,如果觉得还是慢,就直接看dwd 数据表去快速了解。

  2. 开发流程也要了解 ,包括平台使用和开发规范等。

  3. 以上内容做完去尝试做一些添加字段需求,结合1 2更好了解业务和表结构。

  4. 实习生没啥产出,能做的更多是简单数据域模型,加字段,任务调优等,将mentor布置的活干完就行,再到转正前把内容稍微润色一下即可(实习生没有绩效,对于实习生来说产出可有可无)

面试官告诉你:大数据究竟该怎么学_第1张图片

业务人员让干啥就干啥,有时候感觉自己就是个提数机器?如何在数仓侧创造出有业务价值的指标?

语兴回答

数仓更多都是满足业务需求,可以从业务角度辅助分析,由于局限性自己做的指标不一定能符合业务需要,所以这里不建议自己造,除非跟业务确认,但也出力不讨好,对于所有同学工作来说,很多人日常都是提数机器,给业务查需求,如果想创造数仓侧自己的价值,可以把之前收集的零散查数需求做成数据资产,未来可以复用,同时也充实自己的指标库。

面试官告诉你:大数据究竟该怎么学_第2张图片

如果想往大数据平台开发方向转,还需要学习哪些东西?

超哥回答

首先要确定平台的方向:数据中台

大的方面:平台侧 引擎侧

平台侧又分

  1. 权限管控
  2. 运维告警
  3. 后端接口开发

引擎侧又分

  1. 数据集成引擎
  2. 数据湖引擎

从中台的不同组件部分又分这么几个方向:

  1. 数据集成
  2. 调度
  3. 数据资产
  4. 数据地图
  5. 数据质量
  6. 数据开发

总体来说做中台方向涉及到技术栈比较杂,跟传统后端开发中的全栈类似,俗称全干工程师,一般技术栈要求如下:

  1. Java精通
  2. 微服务开发经验(SpringBoot SpringCloud…)
  3. Hadoop生态全家桶 (HDFS Yarn Hive HBase…)
  4. 分布式计算框架经验 (Flink Spark…)

具体情况具体分析,根据你个人擅长的维度去选一个自己感兴趣的方向,以上的并不一定要全会,但得在某个方向上有自己的理解和建树,比如你想做调度,那你懂Airflow DolphinScheduler就可以,想做集成懂DataX SeaTunnel FlinkX就可以,想做这个方向,得懂一些框架源码+会设计和写微服务接口,能做到这些基本上随便转。

面试官告诉你:大数据究竟该怎么学_第3张图片

你可能感兴趣的:(大数据,程序人生,面试,实习产出,大数据学习)