shopee大数据sre面经

背景

我对shopee是有一些情怀在里面的,早在17年的时候我就面试过它们的大数据岗位(base新加坡),年少轻狂的我当时没有针对性的好好复习,且项目积累的也不够,导致第二轮就被pass了。现在随着年龄的增长,我已经断了出国的念想,最终选择了深圳shopee作为此次跑路的目标公司。

前期准备

本次跳槽,我制定了一个详细的计划,从复习内容到时间把控两个方面结合起来。大体情况如下:

  1. 基础知识
    1、java基础
    2、大数据组件基础

  2. 大数据框架,项目梳理

    1、各种组件实战,技术方案实践
    2、针对自己做过的事情梳理成项目
    3、统计目前各个业务和组件的流量情况(项目以数据说话)

  3. 面试题练习
    1、网上找面试题训练

  4. 简历编写、模拟面试
    1、编写至少两份简历(架构+开发+运维)
    2、开始投递小公司面试

时间安排上:

  1. 202101 一个月时间看完所有基础
  2. 202102 半个月看完架构
  3. 202102下半月 准备简历
  4. 202103上半月 开始投递 模拟面试

具体到一天的时间,因为是在职情况,所以系统的时间只能到晚上,一般就强迫自己从21:00复习到23:30左右。

面试流程

20210301找人内推简历到shopee-->20210308一面-->20210312二面-->20210317三面-->20210324 offer沟通,然后第二天收到offer

面试内容

一面:mentor面试,以基础为主

1、kafka的rebalance过程
2、zkfc的fence机制
3、jvm内存模型以及gc算法,垃圾收集器
4、clickhouse表引擎
5、spark的stage划分
6、spark straming与flink的区别
7、通讯网络上的tcp三次握手,四次挥手
8、常见数据结构,hashmap
9、算法题,leetcode179
10、Linux的文件系统设计,以及常用命令

二面:leader面试,以项目为主

1、hdfs读写流程,yarn调度器区别以及标签功能,hive倾斜问题以及小文件优化,spark资源优化
2、集群监控报警如何做的,不同组件的报警策略是什么,报警信息是否有合并
3、数据治理怎么做的,元数据管理,数据生命周期管理以及数据质量
4、数据迁移项目担任的角色,讲下迁移背景以及采用的工具,具体实施方式是怎样,过程中遇到的问题有哪些

三面:boss面试,以工作经历为主

1、自己对哪个组件非常熟(hdfs),数据规模怎样,做了哪些优化,namenode内部结构是怎样,它的qps是多少,hdfs关注的监控指标有哪些
2、工作中处理过的事故是什么,介绍下场景,当时如何解决的,问题是如何定位的,有没有什么更好的解决方式彻底解决
3、对大数据sre的理解
4、然后boss简单介绍了下shopee的大数据团队架构,个人的成长路线等。

四面:hr面,工作经历及谈薪

简单自我介绍,各个阶段离职的原因,期望薪资,目前offer情况等。

最后就是背调了,这个阶段一般要一周左右的时间,最后就是入职了。

面试总结

总的来说,shopee的面试偏基础与自己的实际工作经历,考察范围比较广,需要掌握基本的网络知识,熟练编码能力,精通专业技能。最后祝愿所有跑路的同学们都拿到自己理想的offer!
(shopee最近很缺人哦,有想法的同学可查看:https://mp.weixin.qq.com/s?__biz=MzkzMzIzNDU0MA==&mid=2247483747&idx=1&sn=aaf8361ca6fbd47245fd0c92d274eb85&chksm=c24ed360f5395a76af2dba45e814bf5cd1d39b739deff18584753d677f96945ef7a6b552ea14&token=90945026&lang=zh_CN#rd)

你可能感兴趣的:(shopee大数据sre面经)