2021年大厂业务运维面试题

应用运维面试之路(2021.3.15-2021.6.2)

一、恒大面试

3月15日 19:30-20:00 电话面试 业务运维

1.redis怎么保证高可用和高扩展,怎么扩展的

2.业务流程是怎么样的

二、shoppee 大数据运维面试

3月16日 18:00-19:00 视频面试

1.inode节点了解吗?

2.怎么保证联合索引的有效性

3.kafka怎么保证消息不丢失

4.MySQL的innodb和mysiam存储引擎有什么区别

5.求uid<800的所有uid之和

6.MySQL怎么查询慢请求

7.redis的持久化存储,高可用架构

8.zookeeper有多少种节点和数据类型

三、众安SRE面试

3月17日 10:30-12:30 现场面试,一面和二面

1.kafka怎么保证消息的可靠性

2.kafka了解多少,遇到哪些故障,怎么解决的?

3.zookeeper了解多少,怎么选举的

4.A应用访问B应用,偶尔出现超时,该怎么排查

5.假如业务在一个时间段内下降了,该怎么去排查

6.服务器负载高,该怎么排查,是什么原因导致的

7.服务器流量突然飙高,该怎么排查

8.TCP的四次挥手,为甚要有timewait

9.tcpdump抓包,该怎么从300个包中过滤一个超时的包

10.k8s熟悉么?kupe_proxy网络代理,iptables和ipvs有什么区别?iptables有什么缺点,k8s解决过什么故障

11.timewait过多有什么影响?怎么去优化

12.服务器初始化是怎么做的?做了哪些优化

13.怎么用netstat去获取每种连接状态的个数

14.http和https了解吗

15.怎么判断是哪个进程占用的IO高,用什么命令(iotop)

16.zabbix server的配置是多大

四、顺丰面试

面试官很挫,我都怼了他

五、联想监控方案设计师面试

4月7日 19:00-20:00  现场面试

面试官说话都是中英混杂,有些都没有听懂,当时说还可以,后面委婉地说需要总监面试,结果总监太忙没有打电话过来,就是不合适吧

1.redis有多少个数据库

2.promethues用的什么数据库,promethues的联邦模式

3.shell有哪些变量

4.PG数据库的模式

六、shopeeSRE面试

4月12日 19:30-20:40  视频面试

个人感受:问了很多很底层的主机相关的知识

1.TCP的四次挥手过程以及状态转换,timewait为什么会存在

2.ping用的什么协议,在第几层,包是否会一直存在,超时时间设置为多久,在哪里设置

3.UDP的客户端IP是否可以记录到,为什么?

4.开启SNAT,是否可以记录到源客户端的IP

5.redis有哪些架构,主从的话,主宕机了,会怎么样?cluster是怎么分片的,怎么知道放到哪一个节点里面

6.zabbix有哪几种模式,用的什么模式,主动模式是怎么样的?确定是主动发送数据给server吗?(主动模式是客户端主动请求建立连接,然后主动采取数据,并返回给server)

7.zabbix和promethues有什么区别

8.游戏玩家上传的故障报告是怎么生成的?怎么去分析?怎么知道玩家的IP

9.ansible用来做什么?怎么通信的?

10.系统负载表示什么?内存不足会导致系统负载高吗?CPU使用率80%代表什么?

11.buffer和cache是什么,有什么区别?大小设置为多大?多久写入磁盘一次

12.代码题

七、vivo业务视频面试

4月15日 19:30-20:50   视频面试

个人感觉:去年下半年面试过他们公司,他说我的职业规划有变,对业务不是很熟悉,基础知识要加强。聊的都是做过的业务,有没有做过容灾演练,应急预案等等

八、腾讯游戏运维面试

中午电话面试一个小时

个人感受:给了我很多建议,让我突出自己的优势,怎么去准备准备

优势:1.对监控比较了解,2.对应用流程比较熟悉,3.和业务沟通比较擅长

建议:1.讲出自己的优势,2.把自己负责的项目工作写下来,3.准备shell基础知识(笔试)

1.标准输入、标准输出和标准错误3个文件描述符分别是什么

2.后台运行的命令是什么

3.shell参数的个数用什么变量,怎么表示上一个运行的结果?两个数字相加,用什么

4.playbook,下一个任务怎么获取上一个任务的值  (register,注册变量)

5.dockerfile 用哪些命令?ADD和COPY的区别

6.pod的生命周期是怎么样?哪些会用得到pod的运行状态

7.查看进程的子进程号用什么命令

8.top查看内存、cpu用什么快捷键

9.打开网页慢怎么去排查

10.ping和traceroute 的原理,ping不通怎么排查,是什么原因导致的

11.服务器初始化会做什么工作?安全会做什么工作

12.开服、合服的流程

13.云平台有和什么工具平台联合

14.磁盘告警怎么添加监控和处理

九、货拉拉面试

4月20日  19:30-20:10  视频面试

4月27日   20:10-20:50  二面总监面试

4月28日 15:00-15:30 HR面

个人感受:面试官给了我很多建议,很是收益,刚好他之前也是科技的同事,果然有熟人关系就是方便办事,人际关系还是很重要的

1.面试自我介绍,说重点和亮点,创新的地方,解决了什么问题,为公司带来了什么效益

2.解决过哪些故障,怎么解决的,具体步骤和流程,就算自己没有解决过,也可以去网上找找,记下来,就变成自己的

3.一定要把话题引导到自己擅长上来,不要被面试官牵着走,面试都是双向的。

4.如何提升运维的效率(工具,流程,技术),标准化,自动化,流程化,智能化

5.如何提升运维的稳定性,双活怎么做,容灾怎么做,高可用怎么做

6.timewait 和closewait ,为什么会出现,怎么解决

7.半连接状态 SYN_RCVD

十、oppo面试

4月26日 19:30-20:45  视频面试

个人感受:刚好讲了自己想往项目管理方面发展,他们也需要这样的人,就聊了很久,可以继续下面的面试

1.shell脚本有没有用过锁,就是在你运行时,别人没法运行(flock)

2.python脚本怎么获取第一个参数

3.k8s的网络

4.raid卡    

5.从文本中提取出所有的IP地址

6.lvs的三种模式以及优缺点

二面 19:30-20:45  

主要是往项目管理方面去问了,制作运营流程等等,让我很是答不上来,有点压力面试的感觉,怀疑人生。

1.你做过什么项目?充当的职责是什么?难点在哪里?是怎么解决的

2.数据库双活,在不同机房怎么保证数据的一致性

3.本来承受的是100IOPS,忽然来了1万IOPS,该怎么使之做到业务影响最小

4.应急演练做过哪些?hotkey怎么去实现,具体的演练方案不是你来制定的吗

5.压测方案是你做的吗?需要注意哪些

6.怎么保证系统的稳定性

7.你的监控做的怎么样?怎么评估监控是否做的好

8.让你去一个新公司制作一个运营规范流程,你怎么做,难点在哪?怎么保证落地

9.你的职业规划是?

十一、腾讯游戏面试

5月27日 电话面试

1.灾备怎么做的

2.负载均衡

3.遇到哪些故障,怎么解决的

4.安全工作做过哪些,阿里云上用了哪些产品?

十二、akulaku面试

5月31日  19:00-19:40  现场20分钟笔试,加20分钟面试

1.写一个检测192.168.1.0/24网段所有存活主机的脚本

2.zabbix和prometheus的区别

3.遇到监控数据大,性能受影响的情况吗?怎么解决的?

4.ELK的组成以及功能

5.zabbix用python发送微信告警的伪代码

6.ansible怎么确保tasks在这一台执行完成后,再在另外一台执行,怎么确保顺序执行?当有一台的环境变量不满足时,该怎么执行?怎么确保当前面一个任务执行成功后才能执行下一个任务?下一个任务怎么引用上一个任务的结果

7.prometheus是怎么发送告警的,alertmanager是怎么配置的?grafana是怎么权限控制的

8.nginx是怎么把URL转发到具体服务器的路劲下,upstream是怎么配置的

9.监控数据采集的原理

十三、字节跳动-飞书面试

6月2日 21:00-22:00  视频面试

个人感受:面试的是一个女生,感觉和我的年纪相仿,很有耐心。问的都是很基础的原理题,需要对操作系统非常熟悉,nginx非常熟悉,可是我有很多没有回答出来,哎

1.查看目前操作系统的登录用户命令(w , who ,users )

2.http和https的区别,证书签发的流程,私钥是存在什么地方?每次都需要认证吗?

3.nginx访问日志,写一个统计一个时间段内,每一分钟有多少个IP访问的shell脚本怎么写?

4.nginx的location匹配顺序是怎么样的?rewrite转发到uptream和直接在proxy_pass转发到ups他ream有什么区别?限制同一个IP一分钟只能访问3次该怎么配置?(限流)

5.查看有哪些端口占用

6.有哪些TCP的连接状态

7.TCP的timewait  closewait  ,MSL,包的往返时间是多少(默认两分钟,实际可以配置为30s,1m,2m,可以通过/proc/sys/net/ipv4/tcp_fin_timeout 来设置)

8.主机重启了,怎么配置服务开机自启

9./etc/rc.local是做什么的

10.开机的几种模式(0-6 )

11.java出现故障了怎么解决?jstatck ,jmap  arthas 

12.该怎么去梳理业务的上下游,在访问量很少的情况下,一天可能就几笔

13.常用http状态码

14zabbix的提前预测功能用到了什么算法

你可能感兴趣的:(2021年大厂业务运维面试题)