应用运维面试之路(2021.3.15-2021.6.2)
一、恒大面试
3月15日 19:30-20:00 电话面试 业务运维
1.redis怎么保证高可用和高扩展,怎么扩展的
2.业务流程是怎么样的
二、shoppee 大数据运维面试
3月16日 18:00-19:00 视频面试
1.inode节点了解吗?
2.怎么保证联合索引的有效性
3.kafka怎么保证消息不丢失
4.MySQL的innodb和mysiam存储引擎有什么区别
5.求uid<800的所有uid之和
6.MySQL怎么查询慢请求
7.redis的持久化存储,高可用架构
8.zookeeper有多少种节点和数据类型
三、众安SRE面试
3月17日 10:30-12:30 现场面试,一面和二面
1.kafka怎么保证消息的可靠性
2.kafka了解多少,遇到哪些故障,怎么解决的?
3.zookeeper了解多少,怎么选举的
4.A应用访问B应用,偶尔出现超时,该怎么排查
5.假如业务在一个时间段内下降了,该怎么去排查
6.服务器负载高,该怎么排查,是什么原因导致的
7.服务器流量突然飙高,该怎么排查
8.TCP的四次挥手,为甚要有timewait
9.tcpdump抓包,该怎么从300个包中过滤一个超时的包
10.k8s熟悉么?kupe_proxy网络代理,iptables和ipvs有什么区别?iptables有什么缺点,k8s解决过什么故障
11.timewait过多有什么影响?怎么去优化
12.服务器初始化是怎么做的?做了哪些优化
13.怎么用netstat去获取每种连接状态的个数
14.http和https了解吗
15.怎么判断是哪个进程占用的IO高,用什么命令(iotop)
16.zabbix server的配置是多大
四、顺丰面试
面试官很挫,我都怼了他
五、联想监控方案设计师面试
4月7日 19:00-20:00 现场面试
面试官说话都是中英混杂,有些都没有听懂,当时说还可以,后面委婉地说需要总监面试,结果总监太忙没有打电话过来,就是不合适吧
1.redis有多少个数据库
2.promethues用的什么数据库,promethues的联邦模式
3.shell有哪些变量
4.PG数据库的模式
六、shopeeSRE面试
4月12日 19:30-20:40 视频面试
个人感受:问了很多很底层的主机相关的知识
1.TCP的四次挥手过程以及状态转换,timewait为什么会存在
2.ping用的什么协议,在第几层,包是否会一直存在,超时时间设置为多久,在哪里设置
3.UDP的客户端IP是否可以记录到,为什么?
4.开启SNAT,是否可以记录到源客户端的IP
5.redis有哪些架构,主从的话,主宕机了,会怎么样?cluster是怎么分片的,怎么知道放到哪一个节点里面
6.zabbix有哪几种模式,用的什么模式,主动模式是怎么样的?确定是主动发送数据给server吗?(主动模式是客户端主动请求建立连接,然后主动采取数据,并返回给server)
7.zabbix和promethues有什么区别
8.游戏玩家上传的故障报告是怎么生成的?怎么去分析?怎么知道玩家的IP
9.ansible用来做什么?怎么通信的?
10.系统负载表示什么?内存不足会导致系统负载高吗?CPU使用率80%代表什么?
11.buffer和cache是什么,有什么区别?大小设置为多大?多久写入磁盘一次
12.代码题
七、vivo业务视频面试
4月15日 19:30-20:50 视频面试
个人感觉:去年下半年面试过他们公司,他说我的职业规划有变,对业务不是很熟悉,基础知识要加强。聊的都是做过的业务,有没有做过容灾演练,应急预案等等
八、腾讯游戏运维面试
中午电话面试一个小时
个人感受:给了我很多建议,让我突出自己的优势,怎么去准备准备
优势:1.对监控比较了解,2.对应用流程比较熟悉,3.和业务沟通比较擅长
建议:1.讲出自己的优势,2.把自己负责的项目工作写下来,3.准备shell基础知识(笔试)
1.标准输入、标准输出和标准错误3个文件描述符分别是什么
2.后台运行的命令是什么
3.shell参数的个数用什么变量,怎么表示上一个运行的结果?两个数字相加,用什么
4.playbook,下一个任务怎么获取上一个任务的值 (register,注册变量)
5.dockerfile 用哪些命令?ADD和COPY的区别
6.pod的生命周期是怎么样?哪些会用得到pod的运行状态
7.查看进程的子进程号用什么命令
8.top查看内存、cpu用什么快捷键
9.打开网页慢怎么去排查
10.ping和traceroute 的原理,ping不通怎么排查,是什么原因导致的
11.服务器初始化会做什么工作?安全会做什么工作
12.开服、合服的流程
13.云平台有和什么工具平台联合
14.磁盘告警怎么添加监控和处理
九、货拉拉面试
4月20日 19:30-20:10 视频面试
4月27日 20:10-20:50 二面总监面试
4月28日 15:00-15:30 HR面
个人感受:面试官给了我很多建议,很是收益,刚好他之前也是科技的同事,果然有熟人关系就是方便办事,人际关系还是很重要的
1.面试自我介绍,说重点和亮点,创新的地方,解决了什么问题,为公司带来了什么效益
2.解决过哪些故障,怎么解决的,具体步骤和流程,就算自己没有解决过,也可以去网上找找,记下来,就变成自己的
3.一定要把话题引导到自己擅长上来,不要被面试官牵着走,面试都是双向的。
4.如何提升运维的效率(工具,流程,技术),标准化,自动化,流程化,智能化
5.如何提升运维的稳定性,双活怎么做,容灾怎么做,高可用怎么做
6.timewait 和closewait ,为什么会出现,怎么解决
7.半连接状态 SYN_RCVD
十、oppo面试
4月26日 19:30-20:45 视频面试
个人感受:刚好讲了自己想往项目管理方面发展,他们也需要这样的人,就聊了很久,可以继续下面的面试
1.shell脚本有没有用过锁,就是在你运行时,别人没法运行(flock)
2.python脚本怎么获取第一个参数
3.k8s的网络
4.raid卡
5.从文本中提取出所有的IP地址
6.lvs的三种模式以及优缺点
二面 19:30-20:45
主要是往项目管理方面去问了,制作运营流程等等,让我很是答不上来,有点压力面试的感觉,怀疑人生。
1.你做过什么项目?充当的职责是什么?难点在哪里?是怎么解决的
2.数据库双活,在不同机房怎么保证数据的一致性
3.本来承受的是100IOPS,忽然来了1万IOPS,该怎么使之做到业务影响最小
4.应急演练做过哪些?hotkey怎么去实现,具体的演练方案不是你来制定的吗
5.压测方案是你做的吗?需要注意哪些
6.怎么保证系统的稳定性
7.你的监控做的怎么样?怎么评估监控是否做的好
8.让你去一个新公司制作一个运营规范流程,你怎么做,难点在哪?怎么保证落地
9.你的职业规划是?
十一、腾讯游戏面试
5月27日 电话面试
1.灾备怎么做的
2.负载均衡
3.遇到哪些故障,怎么解决的
4.安全工作做过哪些,阿里云上用了哪些产品?
十二、akulaku面试
5月31日 19:00-19:40 现场20分钟笔试,加20分钟面试
1.写一个检测192.168.1.0/24网段所有存活主机的脚本
2.zabbix和prometheus的区别
3.遇到监控数据大,性能受影响的情况吗?怎么解决的?
4.ELK的组成以及功能
5.zabbix用python发送微信告警的伪代码
6.ansible怎么确保tasks在这一台执行完成后,再在另外一台执行,怎么确保顺序执行?当有一台的环境变量不满足时,该怎么执行?怎么确保当前面一个任务执行成功后才能执行下一个任务?下一个任务怎么引用上一个任务的结果
7.prometheus是怎么发送告警的,alertmanager是怎么配置的?grafana是怎么权限控制的
8.nginx是怎么把URL转发到具体服务器的路劲下,upstream是怎么配置的
9.监控数据采集的原理
十三、字节跳动-飞书面试
6月2日 21:00-22:00 视频面试
个人感受:面试的是一个女生,感觉和我的年纪相仿,很有耐心。问的都是很基础的原理题,需要对操作系统非常熟悉,nginx非常熟悉,可是我有很多没有回答出来,哎
1.查看目前操作系统的登录用户命令(w , who ,users )
2.http和https的区别,证书签发的流程,私钥是存在什么地方?每次都需要认证吗?
3.nginx访问日志,写一个统计一个时间段内,每一分钟有多少个IP访问的shell脚本怎么写?
4.nginx的location匹配顺序是怎么样的?rewrite转发到uptream和直接在proxy_pass转发到ups他ream有什么区别?限制同一个IP一分钟只能访问3次该怎么配置?(限流)
5.查看有哪些端口占用
6.有哪些TCP的连接状态
7.TCP的timewait closewait ,MSL,包的往返时间是多少(默认两分钟,实际可以配置为30s,1m,2m,可以通过/proc/sys/net/ipv4/tcp_fin_timeout 来设置)
8.主机重启了,怎么配置服务开机自启
9./etc/rc.local是做什么的
10.开机的几种模式(0-6 )
11.java出现故障了怎么解决?jstatck ,jmap arthas
12.该怎么去梳理业务的上下游,在访问量很少的情况下,一天可能就几笔
13.常用http状态码
14zabbix的提前预测功能用到了什么算法