在前几年我参加秋招的时候,当时几乎所有大厂的ssp,还有几家大厂的人才计划。被好几家cto/svp/技术委员会主席面试过。现在也从被面,成长为面试别人。2022校招我参与筛了近百分份简历,面了N多同学,作为算法从业人员+面试官,就有了不一样的视角。
从面试官的角度,给大家讲点面试经验。这是刷面经看不到的东西!
我个人主要是5方面,基础扎实,知识深度,知识广度,业务理解,沟通表达对候选人进行考察。
至于问不问leetcode,放在文章结尾了。
听起来比较玄乎,我们举一个具体的例子。
案例:小A毕业于北京985高校硕士,是在某资讯APP实习过的同学,手里已经有大厂SSP offer了。他简历上写了一个文本分类的项目。由某APP存在图文类目错误,漏添等,使用人工标注数据,构造了Bert的100多类的文本分类模型,建设新闻类目智能化分类能力,通过模型调优,上线准确率85%。
针对基础知识方面,
1.讲下Bert的基本结构?
2.self-attention的公式是啥?
3.Bert 的预训练任务是怎样的?
4.模型的评估指标是啥?
5.模型指标具体的计算细节是啥?
点评:这部分不会问太多,主要是为了确认候选人的在机器学习,深度学习,编程和数据结构等基本知识掌握情况。
针对知识深度方面,
1.Bert之前大家都在用什么方法解决文本分类问题。
2.word2vec了解吗,有什么弊端?BERT相比有什么优势?
3.Bert中为什么要在开头加个[CLS]?有其他代替方法吗?
4.Bert中有哪些地方用到了mask?各有什么作用?
5.Bert中self attention 计算复杂度如何?如何处理过长文本?
点评:这部分也不会刁难候选人问太多,除了考察下知识深度,也为了确认候选人,简历上项目的来龙去脉比较熟悉,对原理的细节比较懂,排除调包,调参侠的可能。
针对知识广度方面,
1.在你这个场景,标注的类别体系是怎么建立的?有什么机器学习方法可以帮助建立分类问题的类别体系吗?
2.标注数据的周期有多长,积累了多少数据?如何评判这些数据模型已经够用了?
3.有什么让标注数据提升人效的方法吗?
4.在你这个场景,遇到了新类别的数据怎么办?有没有办法不重新训练模型,就可以识别新的类目?
5.针对长尾类目,数量过少的问题,你是怎么解决的?除了积累数据,还有别的方法吗?
点评:这部分问的相对较多,除了确认候选人的知识广度,还会看看候选人是不是机械完成任务的工具人,对项目有没有横向的思考,有没有主动多想一步的意愿。
针对业务理解方面,
0.这个模型,有多少场景和流量在用?有什么AB测的过程吗?
1.你这个模型,除了技术上的准确率,在业务上观测什么指标?
2.这个事情的业务价值体现是什么?提升审核效率吗?具体怎么量化?上下游都有哪些关键业务?
这部分不会为难候选人,特别是没有实习过的同学,他们可能不会完整的。
点评:这部分会简单聊一下,主要看候选人在问题拆解,问题解决,技术指标提升,业务指标提升的一个逻辑。有没有在大的视角关注你做的事情。
关于代码题!
如果简历单薄,实在填不满面试时间了,我还会问一道算法题。当然如果你前面很充实,是没有这个环节的。
同一个题目分easy medium hard三部分。easy问思路暖场,然后问medium的手撕代码,hard问解题思路。
1.easy 正整数数数组,任取两数x1,x2,求|x1-x2|的最小值。
2.medium 任意两个正整数数组,从中各取一数,分别为x1和x2,求|x1-x2|的最小值。
3.hard 任意N个正整数数组,从中各取一数,分别为x1,x2…xn,求 |x1-x2| + |x2-x3|+ |x3-x4| +... + |xn-1-xn|的最小值。
点评:主要考察候选人的问题解决能力,通过问题拆分,难而化易,举一反三的能力。
关于沟通表达,
主要体现在耐心倾听,准确理解。有逻辑、有条理地表达自己的观点。
有些小技巧:不抢话,回答简洁,准确,有逻辑性。学习下新闻上领导发言,第一,第二,第三。或者背景,措施,效果等逻辑角度展开讲解。
前面5个纬度都ok的话,SSP就手了~
往期精彩回顾
适合初学者入门人工智能的路线及资料下载中国大学慕课《机器学习》(黄海广主讲)机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载本站qq群955171419,加入微信群请扫码: