切实感受到了互联网寒气,已经投递公司:华为,百度,阿里,字节,小红书,网易,美团,快手,小米,oppo,vivo,boss直聘,中兴,蔚来,哈啰,蚂蚁金服,国信证券,去哪网,360,携程,滴滴,新浪,keep,tp-link,知乎,金山,顺丰,微众银行,同花顺,shein,拼多多,大华,京东,联想,理想汽车,随行付,中国航天科工,电信,科大讯飞,同程旅行,途虎,海尔,海信,移动,恒生,之江实验室,经纬恒润,京东物流,泰隆商业银行,嘉银科技,中信银行,星环,九方智投,兴业数金,兴业证券,拉扎斯网络,浙江中控,金现代,三星北研院,宝武,欧冶
算法面经
---------------------------------------------------------------------------------------------------------------------------------
8.17华为一面(华为我投的是AI工程师
自我介绍
比赛介绍,特征处理
实习工作介绍,Textrank,gbdt
都考虑哪些工作地点
手撕代码:合并排序链表
8.17华为二面
自我介绍,比赛介绍
你遇到的最大的最大困难,你做的创新优化
实习介绍,哪里能体现你的能力
手撕代码:打印列表里和为target的元素
(同事拿到的手撕代码题:二分法)
8.28华为综面
自我介绍
成绩排名,打比赛,获得过什么奖
比赛介绍,比赛的分工
实习介绍
研究生研究方向
毕设的方向
对华为的了解
(目前已经进了华为的池子了
·······························································································································
9.1京东一面(我投的数据挖掘
但是面的时候给我介绍部门偏业务,面得过程侧重考察数据的分析,业务的理解,偏风控,没有手撕代码
自我介绍
比赛介绍,数据探索性分析用的方法都是哪里学的
实习介绍,哪些特征有用,怎么衡量的
(她介绍了很多自己部门的东西,但是信号不好,我也没听清多少...
然后就被转推荐了
同事的面经
京东:
1. 决策树模型,各个模型的区别,ID3 C4.5之类的,连续变量和离散变量的区别
2. ROC AUC的含义
······························································································································
9.1 百度一面(我投的是数据挖掘、机器学习、自然语言处理,但是面试官介绍是做地图算法的
自我介绍,二面挂发了海笔
计算机掌握情况,linux,分布式,数据库,处理的最大的数据,电话面试,没有手撕代码(一再强调招人进来就是干活的)
口述了一个sql的题,一个班级里对不同性别的学生,不同学科的成绩排序
实习介绍,基于对数据的了解如何使用的模型,感觉偏业务
上过时序的课,问我时序学了什么,我上的是传统的时序课,跟他们部门的空间序列还有一些出入,我反问了下他们的时序方向目前是用什么模型,他介绍了好久,最后通知我跟其他人一起排序,有没有二面会通知我的(第一次一面就排序,百度好强,很注重计算机的能力)
9.3百度二面
自我介绍
问我手里现在有没有offer,我说这不秋招才开始么(尴了个大尬,我真是个实在的傻子,实话实说
比赛介绍
过采样欠采样怎么实现以及原理
onehot编码以及他的问题,怎么解决
lda主题模型了解么
时序的经验模态分解,小波分解的缺点
特征选择的方法
rf,gbdt,xgboost模型介绍,以及模型的对比
模型最终的效果,后续有没有反思效果不好的原因
实习介绍
文本抽取的了解,业界目前在用什么模型
介绍rnn,lstm,gru结构
介绍bert,transformer
代码
1 二叉树,搜索根节点到目标值的路径
2 判断链表有没有环
3 给一个点,判断是不是在给定的多边形的内部(没有一道题是白送的。。。)
在GIS(地理信息管理系统)中,判断一个坐标是否在多边形内部是个经常要遇到的问题。乍听起来还挺复杂。根据W. Randolph Franklin 提出的PNPoly算法,只需区区几行代码就解决了这个问题。
发散性问题
给了一个场景,有拿到车辆的运行轨迹,怎么判断路况突然出现障碍物或者其他标识
我分析是车辆轨迹异常检测,把它抽象成一个图像二分类的问题,(面试官挺好的,她很鼓励发散思考,想咋说咋说。。。
反问部分
我问了那个发散问题是目前的业务场景么,部门目前是通过什么模型来解决的,她告诉我目前是通过基于统计方法,通过时序模型来做的,图像也在考虑
我问目前部门的具体业务,以及时序方向都用了哪些模型,(这部分就纯聊天了,感觉比一面面试官和蔼很多了
面试复盘:应该补充点模型优缺点相关的知识
·······························································································································
9.6小米一面(小米一面挂经,上牛客上找了很多秒挂的兄弟抱团取暖,好奇通过面试的都是什么样子,小米我投的机器学习
自我介绍
先写代码真的与众不同
1.判断五张牌能否组成顺子
2.判断链表有没有环
算法模型:
lstm结构,涉及到的激活函数,sigmoid,tanh,为什么用这些激活函数,算概率为什么不用正弦,值域也是零到一(没想到是从收敛速度那里考量的,指数速度还是线性速度
gbdt,xgboost,lightgbm区别(主要就是一些工程上的优化
数据库的掌握情况(我说我就会写点sql哈哈哈哈哈
线性代数,m*n矩阵求特征值特征向量(我感觉这个面试官数学底子非常好,问他是不是数学专业的,他说不是,我感觉他真是不是来面试我的,是来给我讲数学的,他后期给我介绍推荐搜索会涉及到矩阵分解,我对推荐搜索协同过滤确实不是很了解了
反问环节
我问部门现在是在做推荐搜索么(小米商城可能会涉及到给用户推荐产品
我问其他业务场景呢(说部门目前主要是做用户画像,会涉及很多特征
数据库的掌握需要多少(说接触的数据可能上亿,会用到hadoop还有spark
小米一面挂然后发了海笔
·······························································································································
9.13快手一面,看到其他同学投算法简历挂了,我投的是数据挖掘
面试体验不好加上写代码一共二十三分钟,面试官没开摄像头,没有反问环节,kpi面
自我介绍
学过数据结构没有,其他计算机相关的课程
上过的课程
毕设开题了没,准备写什么方向
考研还是保研
比赛介绍
比赛分工
python用了哪些包
比赛的排名
lstm,gru与rnn的区别(kpi面经典问题
代码:最大存水量
(不出意料直接挂,无语
·······························································································································
9.13百度笔试(鸽),微众银行笔试,联想笔试
捞了个南京大学的兄弟,分享面小红书的过程,自我介绍两分钟,做题57min
小红书压根没给我排面试
9.14小米笔试(鸽),深信服笔试,boss直聘笔试
今天的新闻是理想汽车申请注销,我说咋没有人捞我面试,我妈让我看看青岛,秦皇岛,火速投了青岛的海信和海尔
9.15蚂蚁金服笔试,海尔笔试
同事说直接没投蚂蚁,再撑撑吧。。。
-------------------------------------------------------------------------------------------------------------------------------
9.19联想 数据挖掘一面(十七分钟没谁了,不断刷新时长下限
自我介绍
你收获最大的一个项目介绍一下
收获到了什么
用什么数据库
让你预测用户收入,从哪些方面入手分析
对联想的了解
反问
业务是做用户画像的么,主要用什么模型啊
-------------------------------------------------------------------------------------------------------------------------------
来自同事的兴业数金的数分面经
-------------------------------------------------------------------------------------------------------------------------------
9.23美团一面 推荐搜索算法岗(捞我的是美团的地图)
自我介绍
实习介绍
模型内部结构
有没有考虑过attention
hadoop,spark会不会
rf gbdt对比,两种方法,哪个对树的深度有限制
lstm介绍
一堆数求topk个数,时间复杂度(最大堆最小堆)
一堆数有重复,数的范围【1,100】求topk个数 时间复杂度
手撕代码:多叉树层序遍历
反问:部门的业务
-------------------------------------------------------------------------------------------------------------------------------
9.23写了个贼无语嘉银科技的游戏测评
-------------------------------------------------------------------------------------------------------------------------------
9.23海尔一面,投的算法工程师(收到offer了)
电话聊了聊没想到她说算一面了
确认个人信息
问家在哪里,为什么不留在家那边
问为什么想来青岛
加一下面试官微信,发一下学生证和成绩单
9.27 海尔二面
自我介绍
为什么不投数据分析,数据挖掘
实习介绍
模型构造
损失函数选择,你还了解哪些损失函数,对比学习了解不了解
文本抽取的算法textrank
bert transformer的结构
transformer的优点在哪里
9.29海尔三面
自我介绍
项目介绍
textrank细节
正则化l1,l2
手里有没有其他offer
家在哪里
统计算后验概率,一个人是诊断是阳性,实际上也是阳性的概率
反问
-------------------------------------------------------------------------------------------------------------------------------
9.27宝武面试(宝钢的子公司)(收到offer了,太穷配不上上海。。。)
我目前遇到的最爆的面试,四个面试官,加一个hr轮流问。
hr:
自我介绍
实习介绍
比赛介绍
对企业的了解
你最大的收获
你的个人规划,不考虑金融,医疗么,对制造业的了解
技术面试官:
统计的一些定性定量分析方法,处理类别的,处理连续型数值的
t检验
lstm介绍一下
处理过多元时序数据么
时序的训练集测试集验证集怎么做
时序异常检测有什么了解
介绍一下文本编码的主要方法
介绍下wordtovecter,霍夫曼编码,负采样
bert是怎么获得的文本编码
bert的结构,bert的两个预训练任务
transformer的结构
transformer的attention是怎么算的,为什么要除缩放系数
textrank怎么做的
bert处理长文本受限,除了文本抽取,模型了解么,transforme xl了解么
了解GAN么
了解迁移学习么
fourier变换,小波变换,emd,eemd
信号处理
数据相关性分析怎么做的,计算,通过画散点图么
小样本问题怎么解决
模型的过拟合怎么解决
类别不均衡除了采样,有生成过一些样本么
类别不均衡除了从样本进行处理,从评估指标进行处理呢
降维方式你知道哪些方法
pca介绍一下
现在用什么框架,pytorch么
hr介绍待遇信息
税前一万(干几年以后会涨),单身公寓,五险一金,先签三年合同,,没记住
-------------------------------------------------------------------------------------------------------------------------------
9.29宝钢研究院
自我介绍
项目介绍
工具介绍
优化问题
-------------------------------------------------------------------------------------------------------------------------------