因为我这个人面试得有点乱七八糟,
从stat到SDE到PM到DS都有,就一路想到哪里贴到哪里了,抱歉抱歉。
有意义的题不多,基本上都是设计题性质,给一个case让我做,
多半还是open case。
先贴题目,反正答案我自己忘记的差不多了。
Q0:讲讲你最得意的一个project。
Q1:有一组数据,很长,有ID,经纬度,时间4个变量。
怎么找出两人是否有一面之缘。怎么找出所有relationship(
定义是在100米范围内一起度过1小时以上)。
Q2:有一组以往marketing campaign的数据,包括使用的关键词集合,目录集合,还有成功率。怎么决定下次campaign使用哪些关键词。
Q3:怎么找出竞争对手购买了哪些搜索关键词。
Q4:怎么判断两个TB级别的文本是否雷同,是否近似。
Q5:怎么用C实现SQL的join功能。只是思路(hash)
,没让code。
Q6:三个按钮对应隔壁房间的三盏灯,只能到隔壁房间一次,
怎么判断哪个对应哪个。
Q7:怎么用两个正方体(共12面)显示一个月的所有日期。
Q8:怎么最快的在一个大文本里面搜索字符串。
Q9:为什么有时候K means算法不能converge?
Q10:沙滩上有两个一模一样的冰激凌店,由两兄弟经营。
为了竞争顾客,他们会把店开到哪里?
Q11:纽约有多少出租车?他们年收入大概多少?
Q12:某公司在各种marketing channel投入资金,请问怎么计算投资回报?怎么决定最佳投资方案?
Q13:(唯一的一个code题)计算斐波那契数列。
Q14:怎么设计recommending system,怎么解决cold start 问题。
Q15:假设你既卖toyota又卖lexus,
请问应该如何定价?
Q16:怎么解决marketing data里面selection bias问题(从impression到click到purchase,每次都只有少数人进入下一步)。
Q17:使用decision tree的时候,假设y应该随着x递增,
但是cart算法得出的结果有spike,即某处出现y随着x递减的现象。怎么解决?
Q18:
怎么判断sample是否符合预设的population 分布。
Q19:假设盒子里有1000条鞋带,每次拿出两个头系起来,
如果形成一个loop就拿出来,否则放回去。请问预期最后有几个环。
Q20:有一个人口调查问题是家里有几口人,
显然最后的结果会有重复,因为4口之家每个人都会说4。怎么解决?
想起来再加。