百度网页搜索

原文链接:

百度面经-网页搜索部

这次网页搜索部就来了三个人,一个领头的是北大的高级项目经理。其他两个是高级工程师,一个东大校友,一个北航的。去的那天通知是11点,到了之后看见两个高工分别在面。我习惯性的和校友打了个招呼,吴学长让我在大厅那侧等会儿。

等了几分钟左右,发现来叫我的是北航那个仁兄。一开始是传说中的自我介绍,我准备不充分,大概说了几句就结束了,后来发现略微不太靠谱。其实说多少无所谓,关键人家看的是思路。

后来的技术问题,第一题是数组和链表的优缺点。什么,连续存储,什么随机存取,什么插入删除的比较,反正说了一通。对方似乎不太满意,反正继续深入的问,说什么链表也能连续存储。反正压力测试么,就是不断地打断,误导你。

后来又问了一道数学题。两个体积一样的糖和盐,用一个勺从糖里匀一勺去盐里。然后再从盐里匀一勺去糖里。问盐中糖和糖中盐的体积孰大孰小。后来通过设置变量,然后计算之,发现一样。后来他说如果盐糖分布并不均匀,则又是啥情况。貌似还是一样,后来问如果来回匀N下,情况又怎么样。反正一顿问,直到懵掉。

最后问了个网页搜索的问题:有一个文件,里面全是一条条URL。问设计个算法,去除里面重复的URL。后来我先说了最简单的一种去重,即先排序,后遍历,将相邻重复的URL去掉。第二则是用HASH,貌似考官很来劲。我就提出一种最复杂的,链地址方式,不过对方貌似一定要你实现到能写代码的地步。非得把地址冲突的处理算法要你一五一十说得清楚。反正被追问得很是郁闷。后来我提出一种字典树,算是即简单,又容易实现的一种数据结构。但是他说URL可能本身是N的长度,所以这种也有可能是M*N的复杂度。最后还是硬着头皮继续讲链地址。反正最后是不了了之。

最后很郁闷的结束了大搜的面试。觉得百度虽然不问出处,但是招人标准甚不明朗。貌似对男生很敌视,对有项目经验的很敌视。总之这次确实收获不小。所以总结成文,引以为鉴啊。

————————————————————————————————————————————————————————————————————

其他:

1.最短路径

2. 归并排序相关问题?

你可能感兴趣的:(百度网页搜索)