收藏题目

(下面的题目来自http://hx901010.iteye.com/blog/977128)
1.介绍做过的项目,核心思想
2.笔试的最后一道编程题,一段英文,用空格分隔,给出N个关键词,提取包含所有这些关键词的最短的句子extractSummary(String passage,String[] keyWords)
3.给你一堆url,其中有重复的,如何去重。。。(不能一个个比较,效率太低)
4.假如你要做个微博系统,存储全国网民发的微博,需要多大的硬盘(我完全懵了。。我问这是不断增加的啊,面试官说,好,那就说一年的,你就说说你的思路~~),最后还有如何优化的问题,我想了半天,说压缩。。面试官说,还有去重,比如一条微博有很多人转的话,存一次就行了
5.信息检索的关键技术。。。
6.还是上面的,因为我的答案有同义词关联词的研究,于是面试官就问我,给你一堆网页,你怎么研究出一个关联词库。。
7.现在的新闻很多都是相似的,比如说同一段新闻在各大门户网站都出现了,怎么判断哪些网页是相似的。。

你可能感兴趣的:(编程,面试,Blog,ITeye)