2009年阿里巴巴搜索研发类笔试试题【转】

 试卷分三部分
1.java
2.搜索 C++(这2个为什么要混在一起?)
3.公共(都要做)我做的是B卷、搜索研发类,只记得其中的一部分内容(都是关键字,实在记不全所有的内容了。。。。。)B卷基本上都是选择,只有最后公共题的最后两题不是。1、DOM2、utf-8编码字节大小?3、网络蜘蛛4、分布列(概率中的数学期望)5、搜索查准率和查全率的一个计算题6、索引压缩7、cralwer速度的影响8、信息熵量大小的影响9、Trie算法的最差时间复杂度10、HTML11、HTTP协议12、信息检索模型13、分布式通信协议14、分布式搜索引擎15-25、C语言的一些知识,在面试宝典里面基本上都能找到原型1、要对语句A>1 OR B <= 3 测试……(不记得了)100%覆盖,至少要多少测试用例2、典型的针对系统漏洞的Dos攻击?3、4,2,2,3,6,15,( ?) A,20 B,24 C,25 D,454、3升,5升,7升量筒,已知3、5量筒装满水,7量筒为空,问至少要倒多少次才能使其中一个量筒的水为4升5、太长了6、太长了7、保护邮件安全的软件?8、普通用户执行超级用户文件的指令9、软件测试对象10、软件缺陷生命期11、OPENAPI平台12、超长字符串攻击属于?13、项目的最重要的是()和()14、可能引起Cross Site Scripting攻击的是?15、马可夫模型(HMM)的三个基础?(非选择)16、有序集合a, b,求交集(非选择)HMM需要解决三个基本问题:

  *1 评估问题:

  给定观测序列 O=O1O2O3…Ot和模型参数λ=(A,B,π),怎样有效计算某一观测序列的概率.

  *2 解码问题

  给定观测序列 O=O1O2O3…Ot和模型参数λ=(A,B,π),怎样寻找某种意义上最优的观测序列.

  *3 学习问题

  怎样调整模型参数λ=(A,B,π),使其最大?

  基本算法

  针对以上三个问题,人们提出了相应的算法

  *1 评估问题: 向前向后算法

  *2 解码问题: Viterbi算法

  *3 学习问题: Baum-Welch算法

你可能感兴趣的:(算法,搜索引擎,软件测试,测试,阿里巴巴,scripting)