今天机缘巧合,刚巧尝试用了下360的搜索引擎:http://www.so.com
并没有专业的评测,结合自己对百度搜索的了解,简单记录些体会:
1 360的类聚系统
站点类聚和内容类聚的结果,和百度搜素的结果居然一模一样。怀疑这种现象有两种可能,一种是360采用了百度相同的类聚代码,一种是360在搜索结果上爬取并参考了百度的搜索结果。
2 360后台的索引长度
google的query结果是1000条;百度在此基础上收缩为760条(即所谓的760库);360进一步缩减为了640条结果;这样的收缩能让360适当减少AC、BC等模块的倒排索引运算量,会节省一些服务器资源;并且和百度也有些差异
3 spider的比较
360和百度的索引各有千秋,在有些低频query上360的索引量居然还多一些,有点出乎意料。
4 广告系统
360目前CPC用的还是google的搜素广告系统,内部研发的系统不知道什么时候会上线替换。
考虑到凤巢可是百度收入的绝对大头,从这个角度来看360的股票还有不少上涨的潜力
5 query分析
百度做得力度更大一些,在query分析和query变换上更丰富,
360做得比较少,这方面属于慢工出细活,可以慢慢赶上
6 超长query的处理
百度还是限制query的长度只允许38个汉字以内,360略微扩展到了40个汉字。
超长query下百度的飘红系统出了问题,并且后面出了非常不相关的搜索结果,360在方面的效果居然比百度要出色一些。长query一直是百度的短板,也是技术难度大的一个方面,这方面有我们的外国老师Google做得很好,值得多学习
7 英文搜索
360和百度都很烂,完全没放精力。码农朋友们如果要搜技术资料还是用Google靠谱得多
8 社区类产品
百度的一系列社区类产品,包括百度百科、百度知道等,内部的同学们都知道,是百度大搜索系统的神器。
百度百科更多面向高频query,只要命中了相关性通常有保证;百度知道是低频query和长query的救星,在很多场景下,由于query分析不够深入,导致优质结果无法召回的时候,就靠百度知道来救场了。
360在这方面实在吃了大亏,百度对360链接过来的结果要作二次跳转,比较恶心,如下图
9 阿拉丁系统
360的360良医直达做得不错,这也是360针对百度医药广告多而开发的亮点功能。但百度在阿拉丁的query覆盖率上要更胜一筹。另外百度地图的确好很多
10 整体观感
360作为一个有力的竞争者,发展得很不错。
但是IT行业是一个胜者通吃的世界,作为追赶者,要想超越,只做模仿远远不够,还得想办法有颠覆性的功能创新点才行。我们拭目以待