这段时间的搜索引擎领域可谓繁华,三足鼎立,五花八门。各式各样的搜索引擎如雨后春笋般地遍地开来。真是让人目不暇接。但是用户对搜索引擎的满意程度是什么样呢? 用户还需要的是什么呢? 用户使用的主要问题是什么呢?
转自《 中国搜索引擎用户对搜索引擎不满意因素情况》 iResearch艾瑞市场咨询
iResearch艾瑞市场咨询根据来自Keynote的数据显示,中国搜索引擎用户不满意的因素中搜索结果重复比例最高,有50%的用户对搜索结果重复表示不满。同时,搜索结果排序欠佳、搜索结果太杂乱、搜索结果不合时宜、广告过多的比例分别为43%、37%、36%和35%。
调查结果显示的问题,我感觉这应该是用户真实的体验结果。其实这些问题,也是搜索引擎一直以来存在的问题。在这几个问题上前三个问题,结果重复,排序混乱,结果杂乱一直也是搜索引擎研究的重点内容。
结果重复,就要 网页消重。现在的研究主要分为几类,1 最简单的网址消重 2 根据内容消重 (主要是内容进行MD5编码,然后消重) 我从中国期刊全文数据库查询时竟然没有发现相关文章。奇怪了,一般商业网站在这方面的技术都没有公布,北大天网的消重技术在《搜索引擎--原理、技术与系统》中可以找到。
搜索结果排序欠佳,这是个难题。现在做最好的还是google的PageRank,但是绝对不是简单的几个网页“举手表决”那么简单,不记得在什么上面上看到,他们网页排名时参数竟然多达2000多。
搜索结果太杂乱,这个在百度上搜索“马”就可以明显地看出来。想要实现结果的不杂乱,就需要用户提供更多的信息,个性化搜索在这方面就可以消除一部分结果的杂乱,现在google的个性化搜索只保存了,搜索的历史信息,百度在这方面还没有相关的措施(挺纳闷)。
搜索结果不合时宜。搜索引擎返回的结果中应该加入时效性。 要不搜索2006年的新闻出来都是几年前的, Google可以指定数字范围搜索。搜索[2001..2005]相当于搜索含有2001、2002直到2005的任意一个数的网页。但是这也仅限于包括数据。还没有做到一个网页信息的确切时间。并且让用户输入总不如让用户选择。
广告过多。百度实行的竞价排名,无法避免这种情况,经常都是排第一个,广告可以做但是做到这种程度,让用户感觉被强奸。现在google左侧给用户使用的是自然排名,右侧的是竞价排名,而且竞价排名的广告还是和关键字上下文关联的。现在有个网站(黑马8)http://www.heima8.com/, 就是代理广告投放。使用的投放技术是数据挖掘技术。这个网站现在还是一个小网站。 但是我觉得baidu,sina也应该学习一下。
发了一些牢骚,搜索引擎最终的目的还是要返回给用户,最准确,最快速,最新颖的答案。这始终是搜索引擎的关键。