一个优化百度和谷歌搜索结果的搜索网站是如何写出来的(原创)?

   经过半年的时间,终于将我的个人搜索网站(沃搜:www.ausou.net)写好,并正式上线运营。在此,想和大家分享其中的思路和经验,也算个总结吧!
    想写一个对百度和谷歌搜索结果优化的网站,源于我对其搜索结果的不满。也就像很多山寨的搜索网站一样,想给客户更好的结果和体验,不过我的搜索网站走的更远,自己的创意更多而已。
    首先我提出问题,即我对百度和谷歌搜索结果不满的地方:
    1、搜索结果没有分类展示。因为同一个搜索关键词,对应的结果有多种,可能是网站,也可能是指相关资料的下载,还可能是对关键词描述的网页;百度和谷歌都是把这三种结果混在一起排序,顾客要花时间根据自己的意愿寻找了。打个比方,如搜索tomcat,百度的搜索结果第一条是tomcat的介绍,谷歌的第一条是tomcat网站首页;如果使用百度的顾客想要的是tomcat网站,使用谷歌的想要的是tomcat介绍,还有可能是要tomcat的下载,那么顾客不得不花时间往下寻找自己的结果。而在沃搜(www.ausou.net),搜索结果是按照网页描述、网站和下载分类展示的;顾客可以很快定位自己想要的结果。
    2、搜索结果没有按照正文对关键词描述的丰富程度排序。这种情况是针对网页描述类的搜索。打个比方,比如搜索tomcat配置,一般顾客想要的都是详细介绍tomcat如何配置的;但是谷歌和百度的搜索结果是:靠前排列的结果可能只说了一点,系统且详细介绍的靠在后面。这样顾客不得不花时间一个一个链接点开查看,寻找自己的想要的结果。而沃搜(www.ausou.net)基于这种搜索理念:网页描述性搜索结果,其对关键词描述的越系统、越详细(就是网页描述丰富程度),此网页的正文字数也就越多,其搜索排序应该靠前。当然这里的网页正文含义是指剔除网页中的广告等垃圾文字的。沃搜(www.ausou.net)对描述性搜索结果就是按照网页正文对关键词描述丰富程度排序的;
    3、有些搜索结果无法访问或者访问速度过慢也排在前面;沃搜(www.ausou.net)对于这样的搜索结果会给予提示,并排在最后面;
    4、百度和谷歌的各自搜索结果和相关搜索关键词没有整合,当然不只是百度和谷歌,可能还有其他大型的搜索网站结果;沃搜(www.ausou.net)可以通过配置整合基础搜索网站的搜索结果和相关搜索关键词;
    5、搜索结果中包含太多无关的广告,混淆视听。我不反对搜索结果中有广告,但是彼此相关性要大点吧?
    问题就说这几点吧,下面就谈针对这些搜索结果的问题,沃搜(www.ausou.net)如何解决及解决思路。
    要对百度和谷歌等大型搜索结果进行优化,首先要取得这些基础的搜索结果。然后提出搜索结果链接,然后及时访问每个目标链接, 获取每个目标链接的内容后,进行内容分析;分析完之后就是搜索结果的分类、搜索结果的再包装和搜索结果的排序;最好是 搜索结果的输出。
    以上就是一个优化百度和谷歌搜索结果的总体思路,至于详细的实现和核心算法,接下来我会继续发帖介绍。当然,这要看大家是否关注这方面的内容,是否有需求了解这方面的内容。今天就写到这里为止吧。
    后记:对这方面议题敢兴趣的各位可以用邮件[email protected]或者qq:277615290讨论联系。
    (后加的:可以参考http://nunaleon2003.iteye.com/blog/624484(与百度和谷歌的搜索结果对比)
   沃搜的使用方法:http://nunaleon2003.iteye.com/blog/622551)

你可能感兴趣的:(tomcat,mysql,搜索引擎,百度,Google)