搜索引擎的发展简史

搜索引擎的发展简史
——【郭亚辉】【QQ348131601】

在互联网发展初期,网站相对较少,信息查找比较容易。然而伴随互联网爆炸性的发展,普通网络用户想找到所需的资料简直如同大海捞针,这时为满足大众信息检索需求的专业搜索网站便应运而生了。
现代意义上的搜索引擎的祖先,是1990年由Montreal(加拿大的蒙特利尔)的McGill University学生 Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie。虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,而且由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage想到了开发一个可以以文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。
Archie工作原理与现在的搜索引擎已经很接近,它依靠脚本程序自动搜索网上的文件,然后对有关信息进行索引,供使用者以一定的表达式查询。由于Archie深受欢迎,受其启发,美国的内华达州System Computing Services大学于1993年开发了一个Gopher搜索工具Veronica。Jughead是后来另一个Gopher搜索工具。
最早现代意义上的搜索引擎出现于1994年7月。当时Michael Mauldin将John Leavitt的蜘蛛程序接入到其索引程序中,创建了大家现在熟知的Lycos。同年4月,斯坦福(Stanford)大学的两名博士生,David Filo和美籍华人杨致远(Gerry Yang)共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。目前,互联网上有名有姓的搜索引擎已达数百家,其检索的信息量也与从前不可同日而语。比如最近风头正劲的Google,其数据库中存放的网页已达30亿之巨!
随着互联网规模的急剧膨胀,一家搜索引擎光靠自己单打独斗已无法适应目前的市场状况,因此现在搜索引擎之间开始出现了分工协作,并有了专业的搜索引擎技术和搜索数据库服务提供商。象国外的Inktomi(已被Yahoo收购),它本身并不是直接面向用户的搜索引擎,但向包括Overture(原GoTo,已被Yahoo收购)、LookSmart、MSN、HotBot等在内的其他搜索引擎提供全文网页搜索服务。国内的百度(百度已于2001年9月开始提供公共搜索服务)也属于这一类,搜狐和新浪用的就是它的技术(搜狐二级网页搜索现已改为中搜的引擎,而新浪则已转用Google的搜索结果。)。因此从这个意义上说,它们是搜索引擎的搜索引擎。
Excite 的历史可以上溯到1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已是一个完全投资项目Architext,他们还发布了一个供webmasters在自己网站上使用的搜索软件版本,后来被叫做Excite for Web Servers。(注:Excite后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎 Dogpile 。目前Excite隶属于Ask Jeeves公司。)
1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy (Tradewave Galaxy)上线。除了网站搜索,它还支持Gopher和Telnet搜索。

搜索引擎发展简史之英文搜索引擎
Yahoo搜索 www.yahoo.com
1994年4月,Stanford University的两名博士生,美籍华人 Jerry Yang (杨致远)和David Filo共同创办了Yahoo (Jerry Yang Alerts a Usenet group to the Yahoo Database ,1996年的Yahoo )。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Wanderer只抓取URL,但URL信息含量太小,很多信息难以单靠URL说清楚,搜索效率很低。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。(注:Yahoo以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务;2002年10月9日,Yahoo放弃自己的网站目录默认搜索,改为默认Google的搜索结果,成为一个真正的搜索引擎。并于2002年12月23日收购inktomi,于2003年7月14日收购包括Fast和Altavista在内的Overture。)
1994年初,Washington大学CS学生 Brian Pinkerton 开始了他的小项目 WebCrawler (Brian Pinkerton Announces the Availability of Webcrawler )。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。后来webcrawler陆续被AOL和Excite收购,现在和excite一样改用元搜索引擎Dogpile) 。
Google搜索 www.google.com
1998年10月之前, Google 只是Stanford(斯坦福)大学的一个小项目 BackRub 。1995年博士生 Larry Page 开始学习搜索引擎设计,于1997年9月15日注册了google.com的域名,1997年底,在 Sergey Brin 和 Scott Hassan、Alan Steremberg 的共同参与下,BachRub开始提供 Demo 。1999年2月,Google完成了从 Alpha 版到 Beta版的蜕变。Google公司则把1998年9月27日认作自己的生日。
Google在 Pagerank 、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图股票词典寻人等集成搜索、多语言支持、用户界面等功能上的革新,象Altavista一样,再一次永远改变了搜索引擎的定义。在2000年中以前,Google虽然以搜索准确性备受赞誉,但因为数据库不如其它搜索引擎大,缺乏高级搜索语法,所以推广并不快。直到2000年中数据库升级后,又借被Yahoo选作搜索引擎的东风,才一飞冲天。Google自2000年开始提供中文搜索服务。
(注:2004年8月份Google上市,到2004年底,Google股价达到了185美元,赢利额增加222倍。2005年2月3日,在Google公布了高于预期的第四季度财报后,以股票市场价值为标准,它已取代eBay成为了市值第一的网络公司。目前Google的市值高达560亿美元,已接近美国媒体巨头迪斯尼的市值,甚至超过了通用汽车及美国铝公司(Alcoa)市值的总和。2月2日Google在纳斯达克的股价一度升高到每股216.80美元,再次刷新了它的股价记录,随后以205.96美元收盘,当天整体上涨了7.3%。)
MSN搜索 search.msn.com
微软公司一直以来通过雅虎公司旗下Inktomi支持其搜索服务,但早在2003年,看到Google引领搜索广告并从中获得大量利润之时,位于华盛顿雷蒙德的微软公司就有了创建自己搜索引擎的决定。凭借微软雄厚的软件技术实力,2004年11月微软推出MSN搜索测试版,经过三个月的初步测试,2005年2月1日微软终于推出了MSN搜索正式版。目前MSN搜索提供Web、News、Images、Music、Desktop.BETA、Encarta等的搜索,比较有特色的是可以直接进入Encarta(微软的百科全书)进行答案搜索。虽然微软如此之晚才进入搜索领域,但凭借它的技术、市场、资金等优势,势必将对现今的搜索格局产生重大影响。
搜索引擎发展简史之中文搜索引擎
百度搜索引擎 www.baidu.com
2000年1月,两位北大校友超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度(Baidu)公司。2001年8月发布Baidu.com搜索引擎Beta版(此前Baidu只为其它门户网站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式发布Baidu搜索引擎,专注于中文搜索。Baidu搜索引擎的其它特色包括:百度快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、mp3搜索、Flash搜索。2002年3月闪电计划(Blitzen Project)开始后,技术升级明显加快。
中国搜索 www.zhongsou.com
中国搜索(原慧聪搜索)2002年正式进入中文搜索引擎市场,2003年8月24日 慧聪搜索(现中国搜索)正式推出第三代智能中文搜索引擎.2003年12月23日 慧聪搜索正式独立运作,成立中国搜索,陈沛出任CEO,同时推出中国搜索新闻中心。2004年2月26日 中国互联网新闻中心、IDG集团注资中国搜索,成立合资公司。并提出”个人门户时代”的创新理念。2004年2月26日 中搜桌面搜索引擎网络猪1.0版公开发布。实现主要功能:桌面搜索、个性化定制新闻专题、行业资讯、对接即时通(IMU)、自写短信功能、智能搜索(按照用户天气预报设置的城市,在目标城市范围内进行搜索),目前最新版本是3.0beta。中搜目前提供网页、新闻、行业、网站、Mp3、图片、购物、地图等搜索,其中行业搜索较有特色。
搜狗搜索 www.sogou.com
搜狗是搜狐公司于2004年8月3日推出的完全自主技术开发的全球首个第三代互动式中文搜索引擎,是一个具有独立域名的专业搜索网站-“搜狗”(www.sogou.com)。以一种人工智能的新算法,分析和理解用户可能的查询意图,给予多个主题的“搜索提示”.
SOSO搜索 www.soso.com
在用户查询和搜索引擎返回结果的人机交互过程中,引导用户更快速准确定位自己所关注的内容,帮助用户快速找到相关搜索结果,并可在用户搜索冲浪时,给与用户未曾意识到的主题提示。

——转自网络

你可能感兴趣的:(搜索引擎的发展简史)