外贸系列之 Google 搜索

Google简介

谷歌是一家总部位于美国硅谷的高科技公司,旗下的Google是全球最大的搜索引擎,在世界很多国家使用。目前Google搜索服务已经退出了中国,需要翻墙才能使用。

和百度一样,Google也是一种通用搜索,不过随着网络的发展,Google也逐渐形成了垂直搜索,比如图片、视频、新闻等。

我们大家都使用过搜索引擎,但是并不一定知道搜索引擎是如何工作的,下面就简单介绍一下Google的搜索过程。

基本原理

抓取

Google会使用大量计算机来提取网络上的海量网页,这个过程叫做抓取。Google会使用一个叫做“蜘蛛”的程序来抓取网页,“蜘蛛”会确定要抓取的网站、抓取的频率以及每个网站中抓取的网页数量。

索引

“蜘蛛”抓取好网页之后,会将所有网页存入巨大的数据库中,同时对这些网页在数据库中的内容和位置做好标记,形成索引。打个比方,当图书馆新到一本书时,管理人员会对新书做好登记,确定好放在哪个位置,同时放入书架。“蜘蛛”这个时候做的工作就和图书管理人员做的工作类似。

排序

当用户查询时,Google会搜索索引查找匹配的网页,并从数据库中输出和用户最为相关的结果。相关性由上百个因素决定,其中有重要的一项是PR(网页级别),根据来自其它网页的链接来衡量该网页的重要性。比如说有两个网页,一个有来自其它1000个网页的链接,而另一个只有来自100个网页的链接。那么前一个网页的PR值就高于后一个网页。

搜索过程介绍

1、选择最近的搜索引擎

用户打开Google首页,Google会自动跳转至离用户最近的搜索引擎。比如以前使用时会自动跳转至Google香港。

2、提供关键词搜索建议

用户在搜索框中输入关键词时,Google的拼写服务器会根据输入的内容自动提供热门的关键词建议,方便用户快速选择。比如输入animal时,Google提供了如下的建议。


当Google怀疑输入的单词有误时,还会在下面显示红色波浪线提醒。


3、确定搜索的关键词

当用户按回车键提交关键词后,Google的拼写服务器会找出关键词的同义词和近义词,一并提交给索引服务器。因此有时候会发现之前并没有输入某个关键词,但Google还是会返回含有该关键词的网页。

4、找到数据库中的相关网页

索引服务器接到搜索的请求后开始在索引中检索,并从数据库中找到相应的网页。有些搜索频率很高的热门网页会临时存放在内存区,方便提取。

5、网页排序

找到相关的网页之后,Google会开始排序,其中的几个原则如下:

 1、相关性高的优先显示:比如搜索“animal“, 网页标题、URL、正文中都含有animal的排在前面




 2、PR值高的优先显示

     上述几个网页的PR值分别为5, 8 , 8

   3、之前访问过的历史网站优先显示:上述第一个网页标题显示紫色,说明之前有访问过

   4、热门的内容优先: 一些热门的内容也会优先显示,比如 IPOHNE新品发布的时候,新品链接会排在前面

   6、过滤

    接下来Google会过滤掉不符合要求的网页

       1、不符合法律法规的网页、作弊的网页,Google不会显示

        2、垂直内容整合在一起,比如所有图片、视频、购物等放在一起


3、移除重复结果

 7、页面输出

     最后Google会输出相关的结果,最多1000个,而大部分的搜索结果会被屏蔽。

你可能感兴趣的:(外贸系列之 Google 搜索)