搜索引擎

什么是搜索引擎?常见的有哪些?

根据特定的计算机程序对信息进行组织和处理后将用户搜索的相关信息展示给用户


搜索引擎的分类?

全文搜索引擎:通过平台来进行扫描网页中的各个关键词通过用户搜索展示相关内容。例如百度,谷歌

目录搜索引擎:以人工或半自动的方式搜集信息。例如:(Yahoo,Domz)

元搜索引擎:自己不进行提供一些内容(360搜索)


什么是搜索引擎营销?

利用人们对搜索的依赖,在人们搜索信息时将企业信息传递给目标用户。

SEO与SEM的优缺点?

SEO优点:效果好,流量比较精准,成本低比较好盈利,适用性比较强,覆盖面广

缺点:效果比较慢,排名规则的不确定性,排名的位置在竞价排名后

SEM缺点:价格高昂,恶意点击,管理麻烦,人员管理,局限性,稳定性差

优点:见效快,关键词数量无限制,关键词不分难易程度


搜索引擎的工作原理(重点)?

分为3个阶段:爬行与抓取、预处理、排名。

爬行与抓取是搜索引擎第一步工作,也就是在互联网上发现、搜集网页信息,同时对信息进行提取和建立索引库。

深度优先搜索:即蜘蛛沿着发现的链接一直向前爬行,直到再也没有其他链接。然后返回到第一个页面,再沿着另一个链接一直向前爬行。


预处理

提取文字:

提取出用于排名处理的网页文字内容。

中文分词:搜索引擎首先要分辨那几个字是组成一个

去停止词:对内容没有任何影响的词

消除噪声:对页面主题没有贡献的内容

去重:删除重复的内容

正向索引:按照分词程序划分关键词,将页面转换为由关键词组成的集合

倒排索引:需要搜索引擎将正向索引数据库重新构造成导引索引,把文件对应到关键词的映射转换为关键词到文件的映射。

链接关系计算:必须计算出页面上有哪些页面,使用了哪些链接。

由于页面和链接数量较大,因此链接关系及权重计算耗费时间较长。

特殊文件处理:如PDF、Word、WPS、XLS、PPT、TXT文件等。


排名:

用户在搜索引擎上提交搜索请求后,搜索引擎便会对该请求进行详细分析

文件匹配:文件匹配阶段就是找到含有所有搜索关键词的文件,并快速完成。

初始子集筛选:需要从所有的相关页面进行选择,只计算权重高的页面返回给用户,这个过程就是初始子集筛选。

相关性计算:选出初始子集后,需要对子集页面中的关键词相关性进行计算。

排名过滤及调整:匹配文件子集、计算相关性后,网页的排名基本确定。之后搜索引擎还会进行一些算法处理,轻微调整排名,其中最主要的是实施惩罚。

排名显示:所有排名确定后,排名程序会调用原始页面的标题标签、说明标签、快照日期等数据显示在页面上。

你可能感兴趣的:(搜索引擎)