第一章、搜索引擎营销概念
什么是搜索引擎?常见的搜索引擎有哪些?搜索引擎的分类?搜索引擎的工作原理?
1.认识搜索引擎
2.搜素引擎的分类、发展史及特点
3.搜素引擎营销的原理及形式
4.搜索引擎营销的特点及流程
5.搜索引擎的工作原理
什么是搜索引擎?
一种检索系统。根据一定的策略、运用特定的计算机程序从互联网上搜集信息。对信息进行组织和处理后,为用户提供检索服务。将用户检索相关的信息展示给用户。
搜索引擎的发展历史,分为四个时代
1.分类目录时代:
有好123、360导航、2345、金山毒霸等。
人工手机整理,在后台把各种网站分类整理,放在页面上
2.文本检索时代:
用户将想要搜索的信息提交给服务器,通过服务器查阅,再反馈给用户关注比较高的一些信息通过实现提取网页中的一些信息直接提取所查内容
3.链接分析时代:
充分利用网页之间的链接关系,通过链接分析技术,在海量的内容中找到重要的网页,但是此时他们没有考虑用户的个性化需求,所以就只是只要输入相同的信息就是相同,而不是不同的人一用户为中心时代
4.用户中心时代:
千人千面,如淘宝。京东等;每个人进入首页,所展现的页面都是不同的,以用户需求为中心,用户想看什么就给他们展现什么
搜索引擎分类:
1.全文搜索引擎
通过计算机索引程序扫描网页中每个词建立一个索引,当用户查询时,检索程序会根据事前建立的索引进行查询,并将结果反馈给用户。全文搜索引擎搜索方法分为按字检索和按词检索。
代表:百度、谷歌
2.目录搜索引擎
以人工或半自动的方式搜集信息,由编辑人员看后,人工进行信息摘要,将信息置于事前确定的分类框架中,这些信息主要面向网站,提供目录浏览服务和章节检索服务。
最具代表的就是Yahoo、Dmoz目录搜索。
3.元搜索引擎
通过一个统一的用户界面帮助用户在多个搜索引擎中选中和利用合适的搜索引擎来实现检索操作,是对分布于网络中的多种检索工具的全局控制机制。
具有代表性的元搜索引擎 360搜索。
常见的搜索引擎
谷歌:全球最大搜索引擎,由拉里·佩奇和谢尔盖·布林共同创建。
百度:2001年由李彦宏创建,国内最大的搜索引擎。
360搜索:2012年由周鸿祎创建的奇虎360公司推出
神马搜索:由UC和阿里巴巴2013年联合推出的移动搜索引擎。
搜狗搜索:2004年搜狐公司推出的第三代互动式中文搜索引擎。、
搜索引擎在营销中的位置
搜索引擎是营销的重要收口
搜索引擎营销的概念
搜索引擎营销(简称SEM)是一种基于搜索引擎平台而开展的新型网络营销方式,利用人们对搜索引擎的依赖和使用习惯,在人们检索信息时将企业信息传递给目标用户。 (它的基本思想是让用户发现信息,并通过点击进入网页,进一步了解所需要的信息,企业通过搜索引擎付费推广,让用户可以直接与公司客服进行交流,从而实现产品交易)
搜索引擎营销工作原理
用户搜索:通过检索功能或者专业的搜索平台,如百度
返回结果 :得到结果:排名展示,可以争取的宣传位:排名
查看结果:阅读结果,获取自己想要的信息:吸引用户进入网站
浏览网站:选择吸引自己的信息:点击
咨询搜索:决策,并采取相应的行动:引导转化
搜索引擎的营销形式(自然排名,竞价排名)
搜索引擎营销 = SEM
SEM = SEO + PPC
SEO = Search Engine Optimization ,直译:搜索引擎优化
PPC = Pay Per Click,点击付费广告
CPC(Cost per click),按点击付费
SEM---SEO SEM---PPC
SEO和PPC的优缺点分别是什么?
SEO:操作难度高,引入流量高,引流速度慢,成本低
PPC:操作难度低,引入流量高,引流速度快,成本高
搜索引擎营销特点
1.搜索引擎营销的基础是企业网络营销信息源
2.搜索引擎营销与企业网站密不可分
3.搜索引擎营销具有主动性
4.搜索引擎营销受众可信度高
5.搜索引擎营销门槛低,竞争激烈
搜索引擎营销基本流程
商业分析:明确网站搜索引擎所达到的目的,是招商加盟还是什么的
市场调查:用户是怎样搜索到这个产品的,常用的搜索词是什么,竞争对手他们是如何做,流量来源是什么,有没有做广告,在那些平台做过广告
搜索引擎优化(主要的一个内容):不管站内,各大标签的一个设置。站外,链接的一个优化
实施链接策略:虽然不太重要但是还是不可或缺,
网站提交:站内网络优化后就要提交给搜索引擎,付费或者免费的都要。
付费收录排名:看公司有没有经费预算,有的话就使用
管理搜索引擎:跟踪目标关键词的排名,根据数据统计攻击,网站后期日志,网站的主要用户来源主要是哪里。
(要有针对性的来做。)
搜索引擎营销改变了营销模式
传统营销:企业营销行为;推 -渠道 。拉 -品牌 消费者行为:无(被动接受)
搜索引擎营销:企业营销行为;送 -文字 -图片 -FLASH -视频 消费者行为:找(主动寻找)
搜索引擎营销改变了营销模式,让客户变被动为主动,让营销更精准。
搜索引擎工作原理(爬行与抓取、预处理、排名。)
一.爬行与抓取
在互联网上发现、搜集网页信息,同时对信息进行提取和建立索引库。通过互联网来发现和建立自己的一个引导库
1.蜘蛛:蜘蛛指一种自动爬行访问和抓取网页信息的程序或脚本。其主要作用是浏览信息,然后把这些信息都抓到搜索引擎服务器上,建立索引库。(一种程序自动抓取网络上的页面)
常见的蜘蛛有百度蜘蛛、Google蜘蛛、搜狗蜘蛛等。
2.跟踪链接
为了抓取更多的链接蜘蛛会跟踪页面上的链接,从一个页面到另一个页面,就像蜘蛛在网上爬行一样。
蜘蛛爬行的策略分两种,即深度优先搜索和广度优先搜索。
(深度优先搜索:即蜘蛛沿着发现的链接一直向前爬行,直到再也没有其他链接。然后返回到第一个页面,再沿着另一个链接一直向前爬行。)(广度优先搜索:蜘蛛在一个页面上发现多个链接时,不是顺着一个链接一直向前,而是把页面上所有的第一层链接爬行完后再沿着第二层页面上发现的链接爬向第三层链接。)
3.吸引蜘蛛:网站和页面权重、页面的更新频率、网站的原创内容、网站地图
4.地址库,素材库自动抓取:人工录入种子网站、蜘蛛从HTML中解析出的新链接、站长向搜索引擎提交的网址、站长通过网站地图提交的网址
5.文件存储:文件储存是搜索引擎蜘蛛抓取的数据被存入原始页面数据库。其中的页面数据与用户浏览器得到的HTML是完全相同的。每个URL都有一个独特的文件编号。
6.爬行时检测内容:当蜘蛛爬行和抓取文件时会进行一定程度的复制内容检测,遇到权重低的网站上大量转载或抄袭内容时,便不再继续爬行。
二、预处理
因为搜索引擎数据库网页较多,用户搜索后,索引计算量太大,很难在短时间内返回搜索结果,因此必须对页面进行预处理。
1.提取文字:搜索引擎预处理首先要做的就是从HTML文件中去除标签和程序,提取出用于排名处理的网页文字内容。(文章里面的内容)
2.中文分词:中文的词与词之间没有任何分隔符,一个句子里面所有字和词都连在一起。因此,搜索引擎首先要分辨那几个字是组成一个词的,哪些字本身就是一个词。
中文分词有两种方法,即基于词典匹配分词法和基于统计分词法。(1。将待分析内容与词典中的词进行匹配,待分析汉字扫描到词典中已有的词条,则说明匹配成功,或者可以说切分出一个单词。)(2.对大量的文字样本进行分析,计算出字与字相邻出现的概率,字与字之间相邻出现的次数越多,越可能形成一个单词。这种方法的优势是对新出现的词反应更快速,也有利于消除歧义。)
3.去停止词:停止词指网页内容中出现频率很高,但是对内容没有任何影响的词,因为它们对页面内容并无没实质影响。搜索引擎在索引页面之前会去掉这些停止词。(去掉了对文章也没用影响的词)
4.消除噪声:噪声指对页面主题没有贡献的内容,比如版权声明、导航条、广告等,这些内容对页面主题只能起到分散作用。因此搜索引擎需要识别并消除这些噪声,排名时不使用噪声内容。
5.去重:搜索引擎并不喜欢重复性的内容,所以在进行索引前对内容进行识别,删除重复的内容,
6.正向索引:经过文字提取、分词、消噪、去重之后,搜索引擎就可以提取关键词,按照分词程序划分关键词,将页面转换为由关键词组成的集合,其中每个关键词词频、格式、位置等权重信息都记录在案。
7.倒排索引:如果搜索引擎只能正向索引,排名程序需要扫描所有索引库的文件,再进行排名计算,这样计算量无法满足实时返回排名结果的要求,因此需要搜索 引擎将正向索引数据库重新构造成导引索引,把文件对应到关键词的映射转换为关键词到文件的映射。(其实就是一个是正序搜索,一个是倒序搜索)
8.链接关系计算:目前的搜索引擎中都包含着网页之间的流动信息。搜索引擎在抓取页面内容后,必须计算出页面上有哪些页面,使用了哪些链接。由于页面和链接数量较大,因此链接关系及权重计算耗费时间较长。
9.特殊文件处理:除了HTML文件外,搜索引擎通常还能抓取和索引以文字为基础的多种文件类型,如PDF、Word、WPS、XLS、PPT、TXT文件等。
三、排名
1.对提交的搜索请求进行分析:用户在搜索引擎上提交搜索请求后,搜索引擎便会对该请求进行详细分析。
(中文分词、去停止词、去停止词、拼写矫正、整合搜索触发)
2.文件匹配:搜索词经过处理后,搜索到的是以词为基础的关键词集合。文件匹配阶段就是找到含有所有搜索关键词的文件。通过倒排索引使得文件能够快速完成。
3.初始子集筛选:为了快速满足用户的搜索需求,搜索引擎需要从所有的相关页面进行选择,只计算权重高的页面返回给用户,这个过程就是初始子集筛选。
4。相关性计算:选出初始子集后,需要对子集页面中的关键词相关性进行计算。(关键词常用度、链接的使用和页面权重、关键词出现的位置、关键词密度和字频、关键词距离)
5.排名过滤及调整:选出匹配文件子集、计算相关性后,网页的排名基本确定。之后搜索引擎还会进行一些算法处理,轻微调整排名,其中最主要的是实施惩罚。
6.排名显示:所有排名确定后,排名程序会调用原始页面的标题标签、说明标签、快照日期等数据显示在页面上。
搜索引擎工作原理
去引区:(蜘蛛从索引区出发抓取网页)
网页:将抓取到的网页存放到临沭库中进行处理:——临时库然后循环回网页:
临时库:(符合规则去索引区)(不符合规则清理)
索引区:(在索引区进行分类、归档、排序、然后将结果反馈给用户)——搜索引擎查询