从google产品来看搜索引擎需求

1)搜索需求

人human  <---> 关键字key <---> 信息infomation

 

2)网页搜索

搜索中最成熟的技术,从关键字找到信息,使用倒排索引这种极有效果的索引格式;

其它MP3搜索,新闻搜索等都是其一个子项,要么是限制站点的站内搜索,要么就是对时间特别敏感,有时效性;

 

3)网页目录导航

这是从信息中抽取关键字,自动网页分类技术; 用到的是数据挖掘技术,这个也比较成熟了.首先建起语料库,包括分类目录和各种目录下取一定数量的样本;其次是训练过程,使用

语料库,得到特征值,进行特征抽取,得到一个模型; 最后对搜索到的每个网页与模型进行匹配,划分到具体某个分类中.

 

4)个性化搜索

这是根据人的状况来推信息. 通过分析人的查询日志,用户资料,建起用户数据模型,然后向人推这个模型所对应的数据. (这是主动推的)

有一种个性化主页是通过RSS技术来实现内容的自动推取.(也就是这个模型是由人自己来确定的,是简化了的个性化搜索)

示例: 各种推荐子系统

 

5)map搜索

google终于整合了公交搜索到地图中,原先只是行车路线,现在准备到公交路线,实用性大大增强.

map搜索是google的特色之一,也是独有的核心技术之一,很强大的功能,有全球卫星的宠大照片数据库,配合google earth使用,将是google的利器.

6)垂直搜索

住房,车票等是属于垂直搜索的范畴了,以google强大的技术后备力量,如果要进入垂直搜索行业,别的人还真的很难与其竞争,只能把服务做的更细致,酷讯要努力了....

其它如代码搜索都只是其的一种应用而已...

 

你可能感兴趣的:(搜索引擎与P2P,google,搜索引擎,产品,数据挖掘,数据库,照片)