Google有意思的一个小工具Google Sets

这两天在看python的新闻时,无意中发现google有这么一个有意思的工具Google Sets,你输入几个关键词,他可以根据这些词的相关度,匹配出一组类似的关键词出来,比如,我输入nokia,eircssion,motorola.

Google有意思的一个小工具Google Sets_第1张图片

可以匹配出相关度很高的一些关键词出来。

Google有意思的一个小工具Google Sets_第2张图片
我想对于Google要实现这个工具来说应该是小Case了,毕竟google关键词搜素中一个关键的技术就是相关度分析,这个工具只不过也是采用了相关度分析得出来的,将相关度最高的一些关键词列出来了。

至于什么是相关度,我们可以举个最简单的例子来打比方。
比如我们在google中搜索nokia,我们可以搜索到275,000,000个网页,搜索motorola可以搜索到大概137,000,000个网页,如果以nokia AND motorola为关键字搜索,我们可以搜索到大概76,400,000个网页,那么可以计算出nokia和motorola两个关键词的相关度: 76,400,000/(275,000,000 + 137,000,000 - 76,400,000) = 0.22765196662693682.我们可以认为这两个关键词的相关度为22.8%.通俗一点说,关键词相关度就是两个关键词之间的亲密程度,二者双双出现的概率。相关度越高,说明二者越亲密。现在很多网站的SEO们研究的一个主要课题就是相关度了。

 
这个工具从国外的一些文章来看,似乎还是大有文章可做的,比如这一篇《 DNS Name Prediction With Google》,就提到采用这个相关度方法进行DNS预测,我倒是想到一个有趣的用处,很多老外公司喜欢出那种智力、逻辑测试题,从一组词中选择最合适的匹配项,好像也是变相的从相关度上进行设计的。
Google Sets这个工具使用起来很简单,参数传递也是通过URL传递的,我们需要使用时,完全可以模拟出来,还真有一个老外用python实现出来了,可参考《 Python Library for Google Sets》一文,简单的看了一下代码,也就是模拟网页请求,然后采用了一个BeautifulSoup库,将返回的结果HTML网页解析成DOM树,提取其中的结果出来,试用了一下,还不错。如果大家想用这个功能,可以考虑一下这个库。我看了一下这个库,还可以分析google的搜索结果功能,以后可以考虑借过来用。





 

你可能感兴趣的:(Google有意思的一个小工具Google Sets)