集体智慧编程_前言

 

集体智慧编程》(《Programming Collective Intelligence》)

 

集体智慧编程_前言_第1张图片

这本书是我很久以前就很想看的一本书了,可能从名字上面看,很多人都会觉得莫名其妙,不知所云。的确,对于一般的望文生义,书名的确和机器学习以及数据挖掘很难沾上边。对于技术和研究人员来说,这本书对于机器学习以及数据挖掘方面的见解非常的独特,并非是一本非常枯燥的理论书籍,这里面设计的现在已经非常流行而且有很大经济效益的例子才是学而至用的最高境界。书中具的例子,很多和一些长尾理论非常的类似,而且提供的技术很多都是在说怎么从互联网上面挖出一些长尾的信息来。

 

一个很好的例子就是Netfix,一家在线的DVD租借公司,允许人们在线选购影片,然后由公司送货上门。是不是像现在的亚马逊,的确,他还有的一个特色就是提供DVD推荐。这部分技术为其带来的经济利益更加的巨大。通常利用一些老顾客的对影片的数据信息,来对从未访问过该网站的人员进行推荐,并且保证他们能够再次光临网站。还有一个例子是Google,他的排名之所以更加的精确,是因为它在计算相关度的时候,并非只是依赖于文档本身,而且还会依赖于其他的网页文档对其的评价贡献。他们的共同之处就在于先进的算法,将来自不同人群的数据加以组合,进而得出心得结论,并制造出心得商机。

 

什么是“集体智慧编程”?集体智慧一词出现已经很多年了,他的含义通常是:围了创造心得想法,而将一群人的行为、偏好或思想组合在一起。Internet的出现,使这个技术更加的收到重视,因为从千万网民中搜集信息的能力为我们提供了许多新的可能。集体智慧在以前的一个形式就是调查问卷的形式,以此来统计大量的信息。但是这个的前提是需要让用户停下来手工的参与。但是Internet上,这些关于用户的购买、搜索、娱乐等信息都可以隐式的得到收集,而且有大量的对他们进行挖掘和加工的方法。

 

什么是“机器学习”?它是人工智能领域中的一个子域,允许计算机不断的进行学习。大多数情况下,相当于将一组数据传递给算法,并由算法推断出与这些数据的属性相关的信息。借助这些信息,算法能够预测出未来有可能会出现的其他数据。这是有可能的,因为非随机数据中,都会包含这样或那样的“模式”,这些“模式”就是算法需要进行归纳的。所以机器学习的第一个过程通常都是训练,以此来得到这个“模型”。但是机器学习也有其缺陷,比如他受限于其在大量模式之上的归纳能力,如果遇到没有遇到过的数据,则很可能产生误解。

 

这个作为集体智慧编程的开篇吧,呵呵,以后可能还有很多的时间来进行研究,因为这的确是一本可能好好研读的书籍。

 

你可能感兴趣的:(编程,算法,数据挖掘,Google,文档,internet)