【译】mahout in action 1 初识Mahout

本章内容:
.什么是mahout

.初识推荐引擎,聚类,分类在现实生活

.建立mahout

你们可能已经从标题中猜出,这本书是关于一个特定的工具Mahout,在现实生活中使用。那么什么是mahout?

Mahout是一个Apache的开源机器学习项目。该算法属于广阔的 “机器学习”,或“集体智慧的伞形结构。这就可以代表很多东西,但此时此刻,我们关心Mahout的主要部分是:协同过滤(CF)/推荐引擎(recommender),聚类(clustering)和分类(classification)。

它具有很强的扩展性。当被处理的非常巨大的数据量,对单个机器来说可能太巨大以至于无法完成时,Mahout旨在成为处理数据的机器学习工具。在它当前的体现中,这些可扩展性的实现是用Java语言写成的,有些部分是建立在Apache Hadoop分布式计算项目上。

它是一个Java library。它不提供一个用户接口,一个预先的jar包服务,或安装文件。它是一个开发者用于使用和改装的工具的框架。

你可能感兴趣的:(apache,数据结构,算法,hadoop,生活)