spark(57) -- SparkMllib -- SparkMllib的算法的分类和应用场景

 这里通过设计一套商品推荐系统来分析解析Spark中提供算法对大数据从场景下业务的支持。

1. 机器学习系统设计及架构

 这里以推荐系统为例,假设存在一个贴近现实的情景。假设我们受命领导MovieStream数据科学团队。MovieStream是一家假想的互联网公司,为用户提供在线电影和电视节目的内容服务。
MovieStream现有系统可概括为:


 如图所示,向用户推荐哪些电影和节目以及在站点的何处显示,都由MovieStream内容编辑团队负责。该团队还负责MovieStream的群发营销,包括电子邮件和其他直销渠道。现阶段,MovieStream以汇总的方式来收集用户的电影浏览记录,并能访问一些用户注册时所填写的资料。此外,他们还能访问其所收录的电影的一些基本元数据。

 随着业务快速发展,新发布的电影和用户的活动不断增加,MovieStream团队愈发难以跟上这

你可能感兴趣的:(大数据学习,spark,机器学习)