使用协同过滤推荐算法进行电影推荐

机器学习算法,pyspark中的ALS算法,实现对用户的电影推荐。

文章目录

    • 机器学习算法,pyspark中的ALS算法,实现对用户的电影推荐。
      • 1. Spark是一个开源的并行计算与分布式计算框架,最大特点是基于内存运算,适合迭代运算,兼容Hadoop生态系统的组件,同时包括相关的测试和数据生成器。
      • 2. 主要用于解决全栈式批处理、结构化数据查询、流计算、图计算和机器学习的应用,适用于需要多次操作特定数据集的应用市场。
      • 3. 需要反复操作的次数越多,所需读取的数据量越大,效率提升越大,这方面比Hadoop快很多倍。
      • 4. 集成的模块:Spark SQL Spark Streaming MLlib GraphX SparkR(支持R语言的库)
      • 5. 基于spark的协同过滤推荐算法并灭有依赖具体的业务数据,比如电影的内容分析和用户特征属性分析,证明是一个通用的算法框架,可以用户其他行业的个性化推荐,比如餐饮推荐,音乐推荐等,只要将评分数据转化成.csv格式即可直接应用。

你可能感兴趣的:(机器学习)