【淘宝用户购物行为分析】数据挖掘实验四

文章目录

  • I、项目任务要求
    • 任务描述:
    • 主要任务要求:
  • II、原理描述
  • III、数据集描述
    • 数据集来源
    • 数据描述
    • 变量分析
    • 数据预处理
  • IV、具体实现过程
  • V、结果分析
  • VI、完整代码


I、项目任务要求

任务描述:

  • 关联分析用于发现用户购买不同的商品之间存在关联和相关联系,比如A商品和B商品存在很强的相关性,常用于实体商店或在线电商的推荐系统,例如某一客户购买A商品,那么他很有可能会购买B商品,通过大量销售数据找到经常在一起购买的商品组合,可以了解用户的购买行为,根据销售的商品推荐关联商品从而给出购买建议,寻找销售新的增长点。
  • 本次实验采用关联算法从两方面对淘宝用户购物行为进行分析:
    • (1)用户购买哪种商品次数最多;
    • (2)用户购买的商品中,哪些商品组合关联度高。
  • 实验内容:分别采用AprioriFP-growth算法实现淘宝用户购物行为分析,并写出实验结果分析。

主要任务要求:

  • 1、数据集下载网页(https://zhuanlan.zhihu.com/p/76357500)。
  • 2、分别简述Apriori、FP-growth算法思想和实现原理。
  • 3、写出实验结果分析:
    • (1) 数据集描述。
    • (2) 实验运行环境描述:如开发平台、编程语言、调参情况(最小支持度、最小置信度)等。
    • (3) 采用Apriori算法实现淘宝用户购物行为分析。
    • (4) 采用FP-growth算法实现淘宝用户购物行为分析。
    • (5) 两种算法结果比较分析:
      • 算法性能比较;
      • 兴趣因子(支持度)评估比较;
      • 淘宝用户购物行为分析比较。

参考资料网址: 基于Python的Apriori和FP-growth关联分析算法分析用户购物关联度


II、原理描述


III、数据集描述

数据集来源

数据描述

变量分析

数据预处理


IV、具体实现过程


V、结果分析


VI、完整代码


你可能感兴趣的:(【数据科学与大数据技术】,数据挖掘,人工智能)