二、工业方案推荐系统

一、项目需求

1、背景需求

工业方案的推荐,由用户上传的文章,类似百度文库,存在一定的免费与付费文章。

2、数据描述

产品已经运行了一年多,现在需读其进行完善,加入推荐系统,

因此把数据从业务库中导出到本地,形成 articles.csv,ratings.csv,tags.csv文件,我们将读取数据并加载到 mongodb 和 elasticsearch 中。

  • 1)方案文章数据集:有 10 个字段,每个字段之间通过“^”符号进行分割。如:方案ID、名称、页数、描述、语言、类型、原作者、上传者、上传时间

  • 2)用户评分数据集:用户UID, 方案mid、分数score、时间戳timestamp

  • 3)方案标签数据集:用户UID, 方案mid、标签score、时间戳timestamp

3、项目框架

mongodb-linux-x86_64-rhel62-3.4.3 
redis

你可能感兴趣的:(项目经验,elasticsearch,大数据,python)