工业方案的推荐,由用户上传的文章,类似百度文库,存在一定的免费与付费文章。
产品已经运行了一年多,现在需读其进行完善,加入推荐系统,
因此把数据从业务库中导出到本地,形成 articles.csv,ratings.csv,tags.csv文件,我们将读取数据并加载到 mongodb 和 elasticsearch 中。
1)方案文章数据集:有 10 个字段,每个字段之间通过“^”符号进行分割。如:方案ID、名称、页数、描述、语言、类型、原作者、上传者、上传时间
2)用户评分数据集:用户UID, 方案mid、分数score、时间戳timestamp
3)方案标签数据集:用户UID, 方案mid、标签score、时间戳timestamp
mongodb-linux-x86_64-rhel62-3.4.3
redis