使用paddle进行酒店评论的情感分类10——清洗数据集

由于运行结果不理想,本人重新对着数据集看了一遍,写了个脚本,具体见https://blog.csdn.net/weixin_46538207/article/details/132083745
筛选后的数据集及后续修改过超参数的相关文件我将单独打包起来放在csdn上 。
对于原始的数据集,我发现有些归为正例的评价实际上评论内容非常负面,可能是为了获得更多的关注特意为之,我手动将数据集过了一遍,删去与评分不匹配的评论,经过了一天时间,完成了数据集清洗。相关文件见专栏内。

你可能感兴趣的:(paddle,paddle)