Python数据分析案例33——新闻文本主题多分类(Transformer, 组合模型) 模型保存
案例背景对于海量的新闻,我们可能需要进行文本的分类。模型构建很重要,现在对于自然语言处理基本都是神经网络的方法了。本次这里正好有一组质量特别高的新闻数据,涉及'教育''科技''社会''时政''财经''房产''家居'七大主题,基本涵盖了所有的常见的新闻类型。每个主题取了1w条,总共7w条数据,也还符合深度学习的数据量。正好我也构建了很多神经网络的序列模型,来验证一下哪些模型在这个数据集上表现较好。数