基于 LDA SS-NMF 的文本主题分析可视化分析系统 毕业设计 附完整代码

摘要

在机器学习和自然语言处理领域中,主题模型(Topic Model)是在一系列文档中发现抽象主题的一种统计模型,并被广泛地应用于文本文档集合的分析。近年来,各种主题建模技术,特别是概率图建模技术,取得了显著的进展,其中隐含狄利克雷分布(LDA)等最先进的技术已经成功地应用于可视化文本分析。然而,大多数基于概率模型的方法在多次运行的一致性和经验收敛性方面存在缺陷。此外,由于公式和算法的复杂性,LDA 无法轻易合并各种类型的用户交互和反馈。本课题的主要目的是设计一个主题模型可视化分析系统,使用非负矩阵分解的方法对文本进行主题建模,将训练过程和结果实时地可视化呈现给用户,并以半监督模式为核心,设计一系列用户交互方式,达到基于用户驱动的文本主题模型交互优化。在经过若干次模型交互优化后,如果用户对当前训练的主题模型感到满意了,便可以使用此模型来对语料库之外的新文档进行拟合,从而得到新文档的主题分布预测。本系统采用 Web 技术,后端算法和接口使用 Python 语言和 FastAPI Web 框架编写,前端界面使用 React&Ant Design 框架编写。本系统中收录了现实网络上多种类型的语料库(

你可能感兴趣的:(计算机毕设,课程设计,python,人工智能,LDA,主题分析)