如何判断lda主题模型优劣

如何判断lda主题模型优劣

有用的链接:

原帖 https://datascienceplus.com/evaluation-of-topic-modeling-topic-coherence/
翻译:https://zhuanlan.zhihu.com/p/33053850
比较优劣代码:https://nbviewer.jupyter.org/github/dsquareindia/gensim/blob/a4b2629c0fdb0a7932db24dfcf06699c928d112f/docs/notebooks/topic_coherence_tutorial.ipynb#topic=0&lambda=1&term=
作图详细代码:https://datascienceplus.com/evaluation-of-topic-modeling-topic-coherence/
论文:http://svn.aksw.org/papers/2015/WSDM_Topic_Evaluation/public.pdf
进一步了解gensim的lda参数:https://blog.csdn.net/sinat_26917383/article/details/79357700

补充:https://zhuanlan.zhihu.com/p/50657430 【NLP文本分类】文本分类算法集锦,从入门到精通
对文件的读取转换
python3 读取txt、csv、mat文件数据并存入array具体实现https://blog.csdn.net/fsfsfsdfsdfdr/article/details/85036626
https://blog.csdn.net/vernice/article/details/50683637



你可能感兴趣的:(工具说明,可视化,数据挖掘,文本分析,机器学习)