nlp-fasttext实战短文本分类(携程酒店评论数据)

FastText主要用于词向量训练和文本分类任务中,因为速度快和效果明显被广泛应用于工业界中。
日常项目研发中涉及到文本多分类,博主通过快速实验积累相关领域知识、技术;从而夯实个人研发方法论。通过实验对比分析感受fasttext朴素贝叶斯的效果与区别。

文章目录

  • 一、fasttext环境搭建
  • 二、数据准备
    • 1.7K条携程酒店评论数据
    • 2.停用词数据
  • 三、fasttext实战代码
    • 1.引入函数库,`缺什么包安装即可`
    • 2. 数据读取、抽样
    • 3. 停用词处理
    • 4. `fasttext`模型训练
      • 1) df01数据取样
      • 2) predict负样本
    • 5. 效果评估
    • 6. 模型保存与重加载
  • 四、`朴素贝叶斯`算法效果

你可能感兴趣的:(NLP,自然语言处理,分类,fasttext)