文本摘要实战:基于句子相似度矩阵构建图结构实现文本摘要 代码+数据

  • 任务描述: 自动文本摘要(Text Summarization)是指给出一段文本,我们从中提取出要点,然后再形成一个短的概括性的文本。自动的文本摘要是非常具有挑战性的,当我们作为人类总结一篇文章时,我们通常会完整地阅读它以发展我们的理解,然后写一个摘要突出其要点。由于计算机缺乏人类知识和语言能力,它使自动文本摘要成为一项非常困难和艰巨的任务。自动摘要通常分为抽取式摘要和生成式摘要,区别在于抽取摘要选择原文中若干句子作为只要,而生成式摘要利用文本生成技术根据原文生成摘要,这个摘要会出现原文中没有出现过的句子和词。本教程介绍一个简单的无监督抽取式摘要方法TextRank算法。

  • 数据集:https://download.csdn.net/download/qq_38735017/87092245

  • 运行环境

    Python>=3.6
    numpy>=1.18.0
    sklearn>=0.23.1
    networkx>=2.1
  • 方法概述:本案例主要实现一个文本摘要模型,具体流程如下图所示:

    文本摘要实战:基于句子相似度矩阵构建图结构实现文本摘要 代码+数据_第1张图片

你可能感兴趣的:(机器学习从入门到精通,python,sklearn,自然语言处理,word2vec)