提取中文文本摘要

环境 python3, gensim

from gensim.summarization.summarizer import summarize
from pyltp import SentenceSplitter
import jieba
text="""国际标准化组织对机器人的定义是:机器人是一种能够通过编程和自动控制来执行诸如作业或移动等任务的机器。我国科学家对机器人的定义是:机器人是一种自动化的机器,所不同的是这种机器具备一些与人或生物相似的智能能力,如感知能力、规划能力、动作能力和协同能力,是一种具有高度灵活性的自动化机器。"""
print(len(text))
sents = SentenceSplitter.split(text)
print(len(sents))
ss = []
for sent in sents:
    temp = list(jieba.cut(sent, cut_all = False))
    ss.append(" ".join(temp))   
output = ". ".join(ss)
summ = summarize(output, word_count=100)
summ=summ.replace(".","")
summ=summ.replace(" ","")
summ=summ.replace("\n","")
print(summ)

你可能感兴趣的:(python,NLP,自然语言处理,python)