基于深度学习技术的智能问答

   由于机器学习与自然语言处理技术的显著进步和大规模知识库以及海量网络信息的出现,自动问答系统离实际应用越来越近。然而业界应用和学术研究,问句的真实意图分析、问句与答案之间的匹配关系判别任然是制约自动问答系统性能的两个关键难题。

     问答系统是信息检索的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求。其中问答系统是目前人工智能和自然语 言处理领域中倍受关注并具有广泛发展前景的研究方向。不同类型的问答系统对于数据处理的方法存在不同,一般问答系统的处理框架都包括问句理解、信息检索、答案生成三个功能组成部分。

     问句理解:顾客的意图只是一种抽象形式,如果机器理解则需要转换成机器能理解的形式,以此作为答案检索的依据。在研究过程中,信息需求作为用户意图的代表,根据问句的语义结构可以从问题类别和问题内容两方面来表示。通常采用自然语言技术对问题进行深层次的理解。

     信息检索:根据问句理解得到的信息表示,信息检索负责从已购语料库、问答知识库中检索相关信息,传递给后续的答案生成模块。基于不同的问答系统,系统的检索模型以及检索数据形式也不同。对于基于问句答案对的问答系统,信息检索处理是通过问句检索得到与用户提问相似的候选问句,返回对应的候选答案列表。问句检索的主要研究方向在于如何缩小用户提问与知识库中问句之间的语义鸿沟

      答案生成:基于信息检索得到的检索信息,答案生成模块主要实现候选答案的抽取和答案的置信度计算,最终返回简洁性、正确性的答案。按照答案信息粒度,候选答案抽取可以分为段落答案抽取、句子答案抽取、词汇短语答案抽取。答案置信度计算是将问题与候选答案进行句法和语义层面上的验证处理,从而保证返回答案是与用户提问最为匹配的结果。应用最广泛是基于统计机器学习的置信度计算方法

 文章来源:www.xixi.ai(息息人工智能)

你可能感兴趣的:(基于深度学习技术的智能问答)