统计自然语言处理基础学习笔记(7)——句法分析

    在中文的自然语言处理种,句法分析是一个比较重要的部分。

    句法分析,英文为Parsing,指对句子种的词语语法功能进行分析。一个完整的汉语句子,一般有主语、谓语、宾语,复杂一些的句子就会出现各种各样的依存关系,包括补语、定语、状语、并列、同位语、数量、介宾、连动、疑问连动、兼语、关联、重复、标点、的字结构、地字结构、语气、时态等。如果在中文语言处理过程中,我们可以准确无误的对句子分析出这些依存关系,那么我们可以比较准确的找到这个句子的核心词。自然语言处理的初级目标就可以基本实现了。

    在句法分析的过程,我们会经常遇到指代的问题。例如,

    我毕业于**大学,我在这里生活了四年。它带给我很多的回忆。

    这里的“**大学”、“这里”都是指一个实体,属于共指现象。“它“与”生活了四年“属于指代关系。

    中文自然语言处理的指代非常难处理。按照指向,可以分为回指和预指,其中预指是用于指代下文的关系。不管如何指向,”指代“和”共指“关系都需要对文本的情景进行分析,这涉及语料上下文的分析。一般意义上讲,共指是可以脱离上下文存在,但为了更好的理解语义确不能脱离上下文,而指代是在一个下的范围内存在。它需要解决指代和共指是从哪里开始,到哪里结束。如果不能解决这个问题,将导致语句结构和语意不够清晰,影响整个文章的依赖关系的分析,比如“等价关系”,“上下位关系”,“整体和部分关系”等。

    近年来,共指消解(Coreference Resolution) 和指代消解(anaphora resolution)的研究受到了格外的关注,2000 年开始的ACE(Automatic Content Extraction) 评测会议中共指消解也是重要内容之一。中文的共指消解研究开始于二十世纪末。中文共指消解评测开始于2003 年ACE 会议。

你可能感兴趣的:(统计自然语言处理基础学习笔记(7)——句法分析)