计算语言学概论/俞士汶主编.北京:商务印书馆,2003


计算语言学概论/俞士汶主编.北京:商务印书馆,2003_第1张图片
 

 信息检索

 
计算语言学概论/俞士汶主编.北京:商务印书馆,2003_第2张图片
 

 

信息提取

    一般而言,信息抽取系统进行的工作是这样一个计算机程序系统,这个系统的输入时非受限的文本,系统按照用户的预期,从文本中提取出用户预先指定的某些类型的信息。

实质上,信息抽取系统进行的工作是从非结构化的文本中提取结构化的信息。

 

    信息提取系统的应用价值在:(1)情报收集;(2)科技文献监控;(3)医疗保健服务;(4)商业信息提取。其中商业信息提取的应用中,可以专门设计一个信息提取系统,分析新闻中的商业信息,提取诸如有关公司合并、合并的参与方以及合并涉及金额等信息,提供决策支持信息。

 

    信息提取的具体任务:(1)准确识别文本中的各种命名实体,这一般包括文本中出现的人名、地名、机构名、时间表示、货币表示以及各种数字等等;(2)准确识别并标记指称相同的不同语言元素,这种指称相同的语言元素一般称为共指;(3)利用领域知识进行推理,在实体—实体之间,实体—事件之间建立关系。

 

你可能感兴趣的:(工作,医疗)