AVATAR--文本的信息抽取系统(System Text for Information Extraction)

       AVATAR是由IBM的Almaden研究中心研发的信息抽取系统,它是一个能够让企业进行决策性的信息抽取的系统。基于这个系统蓝本,系统使得从非结构化文本中抽取结构化的信息变得容易,从而可以构建企业的应用平台。其内部测试版本包括两个特点:第一,AQL语句,这是一种结合了SQL特点的规则语句,它拥有IBM的代数抽取技术的表达能力;第二,系统包括一个编辑和创建抽取规则及其运行的开发环境。

      系统下载页面:http://www.alphaworks.ibm.com/tech/systemt/

      运行时先将下载文件解压,然后运行bin/startserver.sh,接着打开浏览器,输入http://localhost:8083/aql/,就可以使用系统了。

      系统是一个提供运行环境的平台,需要自己创建AQL抽取规则和被抽取的文本(这个当然)。

你可能感兴趣的:(AVATAR--文本的信息抽取系统(System Text for Information Extraction))