以中文信息处理为基础,面向多种媒体格式
以网络服务系统与软件开发包两种形式支持二次开发
支持多种操作系统平台,提供多种语言开发接口
采用XML进行数据交换
方正智思知识管理平台软件是北大方正技术研究院挟多年积累的中文信息处理的技术精华,研发推出的一个中文智能信息挖掘与知识管理的软件系统及软件开发包。它提供对海量文本、图片、视音频等数字化内容进行智能检索、智能分析及智能自动处理的功能。以其为基础可方便地进行应用系统的开发,快速实现具有智能信息挖掘与知识管理功能的应用,帮助用户完成海量信息的智能分析处理,推动政府、媒体和企业的信息化进程,助力电子传播。
体系结构
方正智思是以中文信息处理技术与数据挖掘技术为核心技术的平台软件,其体系结构图如下:
方正智思体系结构图
平台特点
以中文信息处理为基础,面向多种媒体格式
以网络服务系统与软件开发包两种形式支持二次开发
支持多种操作系统平台,提供多种语言开发接口
采用XML进行数据交换
功能特点
1.智能检索
全文检索
Ø 基于中文分词的多种索引单位;多信息域、多数据类型的索引方式;相关度排序的输出方式;丰富的检索运算;多文档格式、多数据源的支持;多平台、多语种的支持;简单易用功能强大的开发接口;高扩展性与高开放性。
Ø 应用中支持海量数据检索,索引检索速度快,膨胀率低,系统资源占用小。
图像内容检索
Ø 能够实现以图像内容(如:颜色、纹理、布局)为基础,结合描述信息的综合检索。
Ø 应用中可实现基于内容的海量图像的快速检索。
2.智能分析
自动消重
Ø 利用文档的内在特征信息进行智能分析,判断文档的相似性与重复性。
Ø 应用中可实现海量文档场合的快速相似判断,能够对文本自动消重,降低文章冗余度、避免文章重复发布。快速查找相似文本,向检索者提供相关推荐等功能。另外这一引擎同样适用于图像的消重与相似检索。
趋势分析
Ø 趋势分析能够实现与时间相关的分析。
Ø 应用中可实现分析热点话题并能够判断其“热度”趋势等功能。
关联分析
Ø 关联分析可从海量数据中挖掘信息之间的关联关系。
Ø 应用中通过对稿件库的关联分析发现稿件之间的关联关系、稿件中词与词的关联关系,新闻事件之间的关联关系,并自动为稿件建立关联链接、提供新闻事件间关联分析参考。
主题检测/追踪
Ø 主题检测追踪能够在各种信息来源中追踪与讨论目标主题相关的信息片段(如单个文档,新闻报道等等)。而主题检测任务则能够实现自动检测信息片断集合中的各个未知主题,并能在线检测出新主题。
Ø 应用中可实现对新闻事件的分析,快速识别新闻事件、追踪热点事件,辅助进行专题报道等功能。
3、智能处理
自动摘要
Ø 自动摘要能够在篇章分析的基础上为文档自动形成摘要。
Ø 应用中自动形成的摘要不仅拥有很强的准确性,而且具有很好的可读性。
自动关键词提取
Ø 自动关键词提取则是通过智能的手段为文档自动提取关键词。
Ø 应用中有效解决了人力手工标注的局限性,不仅提高了效率,而且准确性高。
自动分类
Ø 自动分类具有树状层次分类功能,能够快速自动地对大量文档进行分类。
Ø 应用中可实现对新闻稿件、图书资料、图像的自动分类。
自动聚类
Ø 自动聚类可对检索结果进行自动聚类并构建树状结构,以构建企业知识地图、检索者快速定位所需信息。
Ø 应用中可实现对新闻稿件或大数据量文档的自动聚类,实现辅助专题制作等。