深度学习--知识图谱

知识图谱

软件知识的来源:

源代码、邮件列表、缺陷报告和回答文档

软件爆炸过程中面临的问题:

1:复用者的学习成本越来越高

2:不同类型的软件知识的特征不同

3:从不同类型软件中抽取出来的软件实体的关系错综复杂,软件人员难以理解

 

提出软件知识图谱方面的知识!

 

定义:软件知识图谱是指由不同类型的软件资源的软件复用,知识图有机融合构成的用以描述某一软件的知识体系。软件知识图是指由同一类型软件资源的软件 知识实体以及之间的关联关系所构成的图。软件知识实体指的是软件资源中可区分的、可辨识的且具有一定语义关系的单元体,而软件知识实体之间的关联关系指的是两两软件知识实体之间的具有某种类型的二元关系。

 

目前已经做的工作:

  1:Hipikat 为一个指定项目收集资源和挖掘 各类资源之间的关联关系,建立了项目的资源数据 库。复用者可以在该库中迚行检索,系统将返回与 乊文本相似度较高的各种资源以及 间的关联关 系,方便复用者学习。但是 Hipikcat 对于每类软件 资源仅提取了对应的文本信息,未对软件资源做迚 一步的知识提取。

 2:Gopinath [5] 从软件项目的代码 中提取出包、类、接口和方法信息,定义了项目、 包、类、接口、方法等本体,将所有项目的本体存 储在同一个本体网里,以帮助开发者复用已有的软 件。

 3:McMillan [6] 构建了代码中函数之间的调用关 系图,用于在代码搜索系统中帮助使用者检索函数 以及使用示例。

4:DBPedia 支持用 户迚行语义化查询维基百科相关资源的属性和资 源之间的关系。谷歌的知识图谱将谷歌索引的所有 事物、人物和地点,例如地标性建筑、名人、球队、 电影、艺术品等,刻画成实体,并建立起这些实体之间的关联关系。

 

问题分析:

 采用属性图模型来表达节点和关系丰富的信息,图中每个结点对应一个软件知识实体;图 中的每条有向边代表一个语义关联;每个软件知识 实体中的键值对与实体所对应的结点属性一一对 应;每个结点或边由全局标识符唯一标识。

解决方案:

1:软件知识提取

2:建立软件知识实体联系,有机结合不同类型的软件资源独立的软件知识图,形成知识图谱

3:最后建立知识检索与展现机制

你可能感兴趣的:(深度学习)