Neo4j在知识图谱中的应用(3)——PMP项目管理知识模型与数据的批量导入

模型概述

根据PMBOK指南(项目管理知识体系指南)第6版,首先建立三个核心概念之间的关系:项目管理过程、工具与技术、输入输出。
其中,每个过程(Process)有若干个输入(INPUT)、工具和技术(TT)和输出(OUTPUT),当然,各过程的输入输出工具与技术都可以复用,因此形成了复杂的多对多关系。
三个核心概念和它们之间的关系都事先写到文本文件中批量导入。

准备文件

文件process.csv记录了49个过程的信息,格式如下,

processId:ID,name,knowledgeArea,processGroup,describe,:LABEL
p01,"制定项目章程","整合","启动","编写...",Process
p02,"制定项目管理计划","整合","规划","协调项目...",Process
……

processId表示过程ID,在Neo4j全局这个ID必须唯一,跟任何类型的节点ID都不能重复。name,knowledgeArea,processGroup,describe是节点的属性,LABEL指出该节点类型,本文件中节点类型都是Process

文件TT.csv记录了136个工具与技术的信息,格式如下,

ttId:ID,name,sort,describe,:LABEL
tt001,"标杆对照","数据收集","指将实际...",TT
tt002,"头脑风暴","数据收集","用于在...",TT
……

本文件中节点类型都是TT

文件IO.csv记录了85个输入输出的信息,格式如下,

ioId:ID,name,sort,describe,:LABEL
io01,"范围管理计划","项目管理计划","确立...",IO
io02,"需求管理计划","项目管理计划","确定...",IO
……

本文件中节点类型都是IO

导入

下面把三个文件导入neo4j

进入neo4j根目录,删除原有data目录:

rm -rf data

把csv文件上传到服务器,我直接传到neo4j根目录,执行下面语句导入

bin/neo4j-admin import --nodes process.csv --nodes io.csv --nodes tt.csv --multiline-fields

multiline-fields参数表示字段中允许换行
重启neo4j服务

bin/neo4j restart

因为删除了data目录,再次登录时密码重置为neo4j,需要再次修改
执行

match(n) return n

结果如下,因为没有设置节点之间的关系,只展示了三类节点


Neo4j在知识图谱中的应用(3)——PMP项目管理知识模型与数据的批量导入_第1张图片
1.png

建立节点之间关系

接下来写一个文件relation.csv记录节点之间的关系:

:START_ID,:END_ID,:TYPE
p01,io53,INPUT
p01,io54,INPUT
p01,io72,INPUT
p01,io55,INPUT
p01,io56,INPUT
p01,tt098,TT
p01,tt002,TT
p01,tt005,TT
p01,tt006,TT
p01,io57,OUTPUT
p01,io22,OUTPUT

:START_ID表示关系的开始节点,:END_ID表示结束节点,:TYPE表示关系类型。解释一下第一行,p01节点代表“制定项目章程”过程,io53节点代表“商业论证”这个文件,INPUT表示输入关系,因此这行表明制定项目章程的一个输入是商业论证

删除data节点,完整执行下面语句:

bin/neo4j-admin import --nodes process.csv --nodes io.csv --nodes tt.csv --relationships relation.csv

重启动neo4j服务器,可以查看完整关系图如下,展现出了各种关系。


Neo4j在知识图谱中的应用(3)——PMP项目管理知识模型与数据的批量导入_第2张图片
1.jpg

查询

接下来就可以进行图查询了,
查询“制定项目章程”这个过程的工具和技术,语句如下:

match(p)-[:TT]-(t) where p.name="制定项目章程" return (p)-[:TT]-(t)

结果如图:


Neo4j在知识图谱中的应用(3)——PMP项目管理知识模型与数据的批量导入_第3张图片
1.png

查询执行过程组中哪些过程输出了“变更请求”

match(p)-[:OUTPUT]-(io) where p.processGroup="执行" and io.name="变更请求" return p.name
Neo4j在知识图谱中的应用(3)——PMP项目管理知识模型与数据的批量导入_第4张图片
2.png

注意事项

每次导入文件的时候都需要把原有data目录清空,然后把需要的节点、关系一次导入,不能分批导入。
后面如果更新的话还要把原有data全部情况,再把所有数据一次性导入,生产环境下切记保留原始数据!!!

后记

在项目管理知识体系中还有其他更复杂的关系,比如哪些概念易混淆、哪些概念之间有包含关系等等,这些信息都可以经过结构化之后加入知识图谱。

你可能感兴趣的:(Neo4j在知识图谱中的应用(3)——PMP项目管理知识模型与数据的批量导入)