NEO4J(数据存入尝试)

2018-05-11
用Cyher语句进行少量数据存入,目的在于需求合适的数据模型。
缺乏相关理论指导,只能通过尝试来发现寻找合适的方案了

  1. Cypher 存入一个节点的语法示例为:
CREATE (TheMatrix:Movie {title:'The Matrix', released:1999, tagline:'Welcome to the Real World'})
CREATE (Keanu:Person {name:'Keanu Reeves', born:1964})
CREATE (Carrie:Person {name:'Carrie-Anne Moss', born:1967})

可以看到属性部分的格式为

key1:value2,key2:value2,...

之前通过API取得的数据为

MainSense: WN:EN:Vietnam
POS:NOUN
iskeyConcept: false
Sense: WN:EN:Vietnam
Sense: WN:EN:Socialist_Republic_of_Vietnam
...
Sense: WIKIRED:EN:Red_Vietnam_(modern)
glosses: A communist state in Indochina on the South China Sea; achieved independence from France in 1945
glosses: Vietnam, officially the Socialist Republic of Vietnam, is the easternmost country on the Indochina Peninsula in Southeast Asia.
...
glosses: Country in Southeast Asia.
glosses: Vietnam is a country in East Asia.
Image: Location_Vietnam_ASEAN.svg#OMWIKI
Image: Asia_(orthographic_projection).svg#OMWIKI
...
Image: Flag_of_Quebec.svg#WIKIDATA
Image: Flag_of_Libya_(1977-2011).svg#WIKIDATA
Image: Red_star.svg#WIKIDATA
Category: BNCAT:EN:1976_establishments_in_Vietnam
Category: BNCAT:EN:Communist_states
...
Category: BNCAT:EN:Vietnam
Category: BNCAT:EN:Vietnamese-speaking_countries_and_territories

想要直接复制粘贴成Cypher命令的一部分就需要对数据格式进行调整
可以选择

  1. 直接调整获取数据的java程序,格式化输出,再次获取数据
    2.对以获取的数据直接进行格式调整
    我选择用方法2,通过VIM调整数据格式

在normal模式下

gg      #指针到文档开头
q1      #进入寄存器
^Wi'$a',j   #录入指令
q        #离开寄存器
10000@1        #调用寄存器1中的指令10000次

得到格式化后的结果

MainSense: 'WN:EN:Vietnam',
POS:'NOUN',
iskeyConcept: 'false',
Sense: 'WN:EN:Vietnam',
Sense: 'WN:EN:Socialist_Republic_of_Vietnam',
Sense: 'WN:EN:Viet_Nam',
Sense: 'WN:EN:Annam',
Sense: 'GEONM:EN:Socialist_Republic_of_Vietnam',
Sense: 'GEONM:EN:Vietnam',
Sense: 'WIKI:EN:Vietnam',
Sense: 'WIKIDATA:EN:How_to_contribute',
Sense: 'WIKIDATA:EN:How_to_contribute',
Sense: 'WIKIDATA:EN:Socialist_Republic_of_Vietnam',
...

将结果粘贴至Cypher语句属性部分创建节点

CREATE (vietnam:Country {id:'bn:00004315n', name:'vietnam',
MainSense: 'WN:EN:Vietnam',
POS:'NOUN',
iskeyConcept: 'false',
Sense: 'WN:EN:Vietnam',
Sense: 'WN:EN:Socialist_Republic_of_Vietnam',
Sense: 'WN:EN:Viet_Nam',
...
})

这里提示语法错误
发现是原始数据中单引号干扰了Cypher语句中字符串的划分
解决方法:先在原始数据中,将每一个单引号前都加上转义符变成\',然后再调整格式。

成功存入后查看结果。

NEO4J(数据存入尝试)_第1张图片
match.png

观察发现结果并不正确
同名属性被覆盖!!每个属性名都只保留了最后一条记录!
解决方法:将多值属性以数组的形式实现保存

CREATE (vietnam:Country {id:'bn:00004315n', name:'vietnam',
MainSense: 'WN:EN:Vietnam',
POS:'NOUN',
iskeyConcept: 'false',
Sense:[ 'WN:EN:Vietnam',
        'WN:EN:Socialist_Republic_of_Vietnam',
        'WN:EN:Viet_Nam',
        ...],
Image:[ 'Location_Vietnam_ASEAN.svg#OMWIKI',
        'Asia_(orthographic_projection).svg#OMWIKI',
        'Location_of_Asia.svg#OMWIKI',
        ...]
})

你可能感兴趣的:(NEO4J(数据存入尝试))