引言:
本文主要介绍的是利用python工具pycharm连接neo4j数据并创建数据节点和节点关系,不会涉及到neo4j的基础环境搭建,如果有小伙伴不会neo4j基础环境搭建可以:
https://www.baidu.com/
py2neo
这个库就是专门用来连接驱动neo4j的库
这里我用的python版本和py2neo的版本是:
Python 2.7 / 3.3 / 3.4 / 3.5
Neo4j 2.0 / 2.1 / 2.2 / 2.3 / 3.0
from py2neo import *
graph = Graph('http://127.0.0.1(这里的IP根据每个人的地址来写):7474', username="这里是你的用户名好吧", password="你的数据库密码")
上边是比较小白的写法,你也可以这样写:
graph = Graph("http://127.0.0.1:7474",auth=("账号","密码"))
这样写:
g = Graph('http://账号:密码@127.0.0.1:7474')
连接上数据库之后我们用一些数据来对它进行一些节点的创建。
我这里用的是基于CSV文件来对neo4j数据库进行关系创建,这是我的csv文件的一些内容:
数据来源于wake瑜伽网,没错是爬下来的,爬虫代码就不贴出来了。
下边是是实现过程:
1,首先是读取文件:
frame = pd.read_csv(r"C:/data/",encoding='gbk')
2,然后遍历获取文件的头:
for i in frame.index:
'''获取数据'''
yoga_name = frame["招式"].values[i]
yoga_ms = frame["描述"].values[i]
yoga_yc = frame["益处"].values[i]
yoga_zysx = frame["注意事项"].values[i]
yoga_cjwt = frame["常见问题"].values[i]
3,把遍历得出来的头保存为str类型的数据以免出现参数错误:
yoga_name = str(yoga_name)
yoga_ms = str(yoga_ms)
yoga_yc = str(yoga_yc)
yoga_zysx = str(yoga_zysx)
yoga_cjwt = str(yoga_cjwt)
4,数据读取了,格式转换了,开始进入节点创建:
yoga_node = Node('招式', name=yoga_name)
graph.merge(yoga_node) ## merge方法是将重复数据去除掉,只留第一个
ms_node = Node('描述', name=yoga_ms)
yc_node = Node('益处', name=yoga_yc)
zysx_node = Node('注意事项', name=yoga_zysx)
cjwt_node = Node('常见问题', name=yoga_cjwt)
5,节点创建完了,开始创建节点与节点之间的关系:
# 瑜伽类
yoga_2 = Relationship(yoga_node, '描述', ms_node)
yoga_3 = Relationship(yoga_node, '益处', yc_node)
yoga_4 = Relationship(yoga_node, '注意事项', zysx_node)
yoga_5 = Relationship(yoga_node, '常见问题', cjwt_node)
6,所有东西都准备好了之后,我们开始创建操作:
try:
graph.create(yoga_2)
except:
continue
try:
graph.create(yoga_3)
except:
continue
try:
graph.create(yoga_4)
except:
continue
try:
graph.create(yoga_5)
except:
continue
数据集下载地址:
链接:https://pan.baidu.com/s/1utGHNHy7k-JqzBEqI6wWRA
提取码:fuck
以上就是python连接neo4j数据的一些小操作了,以下是完整代码:
from py2neo import *
import pandas as pd
graph = Graph('http://127.0.0.1(这里的IP根据每个人的地址来写):7474', username="这里是你的用户名好吧", password="你的数据库密码")
def yogadata():
count = 0
frame = pd.read_csv(r"C:/data/", encoding='gbk')
for i in frame.index:
'''获取数据'''
yoga_name = frame["招式"].values[i]
yoga_ms = frame["描述"].values[i]
yoga_yc = frame["益处"].values[i]
yoga_zysx = frame["注意事项"].values[i]
yoga_cjwt = frame["常见问题"].values[i]
yoga_name = str(yoga_name)
yoga_ms = str(yoga_ms)
yoga_yc = str(yoga_yc)
yoga_zysx = str(yoga_zysx)
yoga_cjwt = str(yoga_cjwt)
yoga_node = Node('招式', name=yoga_name)
graph.merge(yoga_node) ## merge方法是将重复数据去除掉,只留第一个
ms_node = Node('描述', name=yoga_ms)
yc_node = Node('益处', name=yoga_yc)
zysx_node = Node('注意事项', name=yoga_zysx)
cjwt_node = Node('常见问题', name=yoga_cjwt)
# 瑜伽类
yoga_2 = Relationship(yoga_node, '描述', ms_node)
yoga_3 = Relationship(yoga_node, '益处', yc_node)
yoga_4 = Relationship(yoga_node, '注意事项', zysx_node)
yoga_5 = Relationship(yoga_node, '常见问题', cjwt_node)
try:
graph.create(yoga_2)
except:
continue
try:
graph.create(yoga_3)
except:
continue
try:
graph.create(yoga_4)
except:
continue
try:
graph.create(yoga_5)
except:
continue
count += 1
print(count)
yogadata()
最后呢,我在本篇文章的基础上迭代了python 对 neo4j数据库进行连接和增删改查的一些方法,有兴趣的可以看看基础CQL语句连接neo4j数据库