“人物”点数据,将其类型名改为people,并增加以下两列连续增长的 _key 及相应的 _id ;
属性名 | 属性类型 |
_id | STRING |
_key | STRING |
姓名 | STRING |
出生年份 | STRING |
出生地 | STRING |
“电影”点数据,将其类型名改为movie,并增加以下两列连续增长的 _key 及相应的 _id ;
属性名 | 属性类型 |
_id | STRING |
_key | STRING |
上映年份 | STRING |
语言 | STRING |
评分 | INT |
票房 | INT |
类型 | STRING |
“出演电影”边数据,起始点为“人物”,终止点为“电影”,将其类型名改为act,并增加 _from 和 _to ,分别对应“人物”和“电影”的 _id ,同时保留“电影名”和“演员”属性。
属性名 | 属性类型 |
_from | STRING |
_to | STRING |
电影名 | STRING |
演员 | STRING |
片酬 | INT |
角色名称 | STRING |
是否主演 | STRING |
本方案适用于可以在Galaxybase服务器上直接访问到ArangoDB的情况,一步完成。否则,建议直接从跳到方案二。 执行方案一进行数据迁移时,针对可能出现的情况提出以下注意事项:
$ galaxybase-convert \
--arangodb tcp:// \
--arangoUser root --arangoPass 1 \
--graphName _system \
--dataDir ~/galaxybase_home/graph/data \
--arangoexport ~/arangoexport \
--arangoConfiguration ./arangoexport.conf \
--graph \--username admin --password admin
2022/11/09 11:04:23 Statistics vertexes and edges information...
2022/11/09 11:04:23 vertexes count is : [8885], edges count is : [6154]
2022/11/09 11:04:23 Analytic graph structure...
2022/11/09 11:04:23 Get vertex information...
2022/11/09 11:04:23 Analyze the vertex structure :
[==================================================] 100.00%
2022/11/09 11:04:23 Get edge information...
2022/11/09 11:04:24 Analyze the edge structure progress :
[==================================================] 100.00%
2022/11/09 11:04:24 Draws the vertex structure to the schema...
2022/11/09 11:04:24 Draws the edge structure to the schema...
2022/11/09 11:04:24 Generating schema file...
2022/11/09 11:04:24 Draws the vertex structure to the mapping...
2022/11/09 11:04:24 Draws the edge structure to the mapping...
2022/11/09 11:04:24 Generating mapping file...
2022/11/09 11:04:24 Start exporting data to CSV files...
2022/11/09 11:04:24 Will load vertexes: [ movie people ]
2022/11/09 11:04:24 Will load edges: [ people-act-movie ]
2022/11/09 11:04:24 Start loading the graph...
2022/11/09 11:04:24 The graph [_system] does not exist, start creating the graph
2022/11/09 11:04:24 create graph successfully
2022/11/09 11:04:24 save mapping successfully
2022/11/09 11:04:24 Start loading data...
current time : 2022-11-09 11:05:04 graph name : _system
start time : 2022-11-09 11:04:24 end time : 2022-11-09 11:05:03
load state : loadSuccessful use time : 40.112 s
vertexLoad speed : -/s edgeLoad speed : -/s
vertexLoad speed avg : 1714 /s edgeLoad speed avg : 34379 /s
vertex line scan : 8885 edge line scan : 6154
file error line : 0
2022/11/09 11:05:04 load successfully
参数 | 说明 |
–arangodb | ArangoDB的协议、IP、端口 |
–arangoUser | ArangoDB的用户名 |
–arangoPass | ArangoDB的密码 |
–graphName | 需要导出的数据库名,在ArangoDB中将导入整个库 |
–dataDir | 导出文件存放路径。注意,最终存放路径为dataDir/graphName/ |
–arangoexport | arangoexport命令的路径 |
–arangoConfiguration | aranfoexport的配置文件 |
–graph | Galaxybase的IP地址和端口 |
–username | Galaxybase的用户名 |
–password | Galaxybase的密码 |
本方案适用于在Galaxybase服务器上无法访问ArangoDB的情况。 操作总共分为三步:执行galaxybase-convert导出数据为csv、移动数据到Galaxybase服务器上、实现galaxybase-load执行数据导入,下面讲解迁移实现过程。
$ galaxybase-convert \
--arangodb tcp:// \
--arangoUser root --arangoPass 1 \
--graphName _system \
--dataDir ~/galaxybase_home/graph/data \
--arangoexport ~/arangoexport \
--arangoConfiguration ./arangoexport.conf \
2022/11/08 10:31:57 Statistics vertexes and edges information...
2022/11/08 10:31:57 vertexes count is : [8885], edges count is : [6156]
2022/11/08 10:31:57 Analytic graph structure...
2022/11/08 10:31:57 Get vertex information...
2022/11/08 10:31:57 Analyze the vertex structure :
[==================================================] 100.00%
2022/11/08 10:31:57 Get edge information...
2022/11/08 10:31:57 Analyze the edge structure progress :
[==================================================] 100.00%
2022/11/08 10:31:57 Draws the vertex structure to the schema...
2022/11/08 10:31:57 Draws the edge structure to the schema...
2022/11/08 10:31:57 Generating schema file...
2022/11/08 10:31:57 Draws the vertex structure to the mapping...
2022/11/08 10:31:57 Draws the edge structure to the mapping...
2022/11/08 10:31:57 Generating mapping file...
2022/11/08 10:31:57 Start exporting data to CSV files...
2022/11/08 10:31:57 Will load this vertex: [ movie people ]
2022/11/08 10:31:57 Will load this edges: [ people-act-movie movie-act-people ]
参数 | 说明 |
–arangodb | ArangoDB的协议、IP、端口 |
–arangoUser | ArangoDB的用户名 |
–arangoPass | ArangoDB的密码 |
–graphName | 需要导出的数据库名,在ArangoDB中将导入整个库 |
–dataDir | 导出文件存放路径。注意,最终存放路径为dataDir/graphName/ |
–arangoexport | arangoexport命令的路径 |
–arangoConfiguration | aranfoexport的配置文件 |
–onlyOutput | 仅导出数据,不导入Galaxybase |
$ galaxybase-load -g MovieDemo -s ~/galaxybase_home/graph/data/MovieDemo/schema.json -
m ~/galaxybase_home/graph/data/MovieDemo/mapping.json --disableStudio
2022/10/28 09:40:07 The graph [MovieDemo] does not exist, start creating the graph
2022/10/28 09:40:07 create graph successfully
2022/10/28 09:40:08 save mapping successfully
2022/10/28 09:40:08 Start loading data...
current time : 2022-10-28 09:41:17 graph name : MovieDemo
start time : 2022-10-28 09:40:08 end time : 2022-10-28 09:41:16
load state : loadSuccessful use time : 1m9.133s
vertexLoad speed : -/s edgeLoad speed : -/s
vertexLoad speed avg : 1638/s edgeLoad speed avg:1171/s
vertex line scan : 8885 edge line scan : 6154
file error line : 0
2022/10/28 09:41:17 load successfully
本文讲述了通过命令行工具galaxybase-convert,以MovieDemo数据集为例,进行第三方数据库ArangoDB数据迁移至Galaxybase的操作流程。此外,该工具还支持多项数据源的数据迁移,目前支持的数据源有Neo4j 3.x版本、4.x版本,ArangoDB <=3.10版本,一般应用在实体关系复杂且难以获取的场景中,如果场景中实体结构清晰,建议使用图构建工具galaxybase-load进行数据的迁移工作。具体迁移工具使用详情可以移步创邻科技官网-资源中心-开发者资源-技术文档-命令行工具-图构建数据导入工具,查看图模型定义文件(schema.json)和图数据映射文件(mapping.json)。