利用datax数据同步工具的简单入门

hbase的版本:1.3 (依然可以导入)

第一步:datax的安装:安装地址:https://github.com/alibaba/DataX (datax3.0版本)

(1)下载完datax的安装包后上传到linux系统
命令:rz datax.tar.gz

(2)解压datax.tar.gz到linux的目录中
命令:tar -zxvf data.tar.gz

(3)解压完了以后,可以选择配置环境变量,也可以选择不配置环境变量(我这里没有配置)

第二步:测试一个Demo的小案例
(1):在linux下面的目录:test目录下创建一个json的配置的文件:demo.json

(2):demo.json的配置文件的内容如下:
{
“job”: {
“content”: [
{
“reader”: {
“name”: “streamreader”,
“parameter”: {
“sliceRecordCount”: 10,
“column”: [
{
“type”: “long”,
“value”: “10”
},
{
“type”: “string”,
“value”: “hello,你好,世界-DataX”
},
{
“type”:“String”,
“value”:“DataX-太好用了,太棒了”
}
]
}
},
“writer”: {
“name”: “streamwriter”,
“parameter”: {
“encoding”: “UTF-8”,
“print”: true
}
}
}
],
“setting”: {
“speed”: {
“channel”: 5
}
}
}
}

(3)由于我没有配置datax的环境变量,所以我需要到datax的bin目录下去执行:
命令:cd datax/bin 下
执行命令:python /root/datax/bin/datax.py demo.json
注意:Python的版本需要2.6以上

你可能感兴趣的:(Datax)