Apache Atlas2.0 第六节 血源关系

1 )首先看一个效果图

Apache Atlas2.0 第六节 血源关系_第1张图片

2 )由于使用hdp 进行Atlas集成,所以下面使用的是0.7版本的,亲自验证过的流程,先上一段json, 每两个Table (entity)之间需要一个Process 进行连接,形成一条血缘关系图。首末两端使用 inputs ,outputs进行entity 关联

{
    "entity":{
        "typeName":"Process",
        "attributes":{
            "qualifiedName":"table_03@[email protected]",
            "createdBy":"caozqaAPI",
            "createTime":"2017-08-25T13:15:25.369Z",
            "updatedBy":"caozqaAPI",
            "updateTime":"2017-08-25T14:12:45.246Z",
            "name":"table_01",
            "comment":"rdbms_table API insert test",
            "description":"rdbms_table  手动输入",
            "owner":"caozqa",
            "type":"table",
            "contact_info":"table_03_info",
            "inputs":[{
                "guid": "eddcde3c-92a2-4cfc-86d1-6ea43f6497b0",
                "typeName": "rdbms_table"
            }],
            "outputs":[{
                "guid": "f438d921-ff4c-4838-bdca-3b868bbed825",
                "typeName": "rdbms_table"
            }]
        }
    }
}

3)代码中可以找到一个 Process类 ,该类继承自Asset类型,所以自带有name,owner,description,quailifiedName四种属性,它自己特有的inputs和outputs表示该过程的输入输出,它是Atlas血缘管理中所有类型的超类,在概念上,它可以用于表示任何数据变换操作。例如,将原始数据的 hive 表转换为存储某个聚合的另一个 hive 表的 ETL 过程可以是扩展过程类型的特定类型。流程类型有两个特定的属性,输入和输出。输入和输出都是 DataSet 实体的数组。因此,Process 类型的实例可以使用这些输入和输出来捕获 DataSet 的 lineage 如何演变,例如hive_process,sqoop_process 类型,在rdbms中直接使用Process 来存储血缘关系

4) 查询API的方式 采用base 验证  get请求

   http://ip:port/api/atlas/v2/lineage/58182d3b-0777-4297-aae8-949368ef7bc5

 

你可能感兴趣的:(Atlas)