Spark GraphX的边构造过程详解——从 RDD[Edge[ED]] 到 EdgeRDD[ED, VD]
关键词SparkGraphXRDDEdgeEdgeRDDEdgeRDDImpl分区索引分区索引本文介绍SparkGraphX内部对边存储的机理,详解边分区内部的索引构建过程。在最初,边是这样的RDD[(srcId,dstId,attr)],这种记法要看得懂,简而言之,它是(srcId,dstId,attr)这个三元组的集合。不过,RDD进行了分区存储,分区内部元素使用数组形式存储。这种结构并不能提