【互动问答分享】第9期决胜云计算大数据时代Spark亚太研究院公益大讲堂

“决胜云计算大数据时代”

Spark亚太研究院100期公益大讲堂 【第9期互动问答分享】

 

Q1: Spark GraphX的用途在哪里?

        :图计算广泛应用于社交网络、电子商务,地图等领域;

         Spark GraphX可以轻而易举的完成基于度分布的中枢节点发现、基于最大连通图的社区发现、基于三角形计数的关系衡量、基于随机游走的用户属性传播等;

         从技术层面讲Spark GraphX非常适合于微信、微博、社交网络、电子商务、地图导航等类型的产品,所以可以期待Spark GraphX在Facebook、Twitter、Linkin、腾讯、百度等的大规模应用。

 

Q2:Spark GraphX使用的成功案例是什么?

        在国内主要是淘宝在大规模使用Spark GraphX;

         在淘宝,Spark GraphX不仅广泛应用于用户网络的社区发现、用户影响力、能量传播、标签传播等,而且也越来越多的应用到推荐领域的标签推理、人群划分、年龄段预测、商品交易时序跳转等,据淘宝的明风介绍,借助于Spark GraphX,经过半年多的尝试,淘宝之前一些想做但因为没有足够的计算能力而不能实现的图模型,现已不是问题。

 

Q3:Spark GraphX支持哪些流行的算法

        最经典是只会PageRank、TriangleCount、ShortestPaths等三大最常用的算法;

        通过对Pregel的支持从而也提供了更多的例如SVDPlusPlus、ConnectedComponents、StronglyConnectedComponents等算法;

        随着新版本的发布会推出更多的算法实现库;

 

Q4:学习Spark GraphX如果想深入的话推荐哪些数学书籍

        《离散数据》

        《集合论》

        《线性代数》

        《关系代数》

你可能感兴趣的:(云计算,spark技术,spark教程,spark热点,spark集群)