Spark GraphX
GraphX
Spark GraphX:图数据的并行处理模块
GraphX扩展RDD为Resilient Distributed Property Graph, 边、顶点都有属性的有向图
可利用此模块对图数据进行ExploratoryAnalysis、Iterative Graph Computation
GraphX提供了包括:子图、顶点连接、信息聚合等操作在内的 基础原语,并且对的Pregel API提供了优化变量的
GraphX包括了正在不断增加的一系列图算法、构建方法,用于 简化图形分析任务
提供了一系列操作
- Sub Graph:子图
- Join Vertices:顶点连接
- Aggregate Message:消息聚集
- Pregel API变种
经典图处理算法
- PageRank