GraphX

GraphX是Apache Spark的用于图形和图形并行计算的API.

Flexibility

无缝地处理图形和集合.

GraphX统一了单个系统内的ETL,探索性分析和迭代图计算. 您可以查看相同的数据为图形与收藏, 改造加入有效地RDDS图,并利用写自定义迭代图形算法预凝胶API .

graph = 图形 (顶点,边)
消息= spark.textFile( " hdfs:// ..."
graph2 =图. joinVertices (消息){
(id,顶点,msg)=> ...
}
在Scala中使用GraphX

Speed

与最快的专业图形处理系统可比的性能.

GraphX在性能上与最快的图形系统竞争,同时保留了Spark的灵活性,容错性和易用性.

端到端PageRank性能(20次迭代,3.7B边)

Algorithms

从不断增长的图形算法库中选择.

除了高度灵活的API外 ,GraphX还提供了多种图形算法,其中许多是由我们的用户贡献的.

  • PageRank
  • 连接的组件
  • 标签传播
  • SVD++
  • 牢固连接的组件
  • 三角数

Community

GraphX是Apache Spark项目的一部分. 因此,每个Spark版本都会对其进行测试和更新.

如果您对库有疑问,请在Spark邮件列表中询问.

GraphX处于Alpha阶段,欢迎您提供帮助. 如果您想对GraphX进行更改,请阅读如何为Spark捐款并向我们发送补丁!

Getting Started

要开始使用GraphX:

  • 下载Spark . GraphX作为模块提供.
  • 阅读GraphX指南 ,其中包括用法示例.
  • 如果您想在分布式模式下运行,请了解如何在群集上部署 Spark. 您也可以在没有任何设置的情况下在多核计算机上本地运行.

by  ICOPY.SITE