您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据挖掘与识别 > Spark GraphX技术应用与开发
SPARKGRAPHX基本概念与操作图的产生社交关系网页链接表格与图的自由转换BSP模型传统图计算模型实现SuperStep计算,通信,同步(Barrier)优点:简单缺点:Barrier影响效率GAS模型SparkGraphX采用的模型Gather、Apply、Scatter单边粒度的操作,可以并行传统图计算SPARKGRAPHX计算图切分GRAPHX采用点切分点切分法RandomVertexCutCanonicaRandomVertexCutEdgePartition1DEdgePartition2DGRAPHX属性GRAPHX编程·创建图Graph.edges为边,graph.vertices为点从文件创建图GRAPHX基本操作属性操作mapVertices、mapEdges、mapTriplets结构操作reversesubgraphmaskgroupEdges度计算inDegreesoutDegreesDegrees邻居collectNeighborIdscollectNeighbors连接操作Joinoutjoin成熟算法Pageranker最短路径三角数·社区发现淘宝应用度分布,检测超级节点,大客户,大商家2跳邻居数,更广传播,潜在利益连通图,发现社区多图合并,协同推荐能量传播,用户聚类未来图计算的前景就淘宝而言,未来Graphx模型将主要应用于用户网络的社区发现、用户影响力、能量传播、标签传播等,提升用户黏性和活跃度推荐领域的标签推理、人群划分、年龄段预测、商品交易时序跳转,则可以提升推荐的丰富度和准确性。
本文标题:Spark GraphX技术应用与开发
链接地址:https://www.777doc.com/doc-3391752 .html