您好,欢迎访问三七文档
社交媒体网络分析:NodeXL实践与学习社交媒体工具,如电子邮件、论坛、博客、微博和维基,被数十亿全世界的人们。他们通过这些媒体沟通,通过桌面和基于web的应用在固定或移动设备上,结果创建了多个复杂的社会网络结构。这个活泼的互动与网络的关系创造了通过这些技术是因为个人、组织、社会团体的不断的增长。了解这些社交媒体网络的发展,变化,失败或成功是一个越来越受到研究人员和专业人士的关注。现在社会网络分析提供了一组概念和指标系统地研究这些动态流程。信息可视化的方法也变得有价值,帮助用户在在复杂的社会网络中发现模式、趋势、集群和离群值。丰富的软件工具对社会网络分析和可视化展示了力量的兴趣,但许多这些工具使用困难,特别是对于那些缺乏经验编程语言。开源软件工具,NodeXL设计尤其方便学习的概念和方法的社会网络分析与可视化作为一个关键组件(更多信息见史密斯,Shneiderman,etal.2009)。MicrosoftExcel2007的NodeXL模板是一个免费和开源扩展到广泛使用的电子表格应用程序,提供了一系列的基本网络分析和可视化功能。NodeXL使用高度结构化的工作簿包含多个工作表来存储所有的模板代表一个网络图所需的信息。网络关系(如图的边)表示为一个Edges列表,所有成对的顶点相连构成了网络图。其他工作表包含关于每个顶点的信息和集群信息。可视化功能允许用户显示一定范围的网络图,数据属性映射到的视觉属性包括形状、颜色、大小、透明度和位置。NodeXL支持学生学习社会网络分析和专业人士网络分析应用到感兴趣的业务问题上。它建立在熟悉的Excel电子表格范式基础上,为非程序员提供一个易于使用的工具。NodeXL集成Excel的内部分析函数,常用的网络指标和可视化这三个方面。它支持不同视觉网络布局、强大的过滤、聚类和映射的顶点和edge-level数据到高度可定制的视觉属性和标签。中等规模网络的工具支持工作几千顶点,尽管一些用户已经成功地处理成千上万的顶点。NodeXL主要由微软研究院MarcSmith团队及众多研究机构的热心人士完成,其参与人员如下图所示:图1NodeXL参研人员主要功能特色如下图所示:图2NodeXL功能几个NodeXL绘制的关系图展示第1章启动NodeXL开始通过打开NodeXL平常的基本层展示了Excel在顶部菜单栏,左边一个空白工作簿,图右侧窗格(图1)。NodeXL允许用户在Edges列填写或粘贴边列表数据,组成的顶点对彼此相关的。1.1数据录入开始使用NodeXL的一个方法是输入你自己的列表。例如,您可能在每一行输入朋友的名字作为顶点1和顶点2列(见图2)。1.2展示图单击ShowGraph按钮(图的正上方窗格)来显示网络友谊的例子(图3)。假设无向的关系,也就是说,Ann是Bob的朋友,Bob也是Ann的朋友。图3无向图示例1.3强调显示边点击其中的一个工作簿行强调显示对应的边的两个顶点图。例如,单击第5行强调了边缘连接Ann和Carod(参见图4)。你甚至可以点击多个行和所有相关的边缘和顶点将其强调显示。图4强调显示边1.3导入边的列表使用NodeXL的另一种方法是使用Import命令从现有文件或数据源列表加载一个边。在NodeXL选项卡中找到Import命令(见图5)。有人会为你提供一个Pajek(另一个社交网络分析程序)形式文件或在一个标准的Excel工作簿的边的列表。或者从电子邮件、Twitter网络等等(参见图5)。图5Import命令选项NodeXL选项卡提供了访问核心功能,稍后您将探索教程。悬停在按钮显示额外的信息。一些功能是右击链接访问。您将使用NodeXL控件来创建有意义的顶点布局,控制顶点和边的视觉属性(如颜色、大小、透明度),和分析方法等。1.4缩放和移动图形面板当您处理数据可能要调整窗格,将光标移动到左边的窗格,直到你看到↔符号然后拖动到所需的尺寸。还可以通过点击标题“文档操作”拖动,将图面板移动到工作簿的左侧,上面或下面。你甚至可以拖动图形窗格在Excel窗口内。使用时在电脑上有一个很大的显示器或两个或两个以上的监视器,NodeXL图窗格可以占领一个全屏,在另一个显示电子表格是完全可见的。第2章布局2.1自动布局NodeXL提供了几种自动布局类型,可以从Graph组选择相应的按钮。NodeXL默认布局为Fruchterman-Reingold。另一个常见的方法是使用Circle布局,它把顶点看做一个圈(图4、6)。在这种情况下,两个布局非常相似。尝试不同的布局类型(如螺旋、网格、Sugiyama)可以发现有用的模式,关系,或不寻常的特性被分析的数据集。图6布局选项2.2图表类型NodeXL,默认的类型是无向图,这意味着顶点1和顶点2之间的关系是对称的(图3)。NodeXL选项卡允许您指定图表类型为有向图(见图5),这意味着关系只在一个方向走,例如Ann的关系可能是邀请Bob参加聚会不要求Bob也邀请Ann。顶点1是源和顶点2是目的地,一个箭头显示通向目的地的顶点。点击刷新图(图窗格)显示有向网络(如图7所示)。图7有向图示例2.3更新图面板任何时候你改变底层数据或功能,都将影响网络的布局(如,有向图和无向图),你必须点击刷新图按钮(ShowGraph)更新图。如果你只是想改变布局可以选择一个新的布局类型,再次点击布置,以减少处理时间。2.4手动布局在邀请示例图,您可能想通过移动顶点来获得一个更好的理解的关系。您可以单击并拖动顶点一次创建安排,强调结构或创建一个更加有序显示(图8)。您可以选择多个顶点周围画一个盒子,或点击按住控制键时额外的顶点。如果选择多个顶点拖时,他们都会一起移动。图8手动布局2.5保存手动布局手动布局之后,能显示重要的人际关系,你可能会想要维持这种布局。在布局选择菜单选择“None”,允许你手动布局,即使选择刷新图。另一个更持久的解决方法顶点位置如下所描述的“AdvancedFeature”盒。第3章可视化设计:让网络显示有意义画一个有意义的图表可以揭示模式,关系和有趣的特性,可能很难画出扁平表格的图形。NodeXL旨在使您能够创建一个丰富的各种可能的图。第4章标签:顶点添加文本标签和链接由于文本标签有助于理解图表,NodeXL提供了三种方式来显示它们,所有这些可以同时使用:主标签:顶点名称文本出现在以矩形框为顶点的内部。颜色和不透明度仍然可以使用,但是形状和大小不能使用。辅助标签:顶点名称文本出现在顶点形状外部的标签,使您能够使用所有的视觉属性包括形状和大小,但屏幕增加潜在的混乱。提示标签:当鼠标悬停在顶点时显示的弹出文本。这使图形窗格整洁,但只允许你看到文本与一个顶点相关联。为了设置文本标签,去NodeXL选项卡Show/Hiden组,选择工作簿列按钮,然后检查标签条目。这要求必要的列在Vertices工作表中可见。4.1添加主标签您可以用AotoFill按钮从Vertex或其它列来填补主标签列名称。然后,当你刷新时,顶点变得充满了标签(图16)。颜色编码仍然保留但是大小编码已不再使用。在这种情况下,粉红色的文字太轻轻松阅读,因此粉红色改为深粉红色。图16添加主标签4.2添加辅助标签你可以通过使用辅助标签,把顶点名称显示在顶点的外部,从而允许大小和形状等特征用于顶点。使用AotoFill按钮填补Secondary列顶点辅助标签列(图17)。通过使用Delete键或右击并选择clear删除强调显示的所有数据主标签列。在图18中,选项对话框(图15)用来设置默认字体大小12点。您还可以使边半透明标签重叠将更具可读性。为此,边不透明度设置为40在选项对话框中(图15)。图17添加辅助标签4.3增加提示标签您还可以添加数据,只显示当你鼠标悬停在一个顶点时显示,这就是所谓的提示标签。在图17中,AotoFill按钮添加Tooltip列被用于年龄提示标签。当你鼠标悬停时,你会看到Helen的年龄(22岁)。第5章图指标:图指标计算和可视化当试图理解网络,分析家们经常想识别重要的顶点,定位子群,或了解如何与其他网络互联。虽然可视化本身可以帮助做到这一点,但最好使用图指标,它能提供定量措施描述图的各个方面。NodeXL可以为你计算几个图指标。计算后,您可以使用图指标来改变你的网络图的视觉显示的方式。5.1计算图指标为了计算图指标,在Analysis组单击GraphMetrics按钮,打开如图18的对话框显示可用的图指标。选择你想要的计算图指标,通过勾选旁边的检查框。点击旁边的细节链接一个度量指标的简要解释。点击选择所有按钮,然后选择计算指标。图的一些指标可以计算在处理大型网络,因此状态栏用于显示进度。一旦完成,NodeXL显示一组新的图中的每个vertexspecific度量指标顶点表中的列。NodeXL也填充总体指标表显示摘要信息如果总体指标计算了整个网络。图18图测量对话框5.2保存NodeXL文件到目前为止,您已经完成了NodeXL示例使用。为了保存NodeXL文件,要确保是标准的Excel工作簿(选择标准.xlsx扩展)。不要将其保存为一个Excel97-2003工作簿,Macro-Enabled工作簿或二进制工作簿。5.3风筝网络例子为了更好地理解各种图指标的意义,你会现在开始使用一个网络被称为风筝网络,由DavidKrackhardt提供(见)。你可以下载Kite_Network.xlsx文件:,或者你可以手动复制无向边列表和图形如图19所示的新NodeXL模板。下载版本固定顶点的位置来匹配它们(如图19所示)。图195.4打开NodeXL文件打开NodeXL文件就像打开任何其他Excel文件一样。如果安装了NodeXL,Excel将识别任何使用NodeXL创建的.xlsx扩展文件。打开文件会自动启动NodeXL。一旦你打开文件,选择展示图,然后计算所有图的指标。5.5总体指标总体指标工作表总结了实体网络的一些关键的属性如下:(1)图表类型:无向图或有向图。(2)唯一边:Edges工作表边的数量。(3)重复边:在Edges工作表中重复的顶点对偶数。重复的顶点对偶是可能发生的,例如在一个论坛网络人回复人在多个场合。重复的顶点对偶可能导致一些程度等指标是不准确的。他们可以组合成一个加权边通过选择合并重复的边后在本教程中描述的。(4)边总数量:Edges工作表的行。(5)环:顶点对偶是自身的边的数量。当Edges工作表Vertex1和Vertex2列包括相同的名称时,环发生。例如,在一个邮件列表中一个人回复自己的邮件。Self-loops视觉表示在图窗格中由一个圆形的边构成,输入和输出是相同的顶点。(6)顶点:Vertices工作表行数。(7)图密度:是一个0和1之间的数字,表示在网络上相互关联的顶点是如何关联的。对于一个无向图,所有顶点都连接到所有其他通过至少一个边缘,图密度等于边的总数量除以最大允许的边的数量。风筝网络可能有18条边和最多45条边,导致图的密度0.4。更密集的图形(如,0.6)将包括更多的边总有相当数量的顶点。(8)NodeXL版本:显示NodeXL的版本。5.6顶点指标为了能在Vertices工作表中看到顶点的指标,如中心指标和聚类系数。您将看到新的图指标列表,在WorkbookColumns按钮选择隐藏后,将看不到图指标。每个值直接关系到一个顶点。例如,第2行显示了特定的Andre的各种图指标(图20)。图20顶点指标可以映射到视觉属性如图20所示,您可以通过使用AotoFill功能重建。图例显示程度映射到大小和中间性中心映射到不透明度。此外,ClosenessCentrality映射到提示标签。下面是风筝网络每个指标的描述。(1)度中心性(Degree):表示节点的链接数量。如果网络中的链接都是强关系,那么度中心性高的人就比度中心性低的人受欢迎。图1是一个训练班的同学之间的关系(下面就以代号T
本文标题:NodeXL手册
链接地址:https://www.777doc.com/doc-4759954 .html