您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 市场营销 > 大数据导论-大数据可视化
大数据应用人才培养系列教材大数据导论第六章大数据可视化6.1数据可视化基础6.2大数据可视化方法6.3大数据可视化软件与工具大数据应用人才培养系列教材习题可视化基本特征(4)专业性(3)片面性(1)易懂性(2)必然性数据可视化与专业知识紧密相连,其形式需求也是多种多样,如网络文本、电商交易、社交信息、卫星影像等。专业化特征是人们从可视化模型中提取专业知识的环节,它是数据可视化应用的最后流程。数据可视化往往只是从特定视角或者需求认识数据,从而得到符合特定目的的可视化模式,所以,只能反映数据规律的一个方面。数据可视化的片面性特征要求可视化模式不能替代数据本身,只能作为数据表达的一种特定形式。将数据进行可视化分析,更加容易被人们理解,更加容易与人们的经验知识产生关联,使得碎片化的数据转换为具有特定结构的知识,从而为决策支持提供帮助。当今大数据所产生的数据量已经远远超出了人们直接阅读和操作数据的能力,必然要求人们对数据进行归纳总结,对数据的结构和形式进行转化处理。6.1数据可视化基础第六章大数据可视化数据可视化的基本特征可视化基本特征6.1数据可视化基础第六章大数据可视化数据可视化的作用数据表达数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据。常见的形式如文本、图表、图像、二维图形、三维模型、网络图、树结构、符号和电子地图等。数据操作数据操作是以计算机提供的界面、接口、协议等条件为基础完成人与数据的交互需求,数据操作需要友好的人机交互技术、标准化的接口和协议支持来完成对多数据集合或者分布式的操作。数据分析数据分析是通过数据计算获得多维、多源、异构、和海量数据所隐含信息的核心手段,它是数据存储、数据转换、数据计算和数据可视化的综合应用。可视化作为数据分析的最终环节,直接影响着人们对数据的认识和应用。数据可视化流程6.1数据可视化基础第六章大数据可视化数据获取的形式多种多样,大致可以分为主动式和被动式两种。主动式是以明确的数据需求为目的,利用相关技术手段主动采集相关数据,被动式是以数据平台为基础,由数据平台的活动者提供数据来源数据处理是指对原始的数据进行分析、预处理和计算等步骤。数据处理的目标是保证数据的准确性、可用性等。可视化模式是数据的一种特殊展现形式,常见的可视化模式有标签云、序列分析、网络结构、电子地图等。可视化模式的选取决定了可视化方案的雏形。可视化应用主要根据用户的主观需求展开,最主要的应用方式是用来观察和展示,通过观察和人脑分析进行推理和认知,辅助人们发现新知识或者得到新结论。第六章大数据可视化6.1数据可视化基础6.2大数据可视化方法6.3大数据可视化软件与工具大数据应用人才培养系列教材习题文本可视化123大数据可视化方法网络(图)可视化多维数据可视化6.2大数据可视化方法第六章大数据可视化标签云将关键词根据词频或其他规则进行排序,按照一定规律进行布局排列,用大小、颜色、字体等图形属性对关键词进行可视化。标签云有些文本的形成和变化过程与时间紧密相关,如何将这些模式与规律进行可视化展示,是文本可视化的重要内容。常见的技术以河流图居多。河流图可以划分为主题、文本及事件河流图等。动态文本时序信息可视化6.2大数据可视化方法第六章大数据可视化文本可视化网络(图)可视化6.2大数据可视化方法如何对动态网络的特征进行可视化,也是不可或缺的研究内容。研究者提出了大量网络可视化或图可视化技术,经典的基于节点和边的可视化,是图可视化的主要形式。第六章大数据可视化多维数据可视化散点图散点图(ScatterPlot)是最为常用的多维可视化方法。二维散点图将多个维度中的两个维度属性值集合映射至两条轴,在二维轴确定的平面内通过图形标记的不同视觉元素来反映其他维度属性值,可通过不同形状、颜色、尺寸等来代表连续或离散的属性值6.2大数据可视化方法第六章大数据可视化多维数据可视化投影投影(Projection)是能够同时展示多维的可视化方法之一。基于投影的多维可视化方法一方面反映了维度属性值的分布规律,同时也直观地展示了多维度之间的语义关系。6.2大数据可视化方法第六章大数据可视化多维数据可视化6.2大数据可视化方法第六章大数据可视化平行坐标平行坐标(ParallelCoordinates)是研究和应用最为广泛的一种多维可视化技术,将维度与坐标轴建立映射,在多个平行轴之间以直线或曲线映射表示多维信息。第六章大数据可视化6.1数据可视化基础6.2大数据可视化方法6.3大数据可视化软件与工具大数据应用人才培养系列教材习题可视化基本特征6.3大数据可视化软件与工具第六章大数据可视化ExcelExcel是微软办公套装软件的一个重要组成部分,它可以进行各种数据的处理、统计分析、数据可视化显示及辅助决策操作,广泛地应用于管理、统计、财经、金融等众多领域。本节重点讨论一下Excel在数据可视化处理方面的应用。ProcessingProcessing是一个开源的编程语言和编程环境,支持Windows、MacOS、Linux等多个操作系统。Processing就是一种具有革命前瞻性的新兴计算机语言,以数字艺术为背景的程序语言,它的用户主要面向计算机程序员和数字艺术家。EChartsECharts是商业级数据图表(EnterpriseCharts)的缩写,是百度公司旗下的一款开源可视化图表工具。创新的拖拽重计算、数据视图、值域漫游等特性大大地增强了用户体检,赋予了用户对数据进行挖掘、整合的能力。Excel应用Excel的图表功能实现数据的可视化展示应用Excel的可视化规则实现数据的可视化展示Excel的图表功能可以将数据进行图形化,帮助用户更直观地显示数据,使数据对比和变化趋势一目了然,从而达到提高信息整体价值,更准确、直观地表达信息和观点。图表与工作表的数据相链接,当工作表数据发生改变时,图表也随之更新,反映出数据的变化。Excel从2007版本开始为用户提供了可视化规则,借助于该规则的应用可以使抽象数据变得更加丰富多彩,通过规则的应用,能够为数据分析者提供更加有用的信息。6.3大数据可视化软件与工具第六章大数据可视化Processing在数据可视化领域有着广泛的应用,可制作信息图形、信息可视化、科学可视化和统计图形等。下面通过一个简单的实例来认识一下如何利用Processing实现数据的可视化展示。如下表所示为美国各州GDP增长率。该示例将一系列随机数据呈现在地图上,将数值的大小通过圆点的大小来可视化地显示出来。Processing6.3大数据可视化软件与工具第六章大数据可视化Processing第一步,声明(初始化)变量,代码如下:PImagemappictureImage;TablelocationTable;TablenameTable;introwCount;TabledataTable;floatdataMin=MAX_FLOAT;floatdataMin=MIN_FLOAT;016.3大数据可视化软件与工具第六章大数据可视化Processing第二步,初始化画布,加载(生成)数据,代码如下:voidsetup(){size(640,400);MapPictureImage=loadImage(mappicture.png);//加载地图片LoccatioolornTable=newTable(colorlocations.tsv);//加载位置色彩信息nameTable=newTable(names.tsv);//加载名称信息RowCount=colorlocationTable.getRowCount();dataTable=newTable(random.tsv);//加载随机数据026.3大数据可视化软件与工具第六章大数据可视化for(introw=0;rowrowCount;row++){floatvalue=dataTable.getFloat(row,1);if(valuedataMax){DataMax=value;}if(valuedataMin){DataMin=value;}}PFontfont=loadFont(Univers-Bold-12.vlw);TextFont(font);smooth();noStroke();}Processing036.3大数据可视化软件与工具第六章大数据可视化第三步,调用绘制函数绘制图形,代码如下:voiddraw(){background(255);image(picturemapImage,0,0);for(introw=0;rowrowCount;row++){Stringabbrev=dataTable.getRowName(row);floatx=loccolorationTable.getFloat(abbrev,1);floaty=colorlocationTable.getFloat(abbrev,2);DrawData(x,y,abbrev);}}voiddrawData(floatx,floaty,Stringabbrev){floatvalue=dataTable.getFloat(abbrev,1);floatradius=0;if(value=0){radius=mappicture(value,0,dataMax,1.5,15);fill(#333366);//blue}else{radius=picturemap(value,0,dataMin,1.5,15);fill(#ec5166);//red}ellipseMode(RADIUS);ellipse(x,y,radius,radius);if(dist(x,y,mouseX,mouseY)radius+2){fill(0);TextAlign(CENTER);Stringname=nameTable.getString(abbrev,1);text(name++value,x,y-radius-4);}}Processing04该段代码执行后的结果可以清楚地看出,正增长与负增长,其中半径代表了数据的绝对值大小。6.3大数据可视化软件与工具第六章大数据可视化6.3大数据可视化软件与工具第六章大数据可视化ECharts图表工具为用户提供了详细的帮助文档,这些文档不仅介绍了每类图表的使用方法,还详细介绍了各类组件的使用方法,每类图表都提供了丰富的实例。用户在使用时可以参考实例提供的代码,稍加修改就可以满足自己的图表展示需求。接下来结合ECharts提供的一个2010年世界人口分布图的实例来详细介绍一下ECharts的使用方法。下表所示是2010年世界人口数据。ECharts实现代码如下:option={title:{text:'WorldPopulation(2010)',subtext:'fromUnitedNations,Totalpopulation,bothsexescombined,asof1July(thousands)',sublink:':'center',top:'top'},tooltip:{trigger:'item',formatter:function(params){varvalue=(params.value+).split('.');value=value[0].replace(\d{1,3})(?=(?:\d{3})+(?!\d))/g,'$1,')+'.'+value[1];returnparams.seriesName+'br/'+params.name+':'+value;}}016.3大数据可视化软件与工具第六章大数据可视化EChartstoolbox:{show:true,orient:'vertical',left:'right',top:'center',feature:{mark:{show:tru
本文标题:大数据导论-大数据可视化
链接地址:https://www.777doc.com/doc-7194421 .html