您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > 数据可视化系统(更新美学原则版)
LOGO“Addyourcompanyslogan”2014.12.22数据可视化系统报告提纲数据可视化系统概念和意义1两个实例:Wordle&Themeriver2可视化交互准则与技术3常用可视化软件介绍4可视化设计的美学原则5什么是可视化安斯库姆四重奏四组统计性质相同的数据,由统计学家费朗西斯·安斯库姆提出,用于强调作图的重要性。什么是可视化安斯库姆四重奏什么是可视化拿破仑进军莫斯科维基百科上的文字说明:什么是可视化拿破仑进军莫斯科1869年,法国一名工程师所画,被誉为有史以来最好的统计可视图什么是可视化人眼带宽100MB/s视觉信息并行处理,模式识别能力强对可视符号的感知速度比文字、数据快定义:将文字、数据等信息用可视的元素,包括颜色、形状、符号等呈现出来的过程数据可视化的意义1信息记录2支持对信息的推理和分析3信息传播与协同数据可视化的意义视物致知1854年伦敦布拉德街鬼图帮助发现霍乱流行的原因数据可视化分类科学可视化面向自然科学,如物理、化学、航天航空、生物学等。对数据模型进行解释、操作,旨在寻找模式、特点和关系。信息可视化处理抽象、非结构化数据,如文本、图表、地图、复杂系统等。可视分析学以可视交互界面为基础,综合图形学、数据挖掘和人机交互技术,将感知和认知能力以可视方式融入处理过程,进行信息交流和知识提炼,完成分析推理和决策。数据可视化系统数据可视化系统流程由Card,Mackinlay等人提出的信息可视化参考流程数据可视化系统数据的表示与变换预处理:数据清洗与精简、整合与集成组织管理:数据库、数据仓库数据的可视化呈现核心算法、视觉编码(视觉呈现形式)静态与动态、时间连续性等用户交互挑战:智能、使用于不同数据类型的、可支持用户分析决策的交互方法。数据可视化系统数据可视化系统设计四个级联的层次数据可视化系统算法设计数据到可视化的直观映射数据类型(维度、组织形式等)——视图选择数据筛选——信息密度美学因素颜色、视觉突出、动画与过渡、可视化隐喻等交互设计界面、操作、分析和呈现实例之一:Wordle基于关键词的文本内容可视化标签云(TagCloud)用颜色和字体映射关键词的重要性实例之一:WordleWordle:标签云衍化技术在空间利用和美学欣赏方面有所提升实例之一:Wordle实现文本分析1.查找单词Regex匹配字符串,生成单词列表。2.确定字体类型由语系、字符确定,允许不同单词使用不同字体。3.猜测语言并删除停用词如the,it,to这些用户不感兴趣的停用词,各个语言提供停用词列表,文本中前50个词匹配最高的即为文本语言。4.给单词分配权重词频即为权重,特殊情况下可能采用词频对数。实例之一:Wordle实现布局1.加权单词转化为图形构建了一种字体,其点的大小由词频决定,生成Java2D图形。2.展现区域检查单词边框,确定区域面积,调整单词大小使得显示紧凑。3.放置随机贪婪算法,每个单词分配到一个起始位置,如果与已放置单词重叠,则更新位置,直到不重叠。不同的放置策略。4.交叠测试层次边界框确定是否交叠;冲突检测的缓存和空间索引技术。实例之一:Wordle实现螺旋形递归放置策略单词Denmark所走的路实例之一:Wordle实现应用地址其他文字云应用:ImageChef、WordItOut、VocabGrabber完美支持中文Tagxedo实例之二:ThemeRiver时序性的文本内容可视化主题河流ThemeRiver,经典的展现文本主题演化的可视化方法,采用河流为可视编码,将主题隐喻为时间上不断延续的河流。目标:快速、容易发现有用信息。优势:易于区分固有主题词和突然出现主题词;方便观察主题词微妙变化。应用:新闻热点的时间变化等实例之二:ThemeRiver主题河流图示FidelCastro演讲访谈主题横轴:时间颜色:主题宽度:主题词热度实例之二:ThemeRiverThemeRiver实现1.收集FidelCastro's的演讲、访谈、文章和其他有关文献。2.按月划分时间段,计算每段时间的主题词频数(选择64个主题词,以一个主题词一段时间内出现的文章数作为频数,例如:𝑦𝑖j,第i段时间第j个主题词频数)。输入:时间段𝑡𝑖,𝑦𝑖𝑗。3.为每段时间段手动添加外部事件。实例之二:ThemeRiver4.数据预处理中心点:;处理后数据:5.为满足约束条件,smooth,美观要求的改进。基本方法:样条插值绘制图形。改进:①增加约束条件:②:用代替:用代替6.颜色把主题词分成相关组,对每组涂上相似颜色。𝑓(𝑠𝑖)𝑦𝑖min(𝑦𝑖,𝑦𝑖+1)𝑓(𝑠𝑖)𝑓′(𝑡𝑖)=0𝑓(𝑠𝑖)𝑦𝑖max(𝑦𝑖,𝑦𝑖+1)𝑓(𝑠𝑖)实例之二:ThemeRiver不同的效果表现缺陷:1.如果主题词热度相似,难以区分;2.一张图反应的主题词数目有限。数据可视化分类科学可视化面向自然科学,如物理、化学、航天航空、生物学等。对数据模型进行解释、操作,旨在寻找模式、特点和关系。信息可视化处理抽象、非结构化数据,如文本、图表、地图、复杂系统等。可视分析学以可视交互界面为基础,综合图形学、数据挖掘和人机交互技术,将感知和认知能力以可视方式融入处理过程,进行信息交流和知识提炼,完成分析推理和决策。可视化交互•缓解有限的可视化空间和数据过载之间的矛盾•有限的屏幕尺寸不足以显示海量数据•常用的二维显示平面对复杂数据的可视化提出了挑战•BenShneiderman提出:overviewfirst,zoomandfilter,thendetail-on-demand描述了通过交互探索大量数据的有效办法•让用户更好地参与对数据的理解和分析可视化交互交互准则交互延时交互成本交互场景变化交互技术交互延时指从用户操作的发生到系统返回结果所经过的时间,是决定交互有效性最重要的因素之一延时与交互操作的类型、用户体验主观感受有密切关系感知处理:旋转视图立即反应:点击选中基本任务:搜索交互延时解决方案系统应该返回给用户某种视觉信息,确认操作已经完成当一个交互操作完成时间比用户预期的长,系统将操作进程反馈给用户,或将这个交互操作转变成对应的用户延时期望较大的另一类交互交互成本可视化系统应当采用数据挖掘算法自动发现用户可能会关心的数据或模式,并呈献给用户,用户在这个基础上通过互动进行更深入的挖掘只提供必需进行交互的交互交互场景变化可视化场景的变化,需要依赖于用户的视觉和感知记忆避免交互出错,通过可视化将这些需要用户记忆的信息在系统中保存并显示,以减轻用户的负担动画(渐变)用户自主在场景之间切换变化盲视,系统需要辨别需要用户进行关注的变化,通过各种手段(高亮),让用户的注意力集中到这些区域交互技术选择导航重配过滤关联交互技术-选择大量的数据在视图上叠加以致视觉混乱的情况下的选择将堆叠区域和对象放大选择之后要展示的提示性信息在视图上的陈列即字符串在有限空间排列的问题偏心标签•当用户接触到数据点之前标签不可见,接触到数据点时,标签和数据点之间可视连接交互技术-选择偏心标签(ExcentricLabeling)标签过多(1)显示区域内标签数(2)展现区域内部分标签non-crossinglineslabelingverticallycoherentlabelinghorizontallycoherentlabeling=用来计算初始位置交互技术-导航人眼可以观察到的区域及屏幕空间有限,可视化只能显示从选定视点出发课件的局部数据,并通过改变视点的位置观察其他部分的数据缩放、平移、旋转是导航中(调整视点位置、控制视图内容)的三个最基本手段空间显示的对象过密时,无法仅通过缩放、平移、旋转搜寻到目标Link-SlidingBring&GoLink-Sliding点击鼠标选择开始节点围绕节点形成一个浅灰色圆圈,表明选择半径,此处鼠标可以自由行动,这可以让用户选择出发连接Link-cursor始终在路径上距离鼠标指针最近的点,当鼠标指针走出之前的浅灰色圆圈,鼠标指针将被强制拉去link-cursor的位置当每次鼠标事件后,系统更新鼠标位置p,并计算离p最近路径上的点c将其作为link-cursor,鼠标位置通过公式𝑝′=𝛼𝑝+(1−𝛼)c将被拉去link-cursor。当鼠标指针在设定的圆圈内时𝛼=1,当超出圆圈时𝛼=0,为了让变化平滑设置𝛼’=𝛽𝛼+𝜔,其中𝛽=0.5,𝜔=0交互技术-导航交互技术-导航Bring&GoLinksliding不能解决在众多目标目的地中选取某一特定目的地一旦选取某一点,将所有邻近点都显示在改点附近,当用户选择某一邻近点后,视图将和Linksliding一样平滑地移动至目标点所有邻近点将按远近距离排列,最短的放在第一个,并按照这个顺序从最靠近圆心的圆环开始放置,直到该层圆环被放置满交互技术-重配为用户提供观察数据的不同视角Dust&Magnet交互技术-重配Dust&Magnet某dust与magnet越相关,更快地被这个magnet吸引•Magnet的性质•Dust关于Magnet所规定的性质的值•Magnet的强度•Magnet所设置的相斥值交互技术-过滤在信息过滤的过程中,将视觉编码和交互紧密迭代进行,动态实时地更新过滤结果动态查询HomeFinder设置条件的控件•Scentedwidgets所有属性的过滤控件都不相关联•BrushingHistograms交互技术-过滤交互技术-关联显示与特定数据对象有关的隐藏对象,用户需要清楚数据在各个视图中的具体为止Linking&Brushing:基于维度映射和平行坐标常用可视化软件不同领域的可视化软件科学可视化信息可视化可视化分析GrADS气象OpenDX科学、工程AVS科学、商用Amira生命科学IDL科学WorldWind地理Vis5D空间科学GoogleEarth地球GraphVizGephiCiteSpaceJigsaw文本IN-SPIRE文本Tableau商业Spotfire商业Loggly日志分析Weave网络数据ManyEyes公众传播IBMVisual.ly在线数据可视化允许使用Twitter/Facebook/GooglePlus数据GapminderGooglepublic–DataExplorerPalantir常用可视化软件Excel有限的图形化功能D3D3能够提供大量线性图和条形图之外的复杂图表样式,例如Voronoi图、树形图、圆形集群和单词云等常用可视化软件PolyMaps面向数据分析用户的地图可视化工具,在地图处理方面有独到之处常用可视化软件SASSAS系统可完成数据管理、报表、图形和统计功能Gephi社交图谱数据可视化分析工具Processing将命令行可视化,实现编程的网络图像、动画与用户的互动电子艺术与程序语言的结合R语言用于统计分析、绘图的语言和操作环境,可视化功能强大,有ggplot2、lattice等用于可视化的扩展包Weka经典的数据挖掘工具,可完成聚类、分类、回归等任务可视化设计的美学原则主要有三点:1色彩设计2可视编码原则3视觉隐喻可视化设计的美学原则色彩设计·灰度值可被认为是有序的·可用于编码数值型数据·色调通常认为是无序的,可用于编码不同维度的值可视化设计的美学原则色彩设计色彩渐变表示顺序型数据可视化设计的美学原则色彩设计不同色彩区分表类别型数据可视化设计的美学原则例:用不同色彩区分表类别型数据Maps可视化设计的美学原则色彩设计最大化色调区分度可视化设计的美学原则色彩设计相似但有区分度可视化设计的美学原则色彩设计高亮重要内容可视化设计的美学原则色彩选择原则使用有限的色调范围控制
本文标题:数据可视化系统(更新美学原则版)
链接地址:https://www.777doc.com/doc-4006050 .html