您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > 数据可视化教材清华大学shujukeshqinghvis-04-759601574
数据可视化基础胡事民计算机科学与技术系目录•可视化流程模型•可视化设计–数据类型–视觉感知规律和可视编码–色彩设计可视化流程模型•数据可视化不仅是一门包含各种算法的技术,还是一个具有方法论的学科。•在实际应用中需要采用系统化的思维,设计数据可视化方法与工具•本节课程通过对数据可视化基本流程和设计所遵循的多层次模型,介绍可视化基本框架信息可视化的流水线模型可视化输入:1.任务描述;2.数据3.所属领域信息,包括元数据模型;内在语义;概念模型等信息可视化的流水线模型可视化处理:1.多种数据处理算法2.考虑视觉编码和视觉隐喻的数据到图形元素的映射信息可视化的流水线模型可视化输出:基于视觉通道和视觉变量理论,生成可视化图像数据可视化的流水线•可视化常用术语byHaberandMcNabb•该流水线描述了从数据空间到可视空间的映射,体现了数据处理和图形绘制的嵌套组合。Haber,R.B.andMcNabb,D.A.Visualizationidioms:Aconceptualmodelforscientificvisualizationsystems,1990.可视化循环模型•CStolte等提出的可视化循环模型回路模型•JarkVanWijk等人提出的可视化回路模型,注重用户感知和交互探索在回路中的作用最优可视化参考模型•Card,Mackinlay&Shneiderman提出的信息可视化模型:将流水线改成回路,且用户交互可以出现在任何阶段。后续几乎所有著名的可视化系统和工具均支持这个模型。Card,S.K.,Mackinlay,J.D.,andShneiderman,B.,editors.ReadingsinInformationVisualization:UsingVisiontoThink,1999.小结•任意一种可视化系统,人是核心的要素–机器智能可部分替代人所承担的工作,且多数场合效率更高–人是最终决策者,是知识的加工者和使用者。可视化目标是增强人的能力而不是替代人的作用。•可视化流程三个核心要素–数据表示与变换–数据可视化呈现–用户交互目录•可视化流程模型•可视化设计–数据可视化设计模型–数据类型–视觉感知规律和可视编码–色彩设计数据可视化设计模型•四层嵌套模型:将数据可视化设计简化为四个级联的层次:–问题刻画层–抽象层–编码层–算法实现层数据可视化设计模型•四层嵌套模型:将数据可视化设计简化为四个级联的层次:•特点:层层嵌套,上游输出是下游的输入,上游的错误会级联到下游各层。如:抽象阶段做了错误的决定,最好的可视编码和算法设计也无法创建一个解决问题的可视化系统。•优点:无论各层以何种顺序执行,都可以独立地分析每层是否正确处理数据可视化设计模型•第一层:问题刻画层–刻画用户的真实问题。–通过与目标用户群大量时间相处了解受众需求,包括任务需求、数据所属特定目标领域、特定术语和固定工作流程数据可视化设计模型•第二层:抽象层–将特定领域的任务和数据映射到抽象且通用的任务和数据类型。–将这些特定领域的需求转化为不依赖于特定领域概念的通用任务。高层通用任务如不确定性计算、关联分析、参数确定等;底层通用任务如取值、过滤、统计、排序、异常检测、趋势预测等;通用任务如识别、判断、比较、推断等数据可视化设计模型•第三层:设计可视编码和交互方法–是可视化研究的核心,设计与数据类型相关的可视编码与交互方法。•第四层:系统设计的算法实现–设计与前三个层次匹配的具体算法–设计算法性能和精度达到要求。•第三层和第四层是本课程后续讲述的大部分内容目录•可视化流程模型•可视计–数据可视化设计模型–数据类型–视觉感知规律和可视编码–色彩设计数据类型•数值型(quantitative,Q)–10厘米,17厘米,23厘米•有序型(ordinal,O)–小,中,大–周日,周一,周二……•类别型(nominal,N)–苹果,桔子,香蕉……数值型数据•Q–Interval(零任意的位置,也称区间型数据)–日期:1月19日;位置(纬度,经度)–只有差异可以比较(区间等)•Q–Ratio(固定的零,也称比值型数据)–度量:长度、质量、温度–原点是有意义的,可以度量比例和比率横向表示一条条记录纵向表示一条条数据域根据不同类型对数据(数值型、类别型、有序型)进行着色数值型数据可以度量而有序型和类别型只有范围的概念目录•可视化流程模型•可视计–数据可视化设计模型–数据类型–视觉感知规律和可视编码–色彩设计视觉感知的格式塔理论WolgangKöhler1887-1967KurtKoffka1886-1941MaxWertheimer1880-1943为什么我们在观看事物的时候会把一部分当做前景,其余部分当做背景?为什么我们能区分形状?什么形状是好的?格式塔(gestalt)原则•强调经验和行为的整体性,认为整体不等于部分之和,意识不等于感觉元素之和•观点:感知的事物大于眼睛所见事物,即任何一种经验现象,其中每一成分都与其余牵连,每一成分之所以具有其特性,是因为它与其他部分具有关系•由此构成的整体,并不决定于个别元素,而局部也取决于整体的内在特性。•最基本的法则:简单精炼法则格式塔(gestalt)原则•结构比元素重要(整体不等于部分的和)•简单精炼法则(蕴涵律)–接近性(proximity)–相似性(similarity)–连续性(continuity)–闭合性(closure)–简单性(simplicity)视觉元素在空间较近时,人们倾向于将其分为一组格式塔(gestalt)原则•结构比元素重要(整体不等于部分的和)•简单精炼法则(蕴涵律)–接近性(proximity)–相似性(similarity)–连续性(continuity)–闭合性(closure)–简单性(simplicity)人们会自然地根据事物相似性进行感知分组格式塔(gestalt)原则•结构比元素重要(整体不等于部分的和)•简单精炼法则(蕴涵律)–接近性(proximity)–相似性(similarity)–连续性(continuity)–闭合性(closure)–简单性(simplicity)人们在观察事物时会自然沿着物体边界将不连续的物体视为连续物体格式塔(gestalt)原则•结构比元素重要(整体不等于部分的和)•简单精炼法则(蕴涵律)–接近性(proximity)–相似性(similarity)–连续性(continuity)–闭合性(closure)–简单性(simplicity)只要物体的形状足以表征物体本身,人们就会容易地感知整个物体而忽视未闭合的特征格式塔(gestalt)原则•结构比元素重要(整体不等于部分的和)•简单精炼法则(蕴涵律)–接近性(proximity)–相似性(similarity)–连续性(continuity)–闭合性(closure)–简单性(simplicity)人们会倾向将复杂形状分解为简单形状进行理解格式塔(gestalt)原则•结构比元素重要(整体不等于部分的和)•简单精炼法则(蕴涵律)–共势原则(commonfate)–好图原则(similarity)–对称原则(symmetry)–经验原则(pastexperience)如果一组物体沿着相似的光滑路径运动趋势或具有相似的排列模式,人眼会将它们识别为同一类物体从一堆字符中认知语句格式塔(gestalt)原则•结构比元素重要(整体不等于部分的和)•简单精炼法则(蕴涵律)–共势原则(commonfate)–好图原则(similarity)–对称原则(symmetry)–经验原则(pastexperience)人眼通常会自动将一组物体按照简单、规则、有序的元素排列方式识别对五环形状的两种识别。上:奥运环;下:割裂的圆环。格式塔(gestalt)原则•结构比元素重要(整体不等于部分的和)•简单精炼法则(蕴涵律)–共势原则(commonfate)–好图原则(similarity)–对称原则(symmetry)–经验原则(pastexperience)人的意识倾向于将物体识别为沿某点或某轴对称的形状格式塔(gestalt)原则•结构比元素重要(整体不等于部分的和)•简单精炼法则(蕴涵律)–共势原则(commonfate)–好图原则(similarity)–对称原则(symmetry)–经验原则(pastexperience)在某些情形下视觉感知与过去的经验有关。相对性&绝对性•感知系统基于相对判断,而非绝对判断(Weber‘sLaw)无线框未对齐难分辨有线框未对齐易分辨ABABAB无线框对齐易分辨A和B那一个更高?相对性&绝对性•感知系统基于相对判断,而非绝对判断(Weber‘sLaw)A和B哪一个更亮?小结•基本思想:视觉形象首先作为统一整体被认知,而后才以部分的形式认知。•可视化设计必须遵循心理学关于感知和认知的理论成果,视图设计者必须以一种直观的、绝大多数用户容易理解的数据-可视化映射进行信息编码。可视编码•JacquesBertin–法国制图学家[1918-]–“SemiologyofGraphics”[1967]–提出可视编码的理论原则可视编码•可视编码是将数据信息映射为可视化元素的技术,其通常具有表达直观、易于理解和记忆的特性。•数据包含属性和值,相应可视编码也由两部分组成:–标记:属性到可视化元素的映射,直观代表数据性质的分类–视觉通道:数据的值到标记的视觉表现属性的映射,展现数据属性的定量信息。可视编码的两个因素•标记(图形元素:点、线、面)•通道(位置、大小、形状、方向、色调、饱和度、亮度……)可视编码的例子柱状图散点图可视编码的诸多问题•可视化设计中优选哪些视觉通道?•具体有多少种视觉通道可供使用?•某个视觉通道能编码什么信息,能包含多少信息量?•视觉通道表达信息能力的区别?•哪些视觉通道互不相关而哪些又相互影响?•……只有熟知视觉通道的特点,才能设计出有效解释数据信息的可视化•对于基本数据类型,可以通过使用不同的视觉编码通道来表达数据及其之间的关系Mackinlay提出的视觉变量Mackinlay给出的基本数据类型适用的可视编码方法,优先级自上而下Tableau使用的视觉变量Tableau是桌面系统中最简单的商业智能工具软件,将数据运算与美观的图表完美地嫁接在一起,可视数据浏览和可视化分析。Shneiderman的数据/任务分类•数据–一维,二维,三维位,时序,n维,树,网络–文本和文档(Hanrahan提出)•可视化格言–总览为先,缩放过滤,按需查看细节(Overviewfirst,zoomandfilter,detailsondemand.)•任务–总览(overview),缩放(zoom),过滤(filter),details-on-demand,–相关(relate),历史(history),提取(extract)–仅靠数据是不够的–人们需要做什么?Shneiderman,TheEyesHaveIt:ATaskbyDataTypeTaxonomyforInformationVisualizations]可视化视图集合可视编码—视觉通道•类型(type)–是什么/在哪里(what/where)–何种程度(howmuch)•表现力(expressiveness)–表达且仅表达数据的完整属性–判断标准:精确性、可辨性、可分离性、视觉突出•有效性(effectiveness)–通道表现力符合属性的重要性视觉通道的类型Categoricalwhat/whereRelationalgroupingOrdinal/Quantitativehowmuch视觉通道的类型通道位置尺寸灰度纹理色调方向形状标记形式点线面颜色中的信息•(灰度)值可被认为是有序的•可用于编码数值型数据•色调通常认为是无序的,可用于编码不同维度的值视觉通道的类型•一些定性的视觉通道–形状–色调–空间位置•更多的是定量视觉通道–长度–面积–体积–斜率、角度–饱和度、亮度–……视觉通道类型并不具有明确界限,如当使用两点到某一
本文标题:数据可视化教材清华大学shujukeshqinghvis-04-759601574
链接地址:https://www.777doc.com/doc-3548144 .html