您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 图文转换15类统计图表图解
1图文转换15类统计图表图解1.散点图散点图表示因变量随自变量而变化的大致趋势,当要在不考虑时间的情况下比较大量数据点时,请使用散点图。散点图中包含的数据越多,比较的效果就越好。随着横坐标逐渐的增大,看从坐标起点开始是不是也是逐渐增大,如果是那么就是正相关,如果不是并且相反就是负相关。一般有指数相关,对数相关等。需要将数值转换为指数形式或者对数形式,重新制作散点图确认(一般转换X轴的数据)。一般用正相关、负相关和不相关描述。点分布在某一条直线附近,若是从左下角区域分布到右上角区域,则是正相关;若是从左上角分布到右下角区域,则是负相关;点的分布无规律则不相关。相关性还可以分强弱,点分布越靠近一直线,相关性也强,否则越弱。分以下几种情况:1.无明显关系,散点比较散乱;2.线性相关。可以大概的看出散点大概的排列在一条直线上下;3.非线性相关。2.折线图折线图是排列在工作表的列或行中的数据可以绘制到折线图中。折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。堆积折线图和带数据标记的堆积折线图:堆积折线图用于显示每一数值所占大小随时间或有序类别而变化的趋势,可能显示数据点以表示单个数据值,也可能不显示这些数据点。如果有很多类别或者数值是近似的,则应该使用无数据点堆积折线图。提示为更好地显示此类型的数据,您可能要考虑改用堆积面积图。百分比堆积折线图和带数据标记的百分比堆积折线图:百分比堆积折线图用于显示每一数值所占百分比随时间或有序类别而变化的趋势,三维折线图:三维折线图将每一行或列的数据显示为三维标记。三维折线图具有可修改的水平轴、垂直轴和深度轴。3.柱状图柱状图,是一种以长方形的长度为变量的表达图形的统计报告图,由一系列高度不等的纵向条纹表示2数据分布的情况,用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。柱状图亦可横向排列,或用多维方式表达。主要用于数据的统计与分析,早期主要用于数学统计学科中,到现代使用已经比较广泛,比如现代的电子产品和一些软件的分析测试,如电脑,数码相机的显示器和photoshop上都能看到相应的柱状图。易于比较各组数据之间的差别。4.地图统计地图是统计图的一种。以地图为底本,用各种几何图形、实物形象或不同线纹、颜色等表明指标的大小及其分布状况的图形。它是统计图形与地图的结合,可以突出说明某些现象在地域上的分布,可以对某些现象进行不同地区间的比较,可以表明现象所处的地理位置及与其他自然条件的关系等。统计地图,有点地图、面地图、线纹地图、彩色地图、象形地图和标针地图等。表明人口、资源、产量等在各地区的分布情况时,都可用统计地图。统计地图是运用统计数据反映制图对象数量特征的一种图型。可形象地反映、揭示统计项目和同一项目内不同统计标准间的同一性和差异性,以分析它们在自然和社会经济现象中的分布特征。主要表现各种社会经济现象的特征、规模、水平、结构、地理分布、相互依存关系及其发展趋势。统计地图是以地图为背景,运用各种线纹、色彩、几何图形或实物形象来显示被研究现象的指标数值的大小及其在各地区的分布状况的一种统计图形。又称空间数列图和地理数列图。主要用于说明某些现象在地域上的分布,进行不同地区间的比较,反映现象所处的地理位置,以及它们的密集和分散程度。这些统计数据分为4种类型:定类数据、定序数据、定距数据、定比数据。前2类数据说明的是事物的品质特征,不能用数值表示,其结果均表现为类别,也称为定性数据或品质数据;后2类数据说明的是现象的数量特征,能够用数值来表现,因此也称为定量数据或数值型数据。为了更适合于统计地图的表达,有时需对统计数据进行一些处理,主要方法有绝对连续比率、条件连续比率、绝对分级比率和条件分级比率。统计单元根据地理国情普查要素的形状特点可分为:定点统计单元(如城镇综合功能单元)、定线统计单元(如线状水系、铁路)和分区统计单元,其中分区统计单元在本次地理国情普查统计分析中应用最为广泛,大致可以分为4大类:1)规则地理格网分区统计单元。对研究区域按不同的网格形状和密度进行划分,不考虑分区单元内的一致性及行政管理部门的管辖范围,如10km×10km格网、1km×1km格网等。2)行政区划分区统计单元。为了进行分级管理实行的国土和政治、行政权力划分而形成的行政管理区域单元,如省级行政区划单元、县级行政区划单元和乡镇级行政区划单元等。3)自然地理分区统计单元。根据自然地理环境的组成、结构、功能、动态及其空间分异规律而形成的单元,如地貌单元、水系流域单元和地形单元等。4)社会经济区域单元。从社会经济发展的角度,综合各种社会资源的整体优化配置和区域经济结构的战略布局而划分的单元,如主体功能区、开发区、保税区、经济区和农林牧场等。包括点地图、面地图、条形地图、线路地图、线纹地图、彩色地图、象形地图、标志(标针)地图和模型地图等形式。它的一般绘制方法是先画一张简明地图作底本,然后根据统计资料在地图上的适当位置,3绘出点、线纹、条形、平面、形象和标志等相应的统计图形。如表现某种指标总数及部分数,可用点、面、标志、象形等表示;如表现现象的密度等可用各种疏密线纹、深浅颜色表示,等等。具体分类可分为四种:(1)线纹或颜色地图:即利用不同线纹或颜色在地图上绘制,明显地表明被研究现象的相对指标或平均指标在各地区的分布情况。(2)点或面积地图:即使用点、方点或圆点在地图上绘制,适用于显示各地区人口密度。(3)象形地图:即以大小不同的象形按地区绘制,是地图与象形图的结合,用以表明统计指标数量的大小。(4)标针地图:即用细针或小标旗插于地图之上的多少,表示各地区内某统计指标数量的大小或变化的情况,特点在于标针可以随形势的变化而转移。5.饼图饼图常用于统计学模块。仅排列在工作表的一列或一行中的数据可以绘制到饼图中。饼图显示一个数据系列(数据系列:在图表中绘制的相关数据点,这些数据源自数据表的行或列。图表中的每个数据系列具有唯一的颜色或图案并且在图表的图例中表示。可以在图表中绘制一个或多个数据系列。饼图只有一个数据系列。)中各项的大小与各项总和的比例。饼图中的数据点(数据点:在图表中绘制的单个值,这些值由条形、柱形、折线、饼图或圆环图的扇面、圆点和其他被称为数据标记的图形表示。相同颜色的数据标记组成一个数据系列。)显示为整个饼图的百分比。6.雷达图雷达图是以从同一点开始的轴上表示的三个或更多个定量变量的二维图表的形式显示多变量数据的图形方法。轴的相对位置和角度通常是无信息的。雷达图也称为网络图,蜘蛛图,星图,星图,蜘蛛网图,不规则多边形,极坐标图或Kiviat图。它相当于平行坐标图,轴径向排列。雷达图的分析方法是:如果企业的比率位于标准线以内,则说明企业比率值低于同行业的平均水平,应认真分析原因,提出改进方向;如果企业的比率值接近或低于小圆,则说明企业经营处于非常危险的境地,急需推出改革措施以扭转局面;如果企业的比率值超过了中圆或标准线,甚至接近大圆,则表明企业经营的优势所在,用予以巩固和发扬。47.K线图K线图形态可分为反转形态、整理形态及缺口和趋向线等。后K线图因其细腻独到的标画方式而被引入到股市及期货市场。股市及期货市场中的K线图的画法包含四个数据,即开盘价、最高价、最低价、收盘价,所有的k线都是围绕这四个数据展开,反映大势的状况和价格信息。如果把每日的K线图放在一张纸上,就能得到日K线图,同样也可画出周K线图、月K线图。8.箱线图箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。箱线图的绘制方法是:先找出一组数据的最大值、最小值、中位数和两个四分位数;然后,连接两个四分位数画出箱子;再将最大值和最小值与箱子相连接,中位数在箱子中间。数据异常值一批数据中的异常值值得关注,忽视异常值的存在是十分危险的,不加剔除地把异常值包括进数据的计算分析过程中,对结果会带来不良影响;重视异常值的出现,分析其产生的原因,常常成为发现问题进而改进决策的契机。箱形图为我们提供了识别异常值的一个标准:异常值被定义为小于Q1-1.5IQR或大于Q3+1.5IQR的值。虽然这种标准有点任意性,但它来源于经验判断,经验表明它在处理需要特别注意的数据方面表现不错。这与识别异常值的经典方法有些不同。众所周知,基于正态分布的3σ法则或z分数方法是以假定数据服从正态分布为前提的,但实际数据往往并不严格服从正态分布。它们判断异常值的标准是以计算数据批的均值和标准差为基础的,而均值和标准差的耐抗性极小,异常值本身会对它们产生较大影响,这样产生的异常值个数不会多于总数0.7%。显然,应用这种方法于非正态分布数据中判断异常值,其有效性是有限的。箱形图的绘制依靠实际数据,不需要事先假定数据服从特定的分布形式,没有对数据作任何限制性要求,它只是真实直观地表现数据形状的本来面貌;另一方面,箱形图判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的耐抗性,多达25%的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不能对这个标准施加影响,箱形图识别异常值的结果比较客观。由此可见,箱形图在识别异常值方面有一定的优越性。5偏态和尾重比较标准正态分布、不同自由度的t分布和非对称分布数据的箱形图的特征,可以发现:对于标准正态分布的大样本,只有0.7%的值是异常值,中位数位于上下四分位数的中央,箱形图的方盒关于中位线对称。选取不同自由度的t分布的大样本,代表对称重尾分布,当t分布的自由度越小,尾部越重,就有越大的概率观察到异常值。以卡方分布作为非对称分布的例子进行分析,发现当卡方分布的自由度越小,异常值出现于一侧的概率越大,中位数也越偏离上下四分位数的中心位置,分布偏态性越强。异常值集中在较大值一侧,则分布呈现右偏态;;异常值集中在较小值一侧,则分布呈现左偏态。下表列出了几种分布的样本数据箱形图的特征(样本数据由SAS的随机数生成函数自动生成),验证了上述规律。这个规律揭示了数据批分布偏态和尾重的部分信息,尽管它们不能给出偏态和尾重程度的精确度量,但可作为我们粗略估计的依据。数据的形状同一数轴上,几批数据的箱形图并行排列,几批数据的中位数、尾长、异常值、分布区间等形状信息便一目了然。在一批数据中,哪几个数据点出类拔萃,哪些数据点表现不及一般,这些数据点放在同类其它群体中处于什么位置,可以通过比较各箱形图的异常值看出。各批数据的四分位距大小,正常值的分布是集中还是分散,观察各方盒和线段的长短便可明了。每批数据分布的偏态如何,分析中位线和异常值的位置也可估计出来。还有一些箱形图的变种,使数据批间的比较更加直观明白。例如有一种可变宽度的箱形图,使箱的宽度正比于批量的平方根,从而使批量大的数据批有面积大的箱,面积大的箱有适当的视觉效果。如果对同类群体的几批数据的箱形图进行比较,分析评价,便是常模参照解释方法的可视图示;如果把受测者数据批的箱形图与外在效标数据批的箱形图比较分析,便是效标参照解释的可视图示。箱形图结合这些分析方法用于质量管理、人事测评、探索性数据分析等统计分析活动中去,有助于分析过程的简便快捷,其作用显而易见。9.热力图以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示。热力图可以显示不可点击区域发生的事情。城市热力图该检测方式只提供参考。你将发现访客经常会点击那些不是链接的地方,也许你应该在那个地方放置一个资源链接。比如:如6果你发现人们总是在点击某个产品图片,你能想到的是,他们也许想看大图,或者是想了解该产品的更多信息。同样,他们可能会错误地认为特别的图片就是导航链接。10.关系图11.矩形树图数据可视化矩形树图的本名为:矩形式树状结构图(Treemap),实现层次结构可视化图表结构。柱形图不适合表达过多类目(比如上百)的数据,那应该怎么办?矩形树图出现了。它直观地以面积表示数值
本文标题:图文转换15类统计图表图解
链接地址:https://www.777doc.com/doc-4391341 .html