您好,欢迎访问三七文档
2018年6月7日目录一、题目.................................................................................................................1二、数据.................................................................................................................1三、可视化工具(哪一种,选择原因).............................................................1四、可视化方案或可视化实现过程.....................................................................21、导入数据并进行规范化...............................................................................................22、数据连接与整理...........................................................................................................23、将地理信息与地图进行结合.......................................................................................24、设置相关参数...............................................................................................................25、可视化方案...................................................................................................................3五、可视化结果.....................................................................................................31、交战阵营可视化...........................................................................................................32、人口统计可视化...........................................................................................................63、死亡人数可视化...........................................................................................................74、时间顺序可视化...........................................................................................................95、人口损失情况可视化.................................................................................................11六、体会...............................................................................................................131一、题目在的可视化课程结束的同时中,本人也开始了数据可视化的大作业的工作。大作业是对前面学过的数据可视化技术的一个总结、回顾和实践。在开始设计前,本人回顾以前所学的内容,明确了本次作业设计所要用到的技术点,成功完成了可视化期末大作业。大作业要求从网络上下载一组数据(自行获取),选择一种可视化工具(Excel、Tableau、Matlab、Echarts等),设计一种可视化方案实现该数据的可视化,并做适当的数据分析(或挖掘)。二、数据本次实验中,我设计的是关于第二次世界大战的数据可视化。原数据为两张表,分别存储了各个国家的人口牺牲情况与各个国家相互之间的战争具体时间、阵营、以及事件。其中国家数据来源于维基百科中WorldWarIIcasualties词条下的表格,具体网址为:。而关于时间、阵营与事件的数据来源于维基百科的WorldWarII词条下方的信息,具体网址为:。两张表之间都以excel形式存在,在导入Tableau数据库的时候,建立两表的关系并对表进行说明。本人在建立过程前引入了一些编号变量,可以进行无视。下面是部分数据截图,具体数据见随文档上交的excel文件。三、可视化工具(哪一种,选择原因)在这次的作业中本人选择的可视化工具为Tableau,选择该工具主要有以下原因:1、快速创建交互式绘图。使用Tableau的拖拽式界面,可以在几分钟内创建许多漂亮的可视化。这个界面可以操作无穷尽的变化,可以轻松解决项目。2、交互式仪表盘。得到结果后可以简单的与结果进行交互,得到更加直观的结果。3、实时的连接,在对原数据进行修改后,简单的刷新数据库就可以对全部的可视化结果进行修改。4、提供多种的可视化方法,不仅限于Excel的简单图,Tableau可以容易的与地图进行连接,构建更加直观的图像。也可以直接选择不同的可视化方法,观察其中的优劣。5、Tableau简单易学,可以快速掌握,简单的得出还算漂亮的图像。2四、可视化方案或可视化实现过程1、导入数据并进行规范化选择导入excel文件,然后整理文件的格式,让系统可以正常识别。2、数据连接与整理把excel表中的表和详细描述进行连接,然后清除掉多余或者无用的项,整理后的数据见下图:图4-1:交战情况表图4-2:国家状况表3、将地理信息与地图进行结合把地理信息同具体的地图进行结合,在地图上解释原来数据中的地理信息。4、设置相关参数设置相关的参数,通过参数来确认相关的阈值,以及形成数据桶,更好的进行分类操作。35、可视化方案1)对交战国战前、战时、战后的情况进行可视化,使用颜色区别阵营。2)对交战国的人口与人口死亡率进行可视化,同时用不同的颜色标识死亡率大小。3)对交战国具体的死亡人数进行可视化,用颜色深浅标识人数多寡。4)对交战国总人口死亡情况进行可视化,设置阈值识别牺牲多寡,同时使用不同颜色标示不同阵营与状态的牺牲人数。5)对交战国具体事件与开战事件进行可视化,要求可以清楚的分辨开战时间的长短与具体事件的先后。6)对以上可视化内容,要求可以突出显示每一个交战国的具体情况。也可以根据阵营或其他分类方法进行突出显示。五、可视化结果1、交战阵营可视化使用了地图的模式,把每一个国家与对应的版图进行连接,其中比较麻烦的是有部分国家政治环境发生了一些变化,导致国家的消失(如苏联、英联邦和南斯拉夫)因此要使用其他的方法重现。下面是本人的阵营图界面:下面是具体的操作演示与分析:战前,1939年前的世界秩序,可以看到,一战中利益受损国从一战中走出,开始积极向周围小国开战,各大利益集团利益开始冲突。4在欧洲,爆发了意识形态冲突,一战中失去了领土的战败国积极的对外扩张,法西斯注意在战败国中间传播。十月革命后成立的苏联也积极对外进行意思形态的输出,同时希望夺取原来属于沙皇俄国的遗产。西班牙意识形态斗争异常剧烈,从而爆发了内战。非洲,意大利积极对外扩张,希望一雪二十年前惨败与埃塞俄比亚的耻辱,而亚洲大部分利益都掌握在欧洲国家手中,对此不满的日本企图夺取东亚的利益,一场大战一触即发。战时,1939年到1943年的世界秩序,可以看到,轴心国势力达到顶峰,世界笼罩在黑暗之中,同时中立的美洲国家加入了世界大战。欧洲大陆几乎被法西斯占据,只有苏联仍然坚持,西班牙内战中右翼政府上台,欧洲形势到了最危急的时候。然而苏联力挽狂澜,在1943年完成了攻守互换。5日本在东亚如入无人之境,横扫东南亚的英美荷殖民地,剑锋直至印度。然而日本低估了美国的工业能力,最后丧失了制海权。于此同时中国也加入了同盟国,正式加入了第二次世界大战。战后,1945年以后的世界秩序,可以看到轴心国势力完全磨平,剩余两大阵营瓜分了轴心的势力范围,并且在东亚开始了新一轮的意识形态竞争。同时因为战争导致欧洲国家力量减弱,各个殖民地独立行动也轰轰烈烈的展开了。欧洲战场,苏联力挽狂澜,意大利忽然反水,美英诺曼底登陆。轴心国势力别瓜分。正如丘吉尔所说,一道横跨欧洲的铁幕拉开了。但由于牺牲过与巨大,欧洲没有发生继续的战争。6亚洲,日本投降,远东的利益又一次别掌握,然而由于宗主国实力的减弱,轰轰烈烈的民族解放运动在南亚开始了。而东亚则成了苏联与美国博弈的舞台,意识形态的战争在这里再次开战。2、人口统计可视化在这个部分设置两个数据桶,把人口总数放入人口数据桶,死亡率放入死亡率数据桶,然后用大小标识国家人口多少,用颜色深浅标识死亡率高低,具体结果如下所示:下面是本人的操作与分析可以看到,下图中战争中别占领的国家,人口伤亡率普遍高于没有被占领的国家。尤其是德国东线战场上的国家,人口死亡率相当惊人。7如下图所示,人口死亡率低于10%的国家明显标注出来,其中主要包括美洲国家、西线战场的国家、英国殖民地以及人口基数较大的国家。下图是人口死亡率高于10%的国家。主要包括苏联成员国,东线战场国家以及德国本身。结合上面的分析,可以得到,海上交战的国家人口死亡率较低,亚洲的人口大国人口因为人口基数较大死亡率次低,而欧洲战场上主要陆上交战国,如德国、俄罗斯、波兰,人口死亡率极高。3、死亡人数可视化在该界面中主要标识了不同国家的具体死亡人口数目,使用颜色深浅来标识数据的大小情况。具体情况见下面的分析操作:下面是按照士兵战死数目,可以看到欧洲西线战场上双方死伤惨重,接下来就是远东的亚洲战场上,中国与日本这两个人口大国之间也是士兵牺牲数量较多的国家。8下面是按照军事行动导致平民死亡的人数,可以看到大部分都是领土别入侵的国家与人口基数较大的国家。不过要注意的是轴心国的数据普遍偏小。下面是按照疾病与饥荒导致平民死亡的数据,可以看到排名靠前的都是人口基数大的国家或者欠发达国家。下面是士兵失踪数目,其中俄罗斯数据包括全部苏联失踪人数。失踪人员可能是临阵脱逃或者关如集中营死亡。这个数据真的有点玄乎,俄罗斯作为苏联一员军事行动中死亡的士兵约6百万,然而全苏联失踪人数竟然达到1千4百万。各国都是失踪人数大于牺牲士兵数,这真的很怪。9下面是全体人口的死亡数,其中我把失踪人数也算入了死亡人数,按照大众的说法是不应该计入失踪人数的,但我还是加上了失踪人数,因为都过去那么多年了,失踪人员假如生还也应该死了,他们的人生因为战争而改变,到最后都生死不明,于是我加上了他们。从上述数据可以看出不同国家的具体人口牺牲数目使用颜色深浅可以让数据更加直观。同时这个数据也是很有问题的,轴心国平民中因为饥荒或者军事行动死亡的人数为零或很少,而且士兵失踪数目也过于巨大;这都是原本数据的不可信点。可以发现,法
本文标题:数据可视化报告
链接地址:https://www.777doc.com/doc-4693547 .html