您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 招聘面试 > 黑马程序员Python教程:python5种可视化工具
在Python中,将数据可视化有多种选择,正是因为这种多样性,何时选用何种方案才变得极具挑战性。本文包含了一些较为流行的工具以及如何使用它们来创建简单的条形图,我将使用下面几种工具来完成绘图示例:PandasSeabornggplotBokehpygal什么是Matplotlib?Matplotlib是众多Python可视化包的鼻祖。其功能非常强大,同时也非常复杂。你可以使用Matplotlib去做任何你想做的事情,但是想要搞明白却并非易事。我不打算展示原生的Matplotlib例子,因为很多工具(特别是Pandas和Seaborn)是基于Matplotlib的轻量级封装。Pandas首先,导入模块并将数据读入budgetDataFrame,将数据排序并取前10条。importpandasaspdbudget=pd.read_csv(mn-budget-detail-2014.csv)budget=budget.sort('amount',ascending=False)[:10]我们将在所有示例中使用相同的budget数据,下面是其中5条:现在,调整展示风格为更美观的默认设置,并创建图表:pd.options.display.mpl_style='default'budget_plot=budget.plot(kind=bar,x=budget[detail],title=MNCapitalBudget-2014,legend=False)上述代码使用detail列的数据完成了创建图表的主要工作,同时展示了title并移除了legend。下面是将图表存为png格式的代码:fig=budget_plot.get_figure()fig.savefig(2014-mn-capital-budget.png)基础图表看起来不错,理想情况下,我想对y轴再做一些格式化,但是这样做需要使用matplotlib的一些功能。虽然现在的图表已是完美可用的可视化图表了,但是仅仅通过pandas是不可能完成更多定制的。SeabornSeaborn是一个基于matplotlib的可视化库。它旨在使默认的数据可视化更加悦目。它还旨在简化复杂图表的创建,可以与pandas很好地集成。标准导包及读取数据:sns.set_style(darkgrid)bar_plot=sns.barplot(x=budget[detail],y=budget[amount],palette=muted,x_order=budget[detail].tolist())plt.xticks(rotation=90)plt.show()正如你所看到的,我必修使用matplotlib旋转x轴的标题以便可以正常地阅读。从外观上看,图表看起来不错。理想情况下,我想格式化y轴上的刻度,但我不知道在不使用matplotlib中的plt.yticks的情况下,如何实现格式化。ggplotggplot与Seaborn类似,也是基于matplotlib并旨在以简单的方式提高matplotlib可视化的视觉感染力。它不同于seaborn是因为它是ggplot2为R语言准备的一个端口。基于这个目标,一些API的接口虽然不是很pythonic但是功能很强大。继续导包并读取数据:importpandasaspdfromggplotimport*budget=pd.read_csv(mn-budget-detail-2014.csv)budget=budget.sort('amount',ascending=False)[:10]现在让我们通过连接几条ggplot命令来构造图表:p=ggplot(budget,aes(x=detail,y=amount))+geom_bar(stat=bar,labels=budget[detail].tolist())+ggtitle(MNCapitalBudget-2014)+xlab(SpendingDetail)+ylab(Amount)+scale_y_continuous(labels='millions')+theme(axis_text_x=element_text(angle=90))printp这似乎看起来有些奇怪–尤其是使用printp来显示图表。但是,我发现这样相对简单明了。要弄清楚如何将文本旋转90度以及如何将x轴上的标签排序,确实要做些深入的挖掘。我发现最酷的功能是scale_y_continous,它可以使标签更美观。如果你想将图表保存为图片,使用ggsave可以很轻松地办到:ggsave(p,mn-budget-capital-ggplot.png)下图是最终的图片,我知道灰色可能有点多,但是毫不费时就可以给它添些色彩。BokehBokeh不同于之前的3个库,它不依赖于matplotlib并且实现的是面向现代浏览器的可视化。它的目标是实现交互式的web可视化,所以我的例子非常简单。导包并读入数据:importpandasaspdfrombokeh.chartsimportBarbudget=pd.read_csv(mn-budget-detail-2014.csv)budget=budget.sort('amount',ascending=False)[:10]bokeh不同的一方面是我需要明确列出我绘图需要的值。details=budget[detail].values.tolist()amount=list(budget[amount].astype(float).values)现在我们可以绘图了。下面的代码将会实现在浏览器中展示包含图表的HTML页面,如果想用作其他展示,可以保存其png格式的副本。bar=Bar(amount,details,filename=bar.html)bar.title(MNCapitalBudget-2014).xlabel(Detail).ylabel(Amount)bar.show()下面是png格式的图片:正如你所看到的,图表是非常干净的。我没有找到一种更简单的方式来格式化y轴。Bokeh有很多功能,但在本例中我并未深入探索。PygalPygal用于创建svg格式的图表,如果安装了正确的依赖,也可以保存为png格式。svg文件在创建交互式图表时非常有用,同时我也发现,使用此工具可以非常容易地创建独特而又极具视觉感染力的图表。导包及读取数据:importpandasaspdimportpygalfrompygal.styleimportLightStylebudget=pd.read_csv(mn-budget-detail-2014.csv)budget=budget.sort('amount',ascending=False)[:10]我们需要创建图表类型并做一些基础设置:bar_chart=pygal.Bar(style=LightStyle,width=800,height=600,legend_at_bottom=True,human_readable=True,title='MNCapitalBudget-2014')有趣的一点是human_readable,它可以很好地格式化数据,所以大多数情况下,这个功能“很管用”。现在我们需要向图表中添加数据,这是与pandas集成地不是很紧凑的地方,但是就本次的小数据集来说,可以直接添加数据。数据量很大时,性能可能会是一个问题。forindex,rowinbudget.iterrows():bar_chart.add(row[detail],row[amount])接下来,将文件渲染为svg和png格式:bar_chart.render_to_file('budget.svg')bar_chart.render_to_png('budget.png')我觉得svg的展示效果确实很好,我很喜欢看起来独特且赏心悦目的风格。同时我也发现,我们可以相对容易地弄清楚使用此工具时,哪些可以实现,哪些不能实现。我鼓励大家下载svg文件,并在浏览器中感受图表的互动效果。Pandas对于简单的图表绘制时非常方便的,但是你需要学习matplotlib来实现定制。Seaborn可以支持一些更复杂的可视化方法,但仍需要matplotlib的知识来调整。颜色方案是一个不错的功能。ggplot很有前景,但它仍在努力成长中。如果你想建立自己的可视化服务器,bokeh将是一个强大的工具。但是对于一些简单的脚本,使用bokeh就像杀鸡用牛刀一样。pygal在创建互动使SVG图表和PNG文件方面是独一无二的。它不如基于matplotlib的解决方案灵活。
本文标题:黑马程序员Python教程:python5种可视化工具
链接地址:https://www.777doc.com/doc-4210757 .html