您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 业务数据的分析方法(PPT 52页)
学员使用EXCEL的熟练程度使用EXCEL的熟练程度25%61%14%没有用过只做过简单的计算使用过统计分析学员对数理统计的熟悉程度对数理统计的熟悉程度34%50%16%完全没有学过学习过,有一般了解熟悉数理统计的方法议程利用EXCEL分析数据常用统计软件数据挖掘常用统计方法:–描述统计–假设检验–方差分析–回归分析利用EXCEL分析数据常用图和表:–折线图,饼图,面积图,频数表和柱状图,散点图,时间序列–数据透视图常用简单的统计命令:AVERAGE,VAR,STDEV,MODE,MEDIAN,SUM,SUMIF,SUMPRODUCT,COUNT,COUNTIF,MAX,MIN,QUARTILE,PERCENTILE利用EXCEL分析数据--折线图0102030405060708090100第一季度第二季度第三季度第四季度东部西部北部折线图:显示随时间或类别而变化的趋势线折线图类型利用EXCEL分析数据--饼图第一季度第二季度第三季度第四季度饼图:显示每一数值相对于总数值的大小,分离饼图强调单个数值的大小饼图类型利用EXCEL分析数据--面积图020406080100120140160180第一季度第二季度第三季度第四季度北部西部东部面积图:显示每一数值所占大小随时间或类别而变化的趋势线面积图类型利用EXCEL分析数据:--柱状图0102030405060708090第一季度第二季度第三季度第四季度东部西部北部柱状图:比较相交于类别轴上的数值大小;堆积柱状图:比较相交于类别轴上的每一数值相对于总数值的大小柱状图类型条形图类型条形图也可用一种类似的方法显示数据,仅仅是将垂直方向换成水平方法而已。堆积条形图可以在同一个条上连续地显示各种数据,而不像簇状条形图那样把条并列在一起显示数据。频数分析和直方图频数分布表指,在不同的类别里发生了多少次观测值直方图通过图形的方式表达了同样信息。直方图的应用举例来自Shoes.xls鞋的尺寸大小分布图020406.57.58.59.510.511.512.513.5尺寸频数利用EXCEL分析数据--散点图0102030405060708090100012345东部西部北部散点图:比较成对的数值。散点图类型利用散点图的关系分析我们经常关心两个变量之间的关系。一个非常有用的显示这个关系的方法是对每一个观测值都在图上作一个点,这个点的坐标代表了两个相关变量的值。结果产生的图就是散点图。通过检查散点的分布,我们可以查看两个变量之间有没有什么关系,如果有,是什么样的关系。来自Actors.xls例5:时间序列制图时间序列图的本质是散点图,时间序列变量在纵轴,时间变量在横轴。同时为了分布的趋势更加清晰,这些点通常是通过线连接在一起。来自Toys.xls例6:练习:分析某某区近期得业务状况分析指标:总收件票数,日均收件票数,日人均效能要求:–各指标逐月变化情况–各指标的相关性–各分部的票数占该区总票数的比例变化数据透视图数据透视图报表是一种具有图表格式的交互式数据汇总报表,是一个Excel功能很强大,而且易于使用的工具。这个工具提供了大量有用的信息,可以让我们可以从不同角度切割,就是可以把数据分成一些子集。数据透视表的创建与常规的MicrosoftExcel图表不同。在创建数据透视图报表后,您还可以通过拖动其字段和项目来查看不同层次的明细数据或重新组织图表的版式。例7:AccountingProfessionals.xls数据集来自AccountingProfessionals.xls创建数据透视图的步骤•选择数据范围•确定所要创建表格的类型•确定字段设置•选择报表格式•选择读取方式数据透视表的优点在于:如果想要改分析,可以仅仅将带有阴影的变量名拖出透视表,并用其他变量代替,你能轻易地在字段域中增加多个变量来创建不同的数据图。创建数据透视图的优点利用EXCEL分析数据常用图和表:–折线图,饼图,面积图,频数表和柱状图,散点图,时间序列–数据透视图常用简单的统计命令:AVERAGE,VAR,STDEV,MODE,MEDIAN,SUM,SUMIF,SUMPRODUCT,COUNT,COUNTIF,MAX,MIN,QUARTILE,PERCENTILE平均值平均值:是某个变量所有值的平均数。如果数据代表了一个大量数据的样本,我们就叫他样本均值。如果是对象是整体分析,就是整体均值。公式:Excel命令:=AVERAGE() ̄Σni=1χiχ=n四分位数和百分比Excel命令:QUARTILE(salary,1):返回一组数据的四分位点PERCENTILE(salary,.05):返回一组数据的K百分比的数值点最小值、最大值Excel命令:MAX(number1,number2…):返回一组数据的最大值,忽略文本MIN(number1,number2…):返回一组数据的最小值,忽略文本方差描述样本数据的离散程度公式:Excel命令:VAR(supplied)STDEV(supplied)σ2=Σni=1(χiχ)2n ̄计算均值,中位数,众数,方差举例RangenamesSupplier1:A4:A14Supplier2:B4:B14来自Otis4.xls相关分析•用于反映分析变量间的密切程度•相关系数度量的是两个间隔尺度变量之间线性关联关系的程度。•正的相关系数表示一个变量的较大值和另一个变量的较大值是联系在一起的。而负的相关系数则表示一个变量的较大值和另一个变量的较小值之间具有的关联关系。相关分析举例来自Expenses.xls相关分析举例–用于运动的支出与用于文化的支出的关系负相关散点图$0$200$400$600$800$1,000$1,200$1,400$1,600$1,800$0$500$1,000$1,500$2,000运动文化来自Expenses.xls正相关散点图$0$10,000$20,000$30,000$40,000$50,000$60,000$70,000$80,000$90,000$0$500$1,000$1,500$2,000文化工资来自Expenses.xls相关分析举例–收入与用于文化的支出的关系相关分析举例–相关系数与协方差来自Expenses.xls数据分析的常用软件MINITABSPSSEXCEL-XLSTAT议程利用EXCEL分析数据常用统计软件数据挖掘常用统计方法:–描述统计–假设检验–方差分析–回归分析数据挖掘(DataMining)什么是DataMining?DataMining的应用DataMining算法包括:–预测(Prediction)–分类(Classification)–联系(Association)–回归(Regression)什么是DataMining?通过采用自动或半自动的手段,从大量数据中提取出可信、新颖、有效并能被人理解的信息的高级处理过程按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法数据挖掘能够帮助你选择正确瞄准潜在目标,向现有的客户提供额外的产品,识别那些准备离开的好客户发现最有价值的客户数据挖掘的作用使组合销售更有效率数据挖掘的作用留住那些最有价值的客户数据挖掘的作用用更小的成本发现欺诈现象数据挖掘的作用数据挖掘应用领域电信:流失银行:聚类(细分),交叉销售百货公司/超市:购物篮分析(关联规则)保险:细分,交叉销售,流失(原因分析)信用卡:欺诈探测,细分电子商务:网站日志分析税务部门:偷漏税行为探测警察机关:犯罪行为分析医学:医疗保健议程利用EXCEL分析数据常用统计软件数据挖掘常用统计方法:–描述统计–假设检验–方差分析–回归分析假设检验涉及对总体参数数值有关的两个命题(假设)作推断步骤–提出待检验的假设–选择显著性水平–确定一个作结论的判断准则–收集数据并计算检验统计量–用决策法则检验统计量并得出结论假设检验包括:t检验和z检验方差分析(ANOVA)单因素方差分析:通过简单的方差分析,对两个以上样本平均值进行相等性假设检验(样本取自具有相同平均值的样本总体)。此方法是对双平均值检验(如t-检验)的扩充。可重复双因素分析:对单因素方差分析的扩展,即每一组数据包含不止一个样本。无重复双因素分析:通过双因素方差分析(但每组数据只包含一个样本),对两个以上样本均值进行相等性假设检验(样本取自具有相同平均值的样本总体)。此方法是对双平均值检验(如t-检验)的扩充。回归分析回归分析是一种用于两个或两个以上变量之间建立关系的统计技术在回归分析里,要在分析所感兴趣的变量-因变量或相应变量与一个或几个字变量或预测变量之间建立关系回归分析的目标,是建立一个回归模型或一个预测方程,使因变量能与那一个或几个自变量联系起来。这样回归模型就可以用来凭借这些自变量描述预测和控制因变量。包括:简单回归模型、多元回归模型讨论
本文标题:业务数据的分析方法(PPT 52页)
链接地址:https://www.777doc.com/doc-1636990 .html