您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 金融资料 > 如何做统计分析?.ppt
如何做统计分析?职业规划部:张国华‹#›‹#›目录什么是统计?§1如何区分数据类型?§2怎样利用统计分析方法?§3‹#›‹#›什么是统计呢?‹#›‹#›什么是统计?‹#›‹#›你想过下面的问题吗?当公司推行客户发货需保价时,告知客户发货时需要购买保险。说多了,客户会觉得高,以后不来发货;说少了,公司会得不偿失,也是损失。到底这个保价额是怎样决定的呢?保价这么高?这是公司定的…‹#›‹#›你想过下面的问题吗?任何客户都有一个信用问题。有些客户试图发货时采用月结或欠款方式付账时,如何根据它们的财务和商业资料来判断一个客户的信用等级呢?这次我可以欠款吗?可以!‹#›‹#›你想过下面的问题吗?如何通过员工调查来得到性别、年龄、职业、收入等各种因素与员工对某项事物(比如公司某项制度或政策)的态度的关系呢?他们会认同这项政策吗?‹#›‹#›你想过下面的问题吗?绩效的高低与领导者花在沟通上时间的多寡成正比?‹#›‹#›统计是什么?•一般来说,统计先从现实世界收集数据(信息),如营业额增长•然后,根据数据作出判断,称为模型•模型是从数据产生的•模型也需要根据新的信息来改进•不存在完美的模型•模型的最终结局都是被更能够说明现实世界的新模型所取代‹#›‹#›一句话统计学(statistics)是用以收集数据,分析数据和由数据得出结论的一组概念,原则和方法。‹#›‹#›统计学的理念‹#›‹#›数据类型的分类数据类型品质型数据(定性数据)数值型数据(定量数据)‹#›‹#›数据类型举例例:花名册信息籍贯:广东广州姓名:张三性别:男民族:汉家庭成员:4年龄:50(连续变量)身高:172cm‹#›‹#›不同类型数据处理办法‹#›‹#›SPSS操作界面-定义变量‹#›‹#›SPSS操作界面-输入数据‹#›‹#›数值型数据品质型数据‹#›‹#›如何选取统计方法?该用哪种分析方法?‹#›‹#›关于美国选举的两个例子(1)•谁会在1936选举中获胜?AlfLondon还是F.D.R.(罗斯福)?•LiteraryDigest(文摘)送出一千万份问卷(返回二百四十万份)后,预测London会赢.•而Gallop(盖洛普)只问了5000人说Roosevelt(罗斯福)会赢.•最后罗斯福和盖洛普都赢了.文摘倒闭了‹#›‹#›关于美国选举的两个例子(2)•谁会在1948选举中获胜?ThomasDewey还是HarryTruman(杜鲁门)?•Crossley,Gallop(盖洛普),Roper所有都预测Dewey会赢(每个机构用了5000个问卷).•最后(包括盖洛普)他们都输了,而杜鲁门赢了.‹#›‹#›抽样方法一、简单随机抽样法二、系统抽样法三、分层抽样法四、整群抽样法‹#›‹#›抽样调查考虑因素时间/人力及预算成本操作过程的精确性破坏性检验考虑因素‹#›‹#›样本大小(1)利与弊样本太小结果不具代表性,导致抽样误差可能过大样本过大可以降低抽样误差,增加了成本负担,包括时间,人力等一般样本以50-5000之间为宜。‹#›‹#›样本大小(2)两个公式:当估计△时,N=Z2*σ2/△2其中:Z为某一置信度所对应的临界值(可由正态分布表差得)σ为总体标准差(通常以样本标准差S取代)△为可容许的误差范围(可有调查者自己决定可允许的误差)当估计p时,N=Z2*p*(1-p)/△2其中:Z为某一置信度所对应的临界值(可由正态分布表差得)p为总体比例(以样本比例p取代)△为可容许的误差范围(可有调查者自己决定可允许的误差)‹#›‹#›举例=NORMINV(A2,0,1)=B2^2*C2*(1-C2)/D2^2‹#›‹#›统计学的分类‹#›‹#›统计分析方法根据研究方法的不同可分为描述性统计和推断性统计两大类。描述性统计:就是运用各种表格、图形和数字来概括总体数量特征的方法。最常用的就是平均数。推断性统计:在人们可以控制的范围内,根据样本资料的特征,对总体的特征作出估计和预测的方法。‹#›‹#›描述性统计(1)‹#›‹#›描述性统计(2)‹#›‹#›描述性统计(3)‹#›‹#›描述性统计离散程度集中趋势‹#›‹#›SPSS和EXCEL比较DescriptiveStatistics4754475417644220745902156.90.34423.715562.407-.335.036.656.071StatisticStatisticStatisticStatisticStatisticStatisticStd.ErrorStatisticStatisticStatisticStd.ErrorStatisticStd.ErrorNRangeMinimumMaximumSumMeanStd.DeviationVarianceSkewnessKurtosis总分ValidN(listwise)峰度偏度总分平均156.8998738标准误差0.343950224中位数158众数164标准差23.7151123方差562.4065516峰度0.656194342偏度-0.334991065区域176最小值44最大值220求和745902观测数4754最大(1)220最小(1)44置信度(95.0%)0.674301746‹#›‹#›均值,中位数,众数对称种型分布均值=中位数=众数左偏分布均值中位数众数右偏分布众数中位数均值‹#›‹#›直方图‹#›‹#›‹#›‹#›‹#›‹#›‹#›‹#›几种常用统计方法线性回归分析卡方检验分析均值比较分析‹#›‹#›均值比较分析(1)原经理新经理原经理新经理154.7%73.9%-19.82%-83.35%257.2%56.5%199.80%65.70%364.7%63.9%49.60%31.82%464.1%82.1%-23.68%25.30%570.6%88.4%92.42%293.46%672.3%66.6%238.07%81.84%784.2%72.0%166.85%95.48%865.7%88.8%120.70%144.53%997.3%81.2%265.36%148.72%1090.6%73.4%194.02%146.24%1181.3%74.2%148.04%113.51%1265.9%78.4%141.29%162.63%1366.3%75.3%257.65%281.57%1456.8%85.5%-39.53%143.43%1540.7%58.5%-12.92%-155.52%1655.7%77.2%103.28%136.66%1767.7%65.3%128.76%100.69%1895.7%65.7%106.23%74.49%营业额完成率利润完成率编号‹#›‹#›均值比较分析(2)‹#›‹#›均值比较分析(3)t-检验:成对双样本均值分析变量1变量2平均0.6951984430.7371432方差0.0229945320.0091781观测值1818泊松相关系数0.145129924假设平均差0df17tStat-1.06433258P(T=t)单尾0.151031454t单尾临界1.739606716P(T=t)双尾0.302062908t双尾临界2.109815559‹#›‹#›单因素方差分析(1)‹#›‹#›单因素方差分析(2)‹#›‹#›单因素方差分析(3)‹#›‹#›单因素方差分析(4)‹#›‹#›单因素方差分析(5)‹#›‹#›单因素方差分析(6)描述统计方差齐性检验方差分析结果‹#›‹#›单因素方差分析(7)两两比较‹#›‹#›多因素方差分析(1)‹#›‹#›多因素方差分析(2)‹#›‹#›多因素方差分析(3)‹#›‹#›多因素方差分析(4)‹#›‹#›多因素方差分析(5)‹#›‹#›多因素方差分析(6)‹#›‹#›多因素方差分析(7)‹#›‹#›多因素方差分析(8)‹#›‹#›多因素方差分析(9)TestsofBetween-SubjectsEffectsSourceTypeIIISumofSquaresdfMeanSquareFSig.CorrectedModel388439.0863411424.67923.598.000Intercept1764419.19611764419.1963644.404.000年龄5582.96331860.9883.844.009所属区域51075.92386384.49013.187.000工龄22647.73982830.9675.847.000性质29257.61939752.54020.144.000员工类别176855.1171214737.92630.441.000Error2284679.2544719484.145Total119705048.0004754CorrectedTotal2673118.3404753aRSquared=.145(AdjustedRSquared=.139)‹#›‹#›多因素方差分析(10)区域NSubset123411,384150.895839155.402222158.48158.488236158.92158.929505159.43159.434408159.82159.823221160.19160.196787162.37162.377152165.14Sig.1.0000.0590.2100.107‹#›‹#›不同部门员工对工资水平的满意度是否有差异?‹#›‹#›卡方检验员工性质满意度合计12345(经营)1623421061471732009(运营)2574111140495622165(职能)39812256210387(会计类)4241121281193合计130875254710561464754‹#›‹#›卡方检验(1)‹#›‹#›卡方检验(2)‹#›‹#›卡方检验(3)‹#›‹#›卡方检验(4)‹#›‹#›卡方检验(5)‹#›‹#›卡方检验(6)‹#›‹#›卡方检验(7)‹#›‹#›卡方检验(8)‹#›‹#›卡方检验(9)分布表结果‹#›‹#›Chi-SquareTestsValuedfAsymp.Sig.(2-sided)PearsonChi-Square33.378120.001LikelihoodRatio37.283120.000Linear-by-LinearAssociation11.22610.001NofValidCases4,754a.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis5.28.‹#›‹#›统计预测•统计预测的步骤确定预测目的搜索和审核资料分析预测误差,改进预测模型选择预测模型和方法提出预测报告‹#›‹#›预测方法线性回归模型‹#›‹#›线性回归模型‹#›‹#›‹#›‹#›‹#›‹#›‹#›‹#›‹#›‹#›人数=600.038+171.926*序数‹#›‹#›预测值‹#›‹#›谢谢!‹#›‹#›81让我们携手共进用心沟通天地人和
本文标题:如何做统计分析?.ppt
链接地址:https://www.777doc.com/doc-6764655 .html