您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 市场调查资料的整理与分析(PPT47页)
第六章市场调查资料的整理与分析陈方英第一节市场调查资料的整理第二节市场调查资料的分析小结第一节市场调查资料的整理一、资料整理的步骤和内容1、步骤2、审查内容1)资料的真实性2)资料的准确性3)资料的完整性二、资料整理的方法1、行列选择与数据输入2、汇编、制表和绘图第二节市场调查资料的分析定性分析与定量分析动态分析与静态分析一、定性分析是与定量分析相对而言的,它是对不能量化的现象进行系统化理性认识的分析,其方法依据是科学的哲学观点、逻辑判断及推理,其结论是对事物的本质、趋势及规律的性质方面的认识。二、定量分析与预测定量分析是指从事物的数量特征方面入手,运用一定的数据处理技术进行数量分析,从而挖掘出数量中所包含的事物本身的特性及规律性,从而挖掘出数量中所包含的事物本身的特性的分析方法。分类:静态分析和动态分析(一)数据的静态分析:含义:分析现象当前的情况或者是本次调查的情况。主要方法有:1、数据的统计描述:(1)数据的相对程度分析:频数(百分数),倍数,(2)数据的集中趋势:均值和均标准误差,中位数,众数,(3)数据的离散程度:方差与标准差,2、均值比较和T检验3、方差分析、相关分析、回归分析、因子分析、聚类分析等相对程度分析它通过对比的方法反映现象之间的联系程度,表明现象的发展过程。几分之几:一比几:倍数:百分数:又叫频数(Frequency),是一个变量在各个变量值上取值的个案数。案例:对50名顾客有关“饮料品牌”选择的调查不同品牌饮料的频数分布饮料品牌频数比例百分比(%)可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计5011001999年全国国际旅游外汇收入构成国际旅游收入(亿美元)比重(%)总计长途交通游览住宿餐饮商品销售娱乐邮电通讯市内交通其他服务140.9941.657.4920.3415.2827.718.454.115.3310.63100.029.65.314.410.819.76.02.93.87.5资料来源:《中国旅游年鉴2000》频数数据的集中趋势分析均值(平均值,平均数Mean)表示某变量所有取值的集中趋势或平均水平。包括简单算术平均和加权算术平均。nxxfxfx算术平均值加权平均值案例:调查泰山游客的满意度,从六个方面入手(吃、住、行、游、购、娱),用5点量表来测量,其中,1=非常不满意,5=非常满意。某游客在吃、住、行、游、购、娱六方面打分分别为:5,4,4,4,2,1,计算该游客的满意度的算术平均值和加权平均值1.算术平均值:x=(5+4+4+4+2+1)÷6=3.672.加权平均值(1)确立各个指标的权数:假设:吃=0.15、住=0.15、行=0.1、游=0.3、购=0.1、娱=0.1(2)加权平均值:x=(5×0.15+4×0.15+4×0.1+4×0.3+2×0.1+1×0.1)=3.25众数(Mode)众数(Mode)是总体中出现次数最多单位的标志值无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242中位数(Median)中位数(Median)是把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数。【例】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位数=1080数据的离散程度分析方差(Variance):是所有变量值与平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。标准差(StandardDeviation):是方差的平方根,它表示了一组数据关于平均数的平均离散程度。均值标准差(StandardErrorofMean,S.E.mean):描述样本均值与总体均值之间平均差异的程度。方差与标准差越大,表示变量之间的差异越大,距离平均数这个“中心”的离散趋势越大。均值比较和T检验均值比较(CompareMeans):比较不同样本之间平均值是否存在显著性差异。T检验(T-Test):A单一样本的T检验(one-sampleTtest):研究研究某一样本均值与指定值之间是否存在显著性差异。B两独立样本T检验(Independent-samplesTtest):独立样本是指两个样本之间彼此独立没有任何关联,两独立样本各自接受相同的测量。两独立样本T检验的主要目的就是了解这两个样本之间是否存在显著性差异。C两配对样本T检验(Pared-SamplesTtest):是根据样本数据对样本来自的两配对总体的均值是否存在显著性差异进行推断。显著性差异的含义§显著性差异(SignificantDifference,sig.):就是先给定一个显著性水平数值,0.05(95%),或0.01(99%),或0.001(99.9%),进行均值比较时,零假设为:假设两者之间不存在显著差异。SPSS统计检验结果进行均值比较时会给出比较结果的相伴概率,如果相伴概率大于0.5,表示大于95%的概率表明两者之间确实不存在明显差异,则零假设成立;如果相伴概率小于0.5,表示小于95%的概率表明两者之间确实存在明显差异,零假设不成立,则表明两者之间确实存在明显差异。显著性差异一般用*表示。*表示significancelevel0.05(2-tailed或1-tailed),**表示significancelevel0.01,***表示significancelevel0.001。方差分析AnalysisofVariance(ANOVA)ANOVA由英国统计学家R.A.Fisher首创,为纪念Fisher,以F命名,故方差分析又称F检验(Ftest)。用于推断两个或多个总体均数有无差异。方差分析的假定条件(上述条件与两均数比较的t检验的应用条件相同.)。(1)各处理组样本来自随机,独立的正态总体(D法,W法,卡方检验);(2)各处理组样本的总体方差相等(不等会增加I型错误的概率,影响方差分析结果的判断)。方差分析分类:AnalysisofVariance(ANOVA)(1)单因素方差分析:即不同水平下各个总体的均值是否有显著的差异。SPSS实现过程:CompareMeans-----One-WayANOVA(2)多因素方差分析:当需要比较多个控制变量值之间有无明显差异时采用。SPSS实现过程:Analyze----GeneralLinearModel----Univariate相关分析(Correlationanalyze):运用相关系数(r,Correlationcoefficient)来表示两个变量间相互的线性关系的统计方法。如果变量Y与X间是函数关系,则r=1或r=-1;如果变量Y与X间是统计关系,则-1r1,如果x,y变化的方向一致,如身高与体重的关系,则称为正相关,r0,如果x,y变化的方向相反,如吸烟与肺功能的关系,则称为负相关,r0而r=0表示无线性相关,一般地,|r|0.95存在显著性相关;|r|0.8高度相关;0.5|r|0.8中度相关;0.3|r|0.5低度相关;|r|0.3关系极弱,认为不相关因子分析(FactorAnalyze)用较少的综合指标分别综合归纳存在于各变量中的各类信息。统计要求:(1)一般要求变量之间的相关系数大于0.3(2)巴特利特球形检验(BartlettTestofSphericity),要求通过统计检验。相伴概率要小于0.05,0.01,0.001(3)KMO(Kaiser-Meyer-Olkin)检验。Kaiser给出了KMO的标准,一般KMO0.9:非常适合0.8KMO0.9:适合0.7KMO0.8:一般0.6KMO0.7:不太适合KMO0.5:不适合因子分析(FactorAnalyze)在SPSS主菜单中按Analyze→DataReduction→Factor顺序逐一单击鼠标键,打开因子分析主对话框聚类分析(ClusterAnalyze)聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。在SPSS主菜单中按Analyze→DataReduction→Factor顺序逐一单击鼠标键,打开因子分析主对话框物以类聚、人以群分回归分析(regressionanalysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛。按照涉及的自变量的多少,可分为一元回归分析和多元回归分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析一元回归分析设预测目标因变量为Y,影响它变化的一个自变量为X,因变量随自变量的增(减)方向的变化。一元线性回归分析就是要依据一定数量的观察样本(Xi,Yi),i=1,2…,n,找出回归直线方程Y=a+bX+ε(1)(三)回归方程需要通过的显著性检验对于任何给定的一组因变量、自变量观察样本资料,用最小二乘法都可以计算出回量归方程参数,建立回归方程式。但是,这样建立的回归方程并非一定有实用意义。1.相关分析(对于一元线性回归方程来说,也就是回归系数的t检验),就是借用统计方法用计算自变量、因变量观察样本资料的相关系数,说明变量之间的线性相关密切程度,并通过r显著性检验指出这种线性相关密切程度的显著性水平。2.方差分析(ANOVAF,回归方程的F显著性检验)是分析自变量与因变量线性相关关系对因变量的变异的影响程度,并通过F显著性检验指出反映自变量与因变量线性相关关系的回归方程式的显著性水平。只有通过r显著性检验和F显著性检验,才能说明建立的回归线性方程有实际意义。3.回归系数的显著性检验(t检验):对于一元线性回归方程来说,回归系数的t检验就是相关系数的显著性检验。4.模型的拟合优度R2(Goodnessoffit)分析:模型的拟合优度表示所建立的回归方程预测值与实际观察到的值之间差异的大小,一般用判定系数R2实现,R2越接近1,表明方程的拟合度越好,所建立的方程与实际方程越接近。5.回归方程的残差检验。对于上述回归模型中的随机误差要求满足如下的假设条件:残差序列要求正态分布的随机性变量,且残差项之间互相独立:(1)应当是服从正态分布的随机变量,即满足正态性的假设.(2)残差的均值为零,即E(ε)=0,我们称满足无偏性的假设.(3)残差序列满足随机性:的方差等于=,这就是说,所有的分布的方差都相同,即满足共方差性的假设.(4)残差序列互相独立:各个残差间相互独立,即对于任何两个随机误差和其协方差等于零,即,Cov(,)=0,)这称之为满足独立性的假设.因此应该进行残差检验,判断回归模型的残差是否满足上述假设A残差序列的正态性分布:通过残差序列的带正态曲线的直方图或累计概率图来分析。直观观察图形来判断是否为正态分布。B残差序列的随机性:通过绘制残差序列和对应的预测值序列的散点图判断,如果残差序列是随机的,那么残差序列应与预测值序列无关,残差序列点将随机地分布在经过零的一条直线上。C残差序列的独立性分析:回归模型中假设Cov(,)=0,即随机项是独立的。这一假设是否成立,可以通过回归模型的误差序列是否相互独立来进行检验。若误差序列各项间相互独立,则序列各项之间没有相关关系。若序列各项之间有相关关系,误差序列不满足线性回归模型的基本假设,回归模型就不能表达变量Y与X之间的真实变动关系。D·W(Durbin-Watson)检验可以检验残差序列的相关性。其检验办法如下:如果D-W=0,表示残差序列存在完全自相关;如果D-W=4,表示残差序列存在完全负相关;如果0D-W2表示残差序列存在某种程度的正自相关;如果2D-W4,表示残差序列存在某种程度的负自相关;如果D-W=2表示残差序列不存自相
本文标题:市场调查资料的整理与分析(PPT47页)
链接地址:https://www.777doc.com/doc-1556013 .html