您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 市场调研9-2调研数据深入分析
第九章调研数据深入分析基本数据分析与SPSS软件本章内容(1)频数分布(2)假设检验(3)交叉表本章重点利用频数分布进行初步数据分析的方法交叉表数据分析方法针对交叉表的假设检验方法SPSS软件在基本数据分析中的应用2341第一节频数分布一、频数分布的概念记数某变量所有取值的个数,以百分数的形式表示一个变量的频数分布是关于这个变量的频数统计表,包括与变量相关的频数百分比及累计百分比。频数分布有助于发现那些不相关或不合理项。频率(频数占综频数百分比)在对数据进行解释和判断方面更为直观。二、频数分布中常用的统计量(1)位置度量:平均数、众数、中位数从不同角度描述了变量取值的中心趋势,对定类变量选择众数,对定序变量选择中位数,对定距和定比变量选择平均值。(2)差异度量:极差、四分位极差、方差、标准差差异度量用于定距变量或定比变量的变化性度量。1、位置度量•平均数:最常用的中心趋势度量指标,平均数是一个平稳值,少量增加或删减样本,数值不会有明显的改变。1,2,3,4,5,6,7,8,9均值=5nxx∑=•众数:样本众数是样本对应变量取值中出现次数最多的值,又叫峰值。122345253267众数:2•中位数:当样本对变量的取值按递增或递减排序时,若取值是基数,则中间位置的数值为中位数;若取值是偶数,中间位置两个数值的平均数为中位数。123456789中位数:512345678910中位数:5.52、差异度量(1)极差:变量取值中最大值和最小值的差,极差受极端值的影响。1234567极差7-1=6(2)四分卫极差:变量取值按照由大至小排列时,去掉前1/4和后1/4的取值,所剩下50%变量取值的极差。12345678极差6-3=3(3)方差:样本方差是样本观察值与平均值之差的平方和的均值,描述样本取值与平均值的离散程度,摆动较小,方差较小,摆动较大,方差较大。212)(1XXnSniix(4)标准差:意义同于方差,比方差更常用。niixXXS121-n)(21xxSnnS三、频数分布的SPSS应用p.169第二节假设检验一、假设检验过程1.假设检验的基本步骤提出原假设H0和被择假设H1针对调研问题做出结论做出统计判断,即拒绝或接受原假设选择统计方法和对应的统计量,并针对选定的显著性水水平α,计算统计量,确定拒绝域(1)提出原假设H0和备选假设H1•原假设是有关变量等价、相同或没有差异的判断性描述;被择假设是原假设的对立假设。•市场调研中,如果原假设被拒绝,则认为与备择假设一致的期望结论有统计意义。•假设检验分为单侧和双侧检验,当备择建设的数学表达式是单向严格不等式时,选择单侧检验;当备择假设的数学表达式是等式形式时为双侧检验例:某新产品的潜在市场需求预计超过原估测规模的20%,该需求量是企业决定是否进行新产品扩散的重要指标。如何进行假设检验?提出原假设H0:μ=2.0,潜在市场需求等于估计规模的20%。H1:μ2.0,潜在市场需求超过估计规模的20%。•如果原假设被拒绝,则接受被择假设,即可以实施新产品扩散;在H0不被拒绝,在没有特殊情况的前提下,暂不做出行动。(2)选择统计方法和对应的统计量,并针对选定的显著性水平α,计算统计量值,确定拒绝域•选定显著性水平α是指由于样本结论导致错误的拒绝了原本正确的原假设的概率。对显著性水平α的选取受调研预算的限制,一般α=0.01或0.05•某种统计方法下对应的样本统计量的分布决定拒绝域,而选择什么样的样本统计量与已知条件和代估参数有关正态分布:Z检验t分布:t统计量检验F分布:F-检验(3)在显著性水平α下,从统计学角度判定是否拒绝原假设。将样本数值带入到拒绝域,检验是否满足拒绝域,并依据数理统计学理论判定是否拒绝原假设。(4)做出市场调研结论,即由假设检验得出的结论转换为市场调研课题结论的表达。假设检验的结论:接受或拒绝原假设,拒绝或接受备择假设市场调研结论:是否该实施某方案二、参数检验与统计量的分布1、z检验z检验分为单变量的z检验和双变量的z检验,是关于总体均值的假设检验。(1)单变量情形。变量X服从均值为μ0、方差为σ2的正态分布,均值和方差已知。H0:μ=μ0,H1:μ≠μ0检验的样本统计量为服从正态分布,在显著性水平α下,H0的拒绝域为|z|zα/2。zα/2为查正态分布概率表得到的临界值Xzn(2)双变量情况变量X1服从均值为μ1,方差为σ12的正态分布;变量X2服从均值为μ2,方差为σ22的正态分布,且均值和方差已知。H0:μ1=μ2,H1:μ1≠μ20检验统计量为:它服从正态分布,n1和n2为两个独立样本的样本容量,在显著性水平α下,H0的拒绝域为|z|zα/2。22212121nnxxz2、t检验t检验分为单变量t检验和双变量t检验(1)单变量t检验变量X服从均值为μ0、方差为σ2的正态分布,总体方差未知。H0:μ=μ0,H1:μ≠μ0检验的样本统计量为它服从自由度为n-1的t分布,在显著性水平α下,H0的拒绝域为|t|tα/2(n-1)。tα/2(n-1)为查t分布概率表得到的临界值。n01xSXt(2)双变量情景两个总体方差未知但相等,σ12=σ22,H0:μ1=μ2,H1:μ1≠μ20检验统计量为:它服从正态分布,n1和n2为两个独立样本的样本容量,在显著性水平α下,H0的拒绝域为|t|tα/2(n1+n2-1)。221)1()1(22221211nnSnSnXXt例:某企业研究促销活动对销售效果的影响,原预计实施促销后,产品的月销售额可增至2万元,促销活动后,研究人员对销售额进行了调查,发现促销后的月销售额只有1.7万元,标准差为0.25万元,能否由此推断促销没有达到预期的效果?H0:μ=2,H1:μ2要求α=0.05,n=16,Sx=0.25,采用t检验计算检验统计量采用单侧检验,查t分布表得tα(n-1)=t0.05(20-1)=1.756|t|t0.05(20-1),否定H0,接受H1,认为促销未达到预期效果8.41625.027.101nSxtx3、F检验F检验是在方差未知的条件下,关于两个总体方差相等的假设检验。F服从自由度为(v1,v2)的F分布。n1、n2分别为两个样本的样本容量,S1、S2分别为样本标准差,临界值取决于自由度。在显著性水平α下,H0的拒绝域为FFα/2(n1-1,n2-1),F<F1-α/2(n1-1,n2-1),Fα/2(n1-1,n2-1)和F1-α/2(n1-1,n2-1)为查t分布概率表得到的临界值。222201211221112222::()()1,1HHSFnnS双侧较大,==(较小)参数检验总结:(1)关于均值的检验,不论单、双总体,当方差已知时,用z检验,否则用t检验,大样本情景,都可以用z检验(2)关于方差的检验,双总体方差相等假设需用F检验。三、非参数检验与统计量的分布(1)非参数检验适用于定序变量和定类变量的假设检验。常用的方法是卡方检验(2)卡方检验主要用于对独立样本本身和不同独立样本之间不同因素的差别检验(3)单变量情形的卡方检验主要用于对频数表中各类对某变量特征的差异性分析•H0:不存在由于变量X而导致的类别差异H1:存在由于变量X而导致的类别差异•卡方统计量的数学表达式为ⅹ2=∑(Oi-Ei)2/Ei其中,Oi为单元i的观察(实际)频数,Ei为单元i的理论期望频数,统计量服从卡方分布,期望频数和观察频数之间的差值越大,卡方统计值越大。在给定显著性水平α下,拒绝域为ⅹ2ⅹα2(n-1)ⅹα2(n-1)查卡方分布表中获得临界值例:9-2(p177)奶酪口味偏好程度,调查了210人,要求对三种奶酪口味偏好程度进行调查,选出最喜欢的一种,结果如下根据以上数据统计判断三种口味的奶酪偏好程度是否有显著差异。口味原味火腿草本选择人数904575•采用卡方检验•提出原假设H0:三种口味偏好基本相同提出被择假设H1:三种口味偏好度有显著差异•在H0下,Ei=(90+45+75)/3=70,i=1,2,3.统计量x2=∑(oi-ei)2/Ei=(90-70)2/70+(45-70)2/70+(75-70)2/70=15•服从自由度为3-1=2的卡方分布,在显著性水平0.05下,查表知,x2,拒绝H0,接受H1•三种口味的消费者偏好度有显著差异,火腿口味选的最少,口味偏好度低99.5)1(2nxa)1(2nxa第三节交叉表一、交叉表的概念交叉表是一种以表格的形式同时描述两个或多个变量以及结果的统计方法,反映了这些只有有限分类或取值的变量的联合分布。•频数分布一次描述一个变量,交叉表可以同时描述两个或两个以上的变量。•交叉表方法的起点是单变量数据,之后依研究目的将这些数据分成多个细目。•例:频数P.178•交叉表描述的是变量的关系,但不一定是因果关系•交叉表的优点与局限优点:(1)分析结果很容易直观的被管理人员理解(2)明了的解释加强了调研结果与管理行为的联系(3)有助于理解复杂问题(4)可将复杂的数据简单化缺点:(1)需要考虑多个变量,样本容量就应当相当大(2)很难确保对所有的相关变量进行了分析,不一定能找到真正的关系二、与交叉表有关的统计量卡方统计量用来验证交叉表中变量间的关联程度以及这种关联程度的统计显著性。原假设H0:两个变量特征相互无影响备择假设H1:两个变量特征相互影响•卡方统计量的数学表达式Oij为单元(i,j)的观察频数Eij为单元(i,j)的期望频数,其计算公式为Eij=ninj/nni为交叉表某行总频数,nj为交叉表某列总频数,n为样本容量卡方统计服从卡方分布x2[(r-1)(s-1)],r为第一个变量下的类别数,s为第二个变量下的类别数在给定显著水平α和已知自由度的情况下,当卡方统计量的计算值大于卡方分布的临界值,拒绝原假设,接受备择假设,变量间有关联。jiijijijEEOx,22/)(•例:9-4因特网使用率与上网者的性别有关吗?p180第一步:计算期望频数Eij=ninj/n计算卡方值X2=3.333第二步:确定自由度,在给定的显著水平α下,得到用于检验的临界值自由度:df=(r-1)(s-1),X20.05=3.841第三步:做出结论,3.3333.841,接受原假设,网络使用率与性别无关jiijijijEEOx,22/)(三、假设检验和交叉表的SPSS应用1、SPSS操作流程P.1812、解读表格本章小结•频数分布•位置度量(平均数、众数、中位数)•差异度量(极差、四分位极差、样本方差、标准差)•参数检验、非参数检验•交叉表
本文标题:市场调研9-2调研数据深入分析
链接地址:https://www.777doc.com/doc-1556014 .html