您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 统计分析方法——描述性统计
2019/12/191市场调研MarketingResearch主讲人:蔡清毅厦门理工学院文化传播系2007年5月2019/12/19厦门理工学院文化传播系蔡清毅2市场调研描述性统计——频数分布:列联表和假设检验2019/12/19厦门理工学院文化传播系蔡清毅31.数据的表现—统计数字和统计图表假如你已经获得了所要的全部数据;认识数据的第一步:你得到的是什么类型的数据?利用图和表来展示数据中的信息;运用指标刻画数据的某些特征和程度;使用EXCEL来完成对数据的描述。2019/12/19厦门理工学院文化传播系蔡清毅4数据变量的分类按照取值类型:品质数据和数量数据;按照测量水平:定类(Nominal)、定序(Ordinal)、定距(Interval)、定比(Ratio)等四类;按照获取时间:截面数据、时间序列;不同类型的数据应使用不同的统计方法;问题:刚才的数据表中分别是什么类型?2019/12/19厦门理工学院文化传播系蔡清毅5区分不同的测量水平区分原则:定类数据没有大小之分;定序数据有大小之分,差值有意义;定距数据有大小之分,差值有意义,但其比值无意义;定比数据比值有意义。定比定距数据可以向前化成定序或者定类数据,但是将损失一定信息;反之,不能将定序定类数据化成定距定比数据。2019/12/19厦门理工学院文化传播系蔡清毅6品质标志的描述方法(1)频数分布、相对分布、百分比频数分布是否锻炼人数(频数)相对频数百分比累计百分比非常喜欢40.220.00%20.00%喜欢60.330.00%50.00%一般50.2525.00%75.00%不太喜欢10.55.00%80.00%讨厌20.110.00%90.00%很讨厌20.110.00%100.00%求和201100.00%100%某校学生对体育锻炼的态度2019/12/19厦门理工学院文化传播系蔡清毅7品质标志描述方法(2)————条形图、柱形图某校学生对体育锻炼态度调查结果0.00%5.00%10.00%15.00%20.00%25.00%30.00%35.00%非常喜欢喜欢一般不太喜欢讨厌很讨厌2019/12/19厦门理工学院文化传播系蔡清毅8品质标志的描述方法(3)————饼图某校学生对体育锻炼态度调查结果20%30%25%5%10%10%非常喜欢喜欢一般不太喜欢讨厌很讨厌2019/12/19厦门理工学院文化传播系蔡清毅9对矿泉水市场的调查北京市居民矿泉水最喜欢品牌33%32%19%5%4%3%2%2%乐百氏农夫山泉娃哈哈可赛雀巢蓝涧获特满其它2019/12/19厦门理工学院文化传播系蔡清毅10数量标志的描述方法(1)频数分布1)单项式分布2)组距式分布:等组距、不等组距有关概念:组数、组限(上限、下限)、开口组、闭口组、组距、组中值2019/12/19厦门理工学院文化传播系蔡清毅11如何按品质标志分类如何按标志标志分类假设某年某月某工地100名工人所得工资资料如下:(单位:元)450520540580650720580780650620………………………………………………………………………………………………………………………………………………………首先:编制一个序列其次:编制变量数列数量标志的描述方法(1)案例:2019/12/19厦门理工学院文化传播系蔡清毅12(1)单项变量数列表1某年某工地100名工人的月工资情况按工资水平分组(元)工人数(人)420450480……880423……4合计100数量标志的描述方法(1)2019/12/19厦门理工学院文化传播系蔡清毅13(2)等组距变量数列表2某年某工地100名工人的月工资情况按工资水平分组(元)工人数(人)400—50010500—60035600—70020700—80020800—90015合计100数量标志的描述方法(1)2019/12/19厦门理工学院文化传播系蔡清毅14表3某年某工地100名工人的月工资情况按工资水平分组(元)工人数(人)500以下10500—60035600—70020700—80020800以上15合计100数量标志的描述方法(1)2019/12/19厦门理工学院文化传播系蔡清毅15注意几个问题:第一工资水平是连续变量要用重叠组限第二组限的确定,即分组界限的确定第三组距大小的确定第四组数的确定,组数=全距组距数量标志的描述方法(1)2019/12/19厦门理工学院文化传播系蔡清毅16(3)不等组距变量数列如在生命统计中,人口死亡率将人口按年龄分组1岁以下1—1.9岁2—2.9岁3—3.9岁4—4.9岁组距为15—9.9岁10—14.9岁15—19.9岁组距为520—29.9岁30—39.9岁40—49.9岁50—59.9岁组距为1060—64.9岁……组距为5数量标志的描述方法(1)2019/12/19厦门理工学院文化传播系蔡清毅17数量标志的描述方法(2)身高频数百分比累计百分比156315.00%15.00%156~162210.00%25.00%162~168315.00%40.00%168~174525.00%65.00%174~180525.00%90.00%=180210.00%100.00%累计20100.00%某校20名学生的身高分布表2019/12/19厦门理工学院文化传播系蔡清毅18数量标志的描述方法(3)————直方图X185.0180.0175.0170.0165.0160.0155.0150.0HistogramFittingDensityCurvesNormalCurve(Mu=168.0Sigma=9.94)65432102019/12/19厦门理工学院文化传播系蔡清毅19数量标志的描述方法(4)对数据进行探索性分析:J.W.Tukey;茎叶图(Stem-leaf)茎叶次数153,4,4315611601165,7,7,8,85170,2,3,44175,5,9,94180,12体重2019/12/19厦门理工学院文化传播系蔡清毅20描述两个变量的关系研究两个变量之间的关系:两个变量的类型分别是什么?两个品质变量之间的关系;一个品质变量和一个数量变量的关系;两个数量变量之间的关系。2019/12/19厦门理工学院文化传播系蔡清毅21交叉分组列表(列联表)表1学生性别对体育锻炼的态度调查结果比较非常喜欢喜欢一般讨厌很讨厌合计男80683651190女356250103160合计115130861543502019/12/19厦门理工学院文化传播系蔡清毅2245岁以下45岁或以上45岁以下45岁或以上是60%40%35%65%否40%60%65%35%调查对象人数300300200200是否希望出国旅行男性女性表2年龄和性别对出国旅行的愿望的影响交叉分组列表(列联表)2019/12/19厦门理工学院文化传播系蔡清毅23图形展示两个变量的关系0.00000.05000.10000.15000.20000.2500非常喜欢喜欢一般讨厌很讨厌某校男女生对体育锻炼的态度男女2019/12/19厦门理工学院文化传播系蔡清毅24描述两个数量型的变量————散点图学生身高和体重的散点图405060708090150160170180190学生身高(厘米)学生体重(千克)通过这个图,你觉得身高和体重是什么关系?2019/12/19厦门理工学院文化传播系蔡清毅25数据描述的数值方法通过数据指标来概括数据中的信息;如何刻画数据的集中程度,或集中位置;如何刻画数据的变异程度;如何刻画检验异常值;如何刻画两个变量之间的关系;探索性分析。2019/12/19厦门理工学院文化传播系蔡清毅26数据集中位置的度量平均数(Mean)中位数(Median)众数(Mode)四分位数(Quartiles)百分位数(Percentiles)调整(或截尾)平均数(TrimmedMean)2019/12/19厦门理工学院文化传播系蔡清毅27一个例子某城市一居室月租金(美元)的70个数据4254304304354354354354354404404404404404454454454454454504504504504504504504604604604654654654704704724754754754804804804804854904904905005005005005105105155255255255355495505705705755755805906006006006006156152019/12/19厦门理工学院文化传播系蔡清毅28平均月租金美元80.49070356,34nxxi2019/12/19厦门理工学院文化传播系蔡清毅29月租金的中位数中位数=(475+475)/2=475美元4254304304354354354354354404404404404404454454454454454504504504504504504504604604604654654654704704724754754754804804804804854904904905005005005005105105155255255255355495505705705755755805906006006006006156152019/12/19厦门理工学院文化传播系蔡清毅30月租金的众数众数是450,450出现的最多,频数是74254304304354354354354354404404404404404454454454454454504504504504504504504604604604654654654704704724754754754804804804804854904904905005005005005105105155255255255355495505705705755755805906006006006006156152019/12/19厦门理工学院文化传播系蔡清毅31理解百分数P百分数是这样一个数,它使得至多有p%的数据项小于这个数,而且至多有(100-p)%的数据的数据大于这个数。中位数和上下四分位数都是特殊的百分位数。P%(100-p)%P百分位数2019/12/19厦门理工学院文化传播系蔡清毅32计算第P百分位数的步骤①以递增顺序排列原始数据(由小到大);②计算I=(p/100)n;③如果I不是整数,将I向上取整。大于I的毗邻整数指示第p百分位数的位置;如果I是整数,则第p百分位数是第I项与第I+1项的平均值。2019/12/19厦门理工学院文化传播系蔡清毅33月租金的第90百分位数计算I=(90/100)70=63。所以第90百分位数是第63和64个数的平均值。4254304304354354354354354404404404404404454454454454454504504504504504504504604604604654654654704704724754754754804804804804854904904905005005005005105105155255255255355495505705705755755805906006006006006156152019/12/19厦门理工学院文化传播系蔡清毅34四分位数第一个四分位数=第25百分位数第三个四分位数=第75百分位数4254304304354354354354354404404404404404454454454454454504504504504504504504604604604654654654704704724754754754804804804804854904904905005005005005105105155255255255355495505705705755755805906006006006006156151Q3Q2019/12/19厦门理工学院文化传播系蔡清毅35截尾均值去除%的最大和
本文标题:统计分析方法——描述性统计
链接地址:https://www.777doc.com/doc-2138294 .html