您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 其它文档 > 《应用统计分析》作业集答案
《应用统计分析》-1-部分答案提示第一章导论一、简答题1、数量性、大量性;差异性、具体性;2、统计数据信息处理的方法包括两个方面,即描述统计方法和推断统计方法。描述统计是主要对已收集到的统计数据信息进行加工、分组、编制统计表、绘制统计图及计算相对数、平均数、方差等,以反映事物的数量特征和数量关系的统计方法。描述统计只限于手头现有的数据,不准备把结果用来推断总体。推断统计以样本为基础,主要内容是研究如何应用概率理论,以样本来推断总体。3、选择与定义问题执行研究的程序数据分析结果的探究和结论一、名词解释1、请区别以下概念:(1)参数与统计量(参数:用于说明全级总体的指标;统计量:根据样本资料汇总计算的指标,即样本指标。)(2)指标和标志(指标和标志是相对而言的,指标是对总体而言,标志是对总体单位而言的。)(3)离散型变量和连续型变量(离散型变量指只能取整数的变量,连续型变量是指在整数之间可插入小数的变量。)第二章数据搜集与整理二、简答题《应用统计分析》-2-1、统计调查分为专门调查和统计报表制度两种类型,其中专门调查分为普查、抽样调查、重点调查、典型调查四种类型。2、重点调查是在总体中选择部分重点单位进行的调查,借以了解总体的基本情况。所谓重点单位,是指在总体中具有举足轻重地位的单位。这些单位虽然少,但它们调查的标志值在总体标志总量中占有绝大比重,通过对这些单位的调查,就能掌握总体的基本情况。典型调查是根据调查的目的和要求,在对调查对象进行全面分析的基础上,有意识的选择部分有代表性的单位进行的调查,是一种非全面调查。重点调查与典型调查都是非全面调查,它们都存在一个共同的问题,即部分单位的选择问题。重点调查部分单位的选择应把握这些单位在总体中所占的比重要较大,而典型调查部分单位的选择应放在这些单位要具有足够的代表性。3、影响问卷效果的因素主要有三个方面:(1)被调查者的主观倾向;(2)测量工具即问卷本身的问题;(3)问卷环境。4、(1)频数和频率1.频数:落在各类别中的数据个数频率:某一类别数据占全部数据的比值(2)组数和组距分组:按某个标志将资料进行分类,划分成各个等级。组距:最大值与最小值之差(1)等距分组和异距分组等距分组——各组频数的分布不受组距大小的影响;可直接根据绝对频数来观察频数分布的特征和规律;不等距分组——各组频数的分布受组距大小不同的影响;各组绝对频数的多少不能反映频数分布的实际状况;需要用频数密度(频数密度=频数/组距)反映频数分布的实际状况5、及时性和共享性、便捷性和低费用、交互性和充分性、可靠性和客观性、无时空地域限制6、(1)按随机原则从总体中抽取样本;《应用统计分析》-3-(2)以样本指标为依据推断总体参数或对总体的某种特征值作假设;(3)抽样调查的误差可以事先计算并加以控制7、有登记性误差和代表性误差两类–登记性误差:由于调查者或被调查者的人为因素所造成的误差。理论上讲可以消除–代表性误差:用样本数据进行推断时所产生的误差。通常无法消除,但事先可以进行控制和计算8、1.要合理安排统计表的结构2.总标题内容应满足3W要求3.数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明4.表中的上下两条横线一般用粗线,其他线用细线5.通常情况下,统计表的左右两边不封口6.表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一7.对于没有数字的表格单元,一般用“—”表示8.必要时可在表的下方加上注释三、计算题1、(1)最大值:108;最小值:50;全距:108-50=58(2)、(3)产品数量频数向下累计向上累计数量(个)比率(%)数量(个)比率(%)数量(个)比率(%)《应用统计分析》-4-50—5936365010060—6948714479470—7918362550438680—8918364386255090—995104896714100—109245010024合计50100————(4)略(1)2、组区间区间中心频数频率累积频数累积频率59.5∼64.564.5∼69.569.5∼74.574.5∼79.579.5∼84.584.5∼89.589.5∼94.562677277828792148116730.0250.1000.2000.2750.1500.1750.0751513243037400.0250.1250.3250.6000.7500.9251.0003、组数=6组距=4频数分布表如下:按销售额分组(万元)频数(天)频率(%)25—30410.030—35615.035—401537.540—45922.545—50615.0《应用统计分析》-5-合计40100.04、(1)40个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率(%)向上累计向下累计企业数频率企业数频率100以下512.5512.540100.0100—110922.51435.03587.5110—1201230.02665.02665.0120—130717.53382.51435.0130—140410.03792.5717.5140以上37.540100.037.5合计40100.0————(2)某管理局下属40个企业分组表按销售收入分组(万元)企业数(个)频率(%)先进企业1127.5良好企业1127.5一般企业922.5落后企业922.5合计40100.0第三章数据的汇总一、简答题1、集中趋势,计量方法:算术平均数、众数、中位数、几何平均数等2、离中趋势,计量方法:全距、平均差、方差和标准差3、算术平均数的使用前提:个体标志值之和等于总体的标志总量《应用统计分析》-6-众数的使用前提:作为代表的标志值的次数要相对集中中位数:不受极端值的影响4、1.各变量值与均值的离差之和等于零2.各变量值与均值的离差平方和最小3.两独立同质变量代数和的算术平均数等于各变量算术平均数的代数和。4.两独立同质变量乘积的算术平均数等于各变量算术平均数的乘积。5、中位数、众数和算术平均数都反映被研究现象数量分布的集中趋势。当次数分布完全对称时,算术平均数、中位数和众数是一致的,它们相等;当次数分布向右或向左倾斜,那么算术平均数和中位数也分别向左或向右靠近。次数分布向左倾斜,其算术平均数最小,小于中位数,更小于众数,众数最大;次数分布向右倾斜,算术平均数最大,大于中位数,更大于众数,众数最小。6、一组数据中可以自由取值的数据的个数1.当样本数据的个数为n时,若样本均值x确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值7、如果样本数据的均值为x,标准差为s的土堆状分布,则落入)3(),2(),(sxsxsx三个区间内的观测值数与观测值总数的比率如下:•)(sx:通常在60%与80%之间,对于对称分布接近70%•)2(sx:对于对称分布接近95%•)3(sx:接近100%二、计算题1、838元2、6.3台3、均值:274.1万元,中位数:272.5万元,标准差:20.82万元《应用统计分析》-7-4、甲企业平均成本=19.41元,乙企业平均成本=18.29元,原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。5、均值:23.2中位数:24众数:没有众数或众数为:19,25,26全距=最大值—最小值=28–19=9平均差:2.8方差:7.97标准差:2.826、均值:74.4件;标准差:9.71件7、中位数。因为该收入分布为右偏,且频数较多的几个组的家庭百分比相差不大,众数不十分明显。8、(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围可能越大。9、算术平均数:8.6万台众数:8.08万台《应用统计分析》-8-中位数:8.3万台10、(1)均值:77.5分;标准差:6.5分(2)均值:77分;标准差:6.48分(3)均值:78分;标准差:6.48分(4)男女生各占一半时,全班平均考试成绩为(70+80)/2=77.5分;由于男生的平均成绩低于女生,当男生人数多于女生时,会拉低全班的平均成绩;当女生人数多于男生时,会拉高全班的平均成绩。(5)标准差相同。因为男生和女生的标准差相同,都为6分,且女生成绩的离散程度较大,使全班的标准差大于6分,但改变男女的比例并不改变标准差的大小。(6)57人11、中位数:394.08元;均值:393.1元;标准差:172.55元12、均值:A班74.7,B班77.4方差:A班68.866,B班78.28标准差:A班8.8,B班9.2913、2.613.976.3214、(2)算术平均数:76.75分;中位数:76.67分;众数:76.31分,呈右偏态分布;(3)考试成绩的标准差:9.457分;(4)另一班;(5)及格率:95%;标准差:21.79%15、均值:8.4件标准差:1.56件《应用统计分析》-9-第四章抽样基础一、简答题1、概率:又称几率,用以衡量某一特定事项将会发生的可能性有多大。常用方法:•古典法:当我们以“可能出现的机会完全相等”作为概率衡量的假设基础,同时试验的样本空间只包含有限个元素,此种衡量概率大小的方法称为古典法•相对次数法:在相同条件下进行n次随机试验,事件A出现m次,则比值m/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,取向于稳定,这个频率的稳定值即为事件A的概率•主观法:概率是一个决策者对某事件是否发生,根据个人掌握的信息对该事件发生可能性的判断2、定义:将离散型随机变量的全部可能取值及其相应的概率描述出来离散型随机变量的概率分布(0—1分布):一个离散型随机变量X只取两个可能的值均匀分布:一个离散型随机变量取各个值的概率相同3、连续型随机变量不是定义再某一特定值的概率上,而是以其变量值发生在某一区间的概率来代替的;连续型随机变量发生在某以特定值上的概率为04、连续型随机变量可以取某一区间或整个实数轴上的任意一个值1.它取任何一个特定的值的概率都等于02.不能列出每一个值及其相应的概率3.通常研究它取某一区间值的概率4.用数学函数的形式和分布函数的形式来描述5、(1)二项试验进行n次重复试验,出现“成功”的次数的概率分布称为二项分布《应用统计分析》-10-1.二项分布与贝努里试验有关2.贝努里试验具有如下属性–试验包含了n个相同的试验–每次试验只有两个可能的结果,即“成功”和“失败”–出现“成功”的概率p对每次试验结果是相同的;“失败”的概率q也相同,且p+q=1–试验是相互独立的–试验“成功”或“失败”可以计数3.举例略(2)泊松分布1.用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布2.若某个离散型随机变量能够满足两个假设,即(1)在任何两个相等长度的区间内,事件发生的概率相等;(2)任何时间内,事件的发生与否与其他任何区间内的事件是否发生无关,则称为泊松分布3.举例略(3)正态分布1.描述连续型随机变量的最重要的分布2.可用于近似离散型随机变量的分布–例如:二项分布3.经典统计推断的基础4.举例略6、大数定律:略作用:大数定律反映了在大量的事物观察中,个别的、偶然的差异相互抵消,显示出事物的共同的、必然的规律性。这说明同质的大量现象有其规律性。随着观察次数达到一定程度,这种规律性就会表现出来,且观察次数越多,表现就越明显。《应用统计分析》-11-中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布作用:中心极限定理规定当样本容量足够大时,其总体分布即可近似为正态分布。7、简单随机抽样、分层抽样、等距抽样、整群抽样、多阶段抽样8、简单随机抽样:从总体的所有单位中按照随机原则抽取样本单位的方式。对于总体
本文标题:《应用统计分析》作业集答案
链接地址:https://www.777doc.com/doc-2835986 .html