您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 统计学第34章知识点与习题(含答案)
第三章数据资料的统计描述:统计表和统计图第一节定性资料的统计描述知识点:1、统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。2、定性数据的频数、频率、百分数、累计频数、累积频率的概念及计算。3、定性数据频数分布表示方法主要有条形图、扇形图。第二节定量数据的统计描述知识点:1、定量数据频数分布表的编制:(1)整理原始资料;(2)确定变量数列的形式;(3)编制组距式变量数列。应注意的问题:确定组距,确定组限。考查的区间式分组数据按“上组限不在组内”的原则确定。2、定量数据的频数、频率、百分数、累积频数、累计频率的概念及计算。3、定量数据频数分布表示方法主要有直方图、折线图和曲线图三种。第三节探索性数据分析——茎叶图知识点:1、基本茎叶图的理解及编制第四节相关表与相关图知识点:1、相关表,反映定性变量与定量变量之间的相关关系。2、散点图,反映两个定量变量之间的相关关系。根据散点图判断两个变量的相关关系。第四章数据资料的统计描述:数值计算第一节集中趋势知识点:关于单值式分组和区间式分组数据的1、平均数的计算,包括算术平均数,几何平均数,调和平均数2、众数的计算3、中位数、四分位数的计算4、(补充知识点)平均数、众数、中位数三者之间的关系5、百分位数的计算6、截尾均值的计算第二节离散测度知识点:1、极差的计算2、关于单值式分组和区间式分组数据的四分位数差的计算3、关于单值式分组和区间式分组数据的方差、标准差的计算4、变异系数的计算5、(补充知识点)偏度、峰度的含义及计算第三节协方差与相关系数知识点:1、样本协方差的含义及计算2、相关系数的含义及计算第四节相对位置测度与奇异点知识点:1、数据的标准化处理2、奇异点的诊断:利用契比雪夫定理和经验规则第五节探索性分析——5点描述与箱线图知识点:1、5点描述法的理解2、箱线图的理解与运用第三章习题:一、填空题1、在对数据资料进行统计描述时,______反映了各个组中每一项目出现的次数,______反映了各个组中项目发生的比例。2、用直方图对定性数据作统计描述,一般横轴表示______,纵轴表示______。3、用扇形图对定性数据做统计描述,以______代表各个属性变量出现的频率。4、如果样本观察数有20个,按照斯特基的经验公式,可将数据分成______组。5、如果每个组的观察频数依次为4,8,5,2,1,则各组相应的观察频率为______。6、如果样本观察数有20个,各组的观察频率依次为0.20.05,0.35,0.15,0.25,则各组相应的观察频数为______。7、如果每个组的观察频数依次为4,8,5,2,1,则各组相应的累积频率为______。8、如果各组相应的累积频率依次为0.2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为______。9、散点图是以_______轴为自变量,_______轴为因变量的一个图。10、相关表可用于反映两个______,或两个______,或一个______和一个______之间的相关关系。二、单选题1、散点图可用于表述两个______之间的相关关系。()A、定性变量与定性变量B、定性变量与定量变量C、定量变量与定量变量D、定性变量与属性变量2、已知分组数据各组组限为:10~14,15~19,20~24,则组距为______。()A、4B、5C、6D、33、已知分组数据各组组限为:10~15,15~20,20~25,则组距为______。()A、4B、5C、6D、34、已知分组数据各组组限为:10~14,15~19,20~24,则第二组的组中值为______。()A、17B、16C、18D、17.55、已知分组数据各组组限为:10~15,15~20,20~25,则第二组的组中值为______。()A、17B、16C、18D、17.56、分组数据各组的频率之和为______,百分数之和为______。()A、1,1B、1,100C、100,100D、100,1三、判断题1、相关表和散点图均可表示定性变量之间或定量变量之间的相关关系。()2、对于各种形式的区间式分组数据,组距均为组上限减去组下限。()3、已知分组数据的各组组限为:10~15,15~20,20~25,则分组过程遵循“组上限不在组内”的原则。()4、给定分组数据,则累积频数或累积频率不一定是递增的。()5、若想同时显示两组或多组样本资料,可用扩展茎叶图。()6、散点图能揭示随机变量间确定的数学函数关系。()四、名词解释1、频数分布2、频率五、简答题1、简述编制定量数据频数分布的步骤。第三章习题答案:一、填空题1、频数频率2、属性变量频数(或频率、百分数)3、扇形面积大小4、5(或6)组5、0.2,0.4,0.25,0.1,0.056、4,1,7,3,57、0.2,0.6,0.85,0.95,18、20,5,35,15,259、横纵10、定性,定量,定性(或定量),定量(或定性)二、单选题1、C2、B3、B4、A5、D6、B三、判断题1、F2、F3、T4、T5、F6、F四、名词解释1、频数分布:在统计分组的基础上,将总体中所有单位按一定标志进行分组整理,形成总体中各单位数在各组间的分布,称为频数分布。2、频率:各组次数与总次数之比称为频率。五、简答题1、编制定量数据频数分布,需经过以下几个步骤:(1)确定分组组数;(2)确定组距(3)确定组限;(4)将观察资料按组别进行归类,记录各个组中数据资料总共发生的次数。商务经济统计学第四章复习思考题1、3、5、8、11、12第四章习题:一、填空题1、一个由100人组成的群体,无论它有51个女人(和49个男人)或者99个女人(和一个男人),其性别变量的众数都是________。2、中位数是位于数列________的那个标志值,众数则是观察值中出现次数________的某一标志值。3、四分位差排除了数列两端各单位标志值的影响。4、当一组数据属于左偏分布时,平均数、中位数与众数的大小关系为________。5、已知4个水果店苹果的单价和销售额,要求计算4店的平均单价,应用________平均数。二、单选题1、两个总体的平均数不相等,标准差相等,则()A.平均数大,代表性大B.平均数小,代表性大C.两个总体的平均数代表性相同D.无法判断2、两个总体的平均数相等,则()A.两个总体的平均数代表性相同B.标准差大的平均数代表性大C.离散系数大的平均数代表性大D.标准差小的平均数代表性大3、下列指标中,反映数据组中所有数值平均水平大小的指标有()A四分位差B平均数C标准差D极差4、加权算术平均数的大小()A.和各组次数分布多少无关B.仅受各组标志值大小的影响C.受各组标志值和次数共同影响D.不受各组标志值大小的影响5、()时,加权算术平均数等于简单算术平均数A.当各组次数相等B.当各组次数不等C.仅当各组次数都等于1D.当各组变量值不等6、四分位数实际上是一种A算术平均数B几何平均数C位置平均数D数值平均数7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用________A简单算术平均法B加权算术平均法C加权调和平均法D几何平均法8、某公司下属5个企业,已知每个企业某月产值计划完成百分比和实际产值,要求计算该公司平均计划完成程度,应采用加权调和平均数的方法计算,其权数是A计划产值B实际产值C工人数D企业数9、中位数和众数是一种A代表值B常见值C典型值D实际值10、离散趋势指标中,最容易受极端值影响的是A极差B平均差C标准差D四分位差三、判断题1、如果权数都相等,则加权算术平均数等于简单算术平均数。()2、在评价两组数列的平均数的代表性时,可采用变异系数。()3、若一组数据的偏度系数是-0.25,则数据的极端值在右边,数据分配曲线向右延伸。()4、当峰度系数β的数值越大于3,则次数分配曲线的顶端越尖峭。()5、极差反映所有变量值差异的大小,最大的缺点是受极端值的影响。()四、名词解释1、中位数2、极差3、离散系数4、偏度五、简答题1、反映总体集中趋势的指标有哪几种?2、反映总体离散趋势的指标有哪几种?3、反映次数分布曲线的分布特征指标有哪几种?六、计算题1、2006年某月份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下:品种价格(元/斤)甲市场成交额(万元)乙市场成交量(万斤)甲乙丙1.21.41.51.22.81.5211合计—5.54试问哪一个市场农产品的平均价格高?并说明原因。2、某厂生产某种机床配件,要经过三道生产工序,现生产一批该产品在各道生产工序上的合格率分别为95.74%、93.48%、97.23%。根据资料计算三道生产工序的平均合格率。3、某高校某系男生的体重资料如下:按体重分组(公斤)学生人数(人)52以下52~5555~5858~6161以上2839685324合计212试根据所给资料计算这212名男生体重的算术平均数、中位数、众数,四分位数,四分位差。4、已知某公司职工的月工资收入为965元的人数最多,其中位于全公司职工月工资收入中间位置的职工的月工资收入为932元,试根据资料计算出全公司职工的月平均工资。并指出该公司职工月工资收入变量数列属于何种偏态?5、对成年组和青少年组共500人身高资料分组,分组资料列表如下:成年组青少年组按身高分组(cm)人数(人)按身高分组(cm)人数(人)150~155155~160160~165165~170170以上2210895433270~7575~8080~8585~9090以上2683392824合计300合计200要求:(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数,偏度系数和峰度系数。(2)说明成年组和青少年组平均身高的代表性哪个大?为什么?6、工人日产量数据单位:日产量(件/人)A工艺产量A工艺人数B工艺产量B工艺人数3015410403072050151010合计根据离散系数分析哪种工艺的生产水平整齐?商务经济统计学第四章复习思考题答案1、(1)年平均初始工资为30757(美元)。(2)样本中位数为30550(美元)。(3)第一个四分位数为30125(美元)。(4)第三个四分位数为31650(美元)3、(1)样本的均值为39.25,样本的众数为29。(2)在家办公的人的年龄并不趋于年青化。(3)第一个四分位数为29.75,第三个四分位数为46.75.(4)第32个百分位数为31。5、(1)美国本土、加拿大和欧洲组,均值为115.13,中位数为111.56;亚洲和非洲组,均值为36.62,中位数为36.695.(2)美国本土、加拿大和欧洲组,极差为86.24,标准差为26.82,变异系数为0.233;亚洲和非洲组,极差为42.97,标准差为11.4,变异系数为0.3113.(3)从以上两组游客资料的比较中,可以看出第一组平均到达海滩的人数多于第二组,而且,第一组中各个地方到达海滩的人数的差别较第二组小。8、(1)-0.953(2)3.89711、(1)5点数依次为:608,1872,4019,8305,14138(2)上限为11521.5,下限为-7777.5.(3)有异常点为14138(4)12、(1)(2)从散点图上可以看出,GPA与SAT大致呈正相关的关系,GPA为学生的平均学分积,与成绩呈正相关的关系。(3)样本协方差为28.6.(4)样本相关系数为0.8713。相关系数的绝对值越大说明相关性越强,该值说明GPA与SAT有较强的相关性。第四章习题答案:一、填空题1、女2、中间位置,最多3、25%4、平均数中位数众数5、加权调和平均数二、单选题1、A2、D3、B4、C5、A6、C7、C8、B9、A10、A三、判断题1、T2、T3、F4、T5、F四、名词解释1、中位数:是一种按其在数列中的特殊位置而决定的平均数。2、极差:是指一个数列中两个极端值即最大值与最小值之间的差异。3、离散系数:是测定总体中各单位标志值变异的相对量指标,以消除不同总体之间
本文标题:统计学第34章知识点与习题(含答案)
链接地址:https://www.777doc.com/doc-2138668 .html