您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 统计学第四版答案(贾俊平)
请举出统计应用的几个例子:1、用统计识别作者:对于存在争议的论文,通过统计量推出作者2、用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的3、挑战者航天飞机失事预测请举出应用统计的几个领域:1、在企业发展战略中的应用2、在产品质量管理中的应用3、在市场研究中的应用④在财务分析中的应用⑤在经济预测中的应用你怎么理解统计的研究内容:1、统计学研究的基本内容包括统计对象、统计方法和统计规律。2、统计对象就是统计研究的课题,称谓统计总体。3、统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等。④统计规律就是通过大量观察和综合分析所揭示的用数量指标反映的客观现象的本质特征和发展规律。举例说明分类变量、顺序变量和数值变量:分类变量:表现为不同类别的变量称为分类变量,如“性别”表现为“男”或“女”,“企业所属的行业”表现为“制造业”、“零售业”、“旅游业”等,“学生所在的学院”可能是“商学院”、“法学院”等顺序变量:如果类别有一定的顺序,这样的分类变量称为顺序变量,如考试成绩按等级分为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。这里的“考试成绩等级”、“态度”等就是顺序变量。数值变量:可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额”、“生活费支出”、“掷一枚骰子出现的点数”。定性数据和定量数据的图示方法各有哪些:1、定性数据的图示:条形图、帕累托图、饼图、环形图2、定量数据的图示:a、分组数据看分布:直方图b、未分组数据看分布:茎叶图、箱线图、垂线图、误差图c、两个变量间的关系:散点图d、比较多个样本的相似性:雷达图和轮廓图直方图与条形图有何区别:1、条形图中的每一个矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距。2、由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。3、条形图主要用于展示定性数据,而直方图则主要用于展示定量数据。一组数据的分布特征可以从哪几个方面进行描述:1、数据的水平,反映数据的集中程度2、数据的差异,反映各数据的离散程度3、分布的形状,反映数据分布的偏态和峰态说明平均数、中位数和众数的特点及应用场合:平均数也称为均值,它是一组数据相加后除以数据的个数而得到的结果。平均数是度量数据水平的常用统计量,在参数估计以及假设检验中经常用到。中位数是一组在数据排序后处于中间位置上的数值,用Me表示。中位数是用中间位置上的值代表数据水平,其特点是不受极端值影响,在研究收入分配中很有用。众数与数据出现的次数有关,着眼于对各数据出现的频率的考察,其大小只与这组数据中的部分数据有关,其特点是不受极端值的影响,具有不惟一性,一组数据中可能会有一个人众数,也可能会有多个或没有。为什么要计算离散系数:极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,为消除变量值水平高低和数量单位不同对离散程度的测度值的影响,需要计算离散系数。举例说明离散型随机变量和连续性随机变量:离散型随机变量:设X是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X为一个离散型随机变量。包括二项分布、泊松分布、超几何分布,如一定时间内某航空公司接到的订票电话数连续型概率分布:包括正态分布、均匀分布和指数分布。叙述正态分布曲线的特点:正态曲线的图形是关于x=u对称的钟形曲线,且峰值在x=u处。正态分布的两个参数u和σ一旦确定,正态分布的具体形式也惟一确定,不同参数取值的正态分布构成一个完整的“正态分布族”。当X的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会与之相交。④正态随机变量在特定区间上取值的概率由正态曲线下的面积给出,而且其曲线下的总面积等于1解释中心极限定理的含义:随着样本量n的增大(通常要求n=30),不论原来的总体是否服从正态分布,样本均值的概率分布都将趋于正态分布,其分布的期望值为总体均值u,方差为总体方差的1/n。这一定理可表述为:从均值为u、方差为σ^2的总体中,抽取样本量为n的随机样本,当n充分大时(通常要求n=30),样本均值的分布近似服从均值为u,方差为σ^2/n的正态分布。说明区间估计的基本原理:区间估计,是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出的一个概率度量。简述评价估计量的标准:无偏性:它是指估计量抽样分布的期望值等于被估计的总体参数;有效性:它是指估计量的方差尽可能小;一致性:它是指随着样本量的增大,点估计量的值越来越接近被估计总体的参数解释置信水平的含义:置信水平,是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。简述样本量与置信水平、总体方差、估计误差的关系样本量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本量也就越大;样本量与总体方差成正比,总体的差异越大,所要求的样本量也越大;样本量与估计误差的平方成正比,即允许的估计误差的平方越大,所要求的样本量就越大。解释原假设和备择假设:原假设:它通常是研究者想收集证据予以推翻的假设,用H0表示,原假设所表达的含义总是指参数没有变化或变量之间没有关系,等号“=”总放在原假设上。备择假设:通常指研究者想收集证据予以支持的假设,用H1或Ha表示。备择假设所表达的含义是总体参数发生了变化或变量之间有某种关系。备择假设的形式总是为H1:u≠u0,H1:uu0或uu0第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系:第Ⅰ类错误(弃真错误):原假设为真时拒绝原假设时所犯的错误第Ⅱ类错误(取伪错误):原假设为假时未拒绝原假设当样本容量n确定后,当α变小时,则检验的拒绝域变小,相应的接受域会变大,因此β值也就随之变大;相反,若β变小,则α又会变大.样本量的大小与显著性有怎样的关系:显著性水平与样本的大小密切相关,相关量越大,检验统计量的值也就越大,显著性水平越小,就越有可能拒绝原假设。相关分析主要解决哪些问题:变量之间是否存在关系如果存在关系,它们之间是什么样的关系变量之间的关系强度如何④样本所反映的变量之间的关系能否代表总体变量之间的关系解释回归模型和估计的回归方程的含义:回归模型是描述因变量y如何依赖于自变量x和误差项的方程。回归方程是描述因变量y的期望值如何依赖于自变量x的方程。估计的回归方程是利用最小二乘法,根据样本数据求出的回归方程的估计。简述参数最小二乘估计的基本原理:这一公式的x和y的n对观察值,用于描述其关系的直线有多条,用距离观测点最近的一条直线,用它来表示x与y之间的关系与实际数据的误差比其它任何直线都小。根据这一思想确定直线中未知常数和的方法称为最小二乘法什么是P值?利用P值进行检验和利用统计量进行检验有什么不同?如果能把犯第Ⅰ类错误的真实概率算出来,就可以直接用这个概率做出决策。而不需要管什么事先给定的显著性水平α,这个犯第Ⅰ类错误的真实概率就是P值。不同:统计量检验是根据事先确定的显著性水平α围成的拒绝域作出决策,不论检验统计量的值是大是小,只要把它落入拒绝域就拒绝原假设H。否则就不拒绝H。这样,无论统计量落在拒绝域的什么位置,你也只能说犯第一错误的概率为α,而用P值检验则能把犯第Ⅰ类错误的真实概率算出来。获得数据的概率抽样方法有哪些(1)简单随机抽样简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。它最直观地体现了抽样的基本原理,是最基本的概率抽样。(2)系统抽样系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。(3)分层抽样分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。(4)整群抽样整群抽样又称聚类抽样或集体抽样,是将总体按照某种标准划分为一些群体,每一个群体为一个抽样单位,再用随机的方法从这些群体中抽取若干群体,并将所抽出群体中的所有个体集合为总体的样本。(5)多阶段抽样多阶段抽样又称多级抽样或分段抽样,就是把从总体中抽取样本的过程分成两个或多个阶段进行的抽样方法。样本量的大小与显著性有怎样的关系通常在做某种统计推断时,显著性水平要求越高,要达到该显著性水平的样本量越大。样本量越大,检验统计量的值夜就越大,P值就越小,就越有可能拒绝原假设。反之则相反第1章统计和统计数据1.1指出下面的变量类型。(1)年龄。(2)性别。(3)汽车产量。(4)员工对企业某项改革措施的态度(赞成、中立、反对)。(5)购买商品时的支付方式(现金、信用卡、支票)。详细答案:(1)数值变量。(2)分类变量。(3)数值变量。(4)顺序变量。(5)分类变量。1.2一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。(2)数值变量。(3)分类变量。1.3一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。(2)分类变量。1.4某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。(2)100。第3章用统计量描述数据教材习题答案3.1随机抽取25个网络用户,得到他们的年19152925242321382218302019191623272234244120311723龄数据如下(单位:周岁):计算网民年龄的描述统计量,并对网民年龄的分布特征进行综合分析。详细答案:网民年龄的描述统计量如下:平均24中位数2325%四分位数1975%四分位数26.5众数19标准差6.65方差44.25峰度0.77偏度1.08极差26最小值15最大值41从集中度来看,网民平均年龄为24岁,中位数为23岁。从离散度来看,标准差在为6.65岁,极差达到26岁,说明离散程度较大。从分布的形状上看,年龄呈现右偏,而且偏斜程度较大。3.2某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验。一种是所有顾客都进入一个等待队列;另一种是顾客在3个业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.56.66.76.87.17.37.47.87.8(1)计算第二种排队时间的平均数和标准差。(2)比两种排队方式等待时间的离散程度。(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。详细答案:(1)(岁);(岁)。(2);。第一中排队方式的离散程度大。(3)选方法二,因为平均等待时间短,且离散程度小。3.3在某地区随机抽取120家企业,按利润额进行分组后结果如下:按利润额分组(万元)企业数(个)300以下19300~40030400~50
本文标题:统计学第四版答案(贾俊平)
链接地址:https://www.777doc.com/doc-1436924 .html