您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 参数估计和假设检验(一).
425130011001010101101000101001011参数估计42513001100101010110100010100101122主要内容点估计和区间估计1.一个总体参数的区间估计2.样本量的确定3.4251300110010101011010001010010113案例分析——我国上市公司资本结构的行业因素分析4251300110010101011010001010010114上海五洲信息咨询公司市场部刘经理在新年上班第一天,刚走进办公室,传真机就响了,这是一份来自美国Lion投资公司的委托书,委托书上的文字十分简单:“2008年10月,美国Lion公司的品牌香槟将进入中国市场,现需了解上海市场的有关情况,委托业务费用10万美元。”随后是Lion产品介绍。刘经理高兴得差点跳了起来,马上和同事讨论是否可以接下这项工作。经过讨论,大家认识到,这是一个十分典型的市场调查和抽样推断的项目。了解市场有关情况,意味着需要掌握洋酒市场价格、需求量、消费群体、产品市场定位、促销手段、同类产品的市场占有率、销售状况、广告宣传以及消费者心态、未来洋酒需求能力的推断、潜在用户挖掘的可能性等。为了解能够得到进行推断的市场信息,刘经理布置大家现搜集有关资料,看是否有相关的二手数据,如果没有二手数据则应确定市场调查是否可行。资料:4251300110010101011010001010010115资料反馈显示,对于上海销售的洋酒除法国进口的某些葡萄酒及香槟以外,诸如轩尼诗、人头马、拿破仑、路易十六等品牌,由于其昂贵的价格,市场消费群体并不大,销量也十分有限。虽然目前洋酒的消费有了一定的市场,但其消费目的却十分单一,大多是在喜庆之时,或用来交际应酬,或作为高档礼品馈赠之用,而家庭消费则是一种奢望。当然形成这种局面的原因不仅仅是其价格,更多的是由于消费的观念及中国人长期形成的口味。与此同时,绝大多数洋酒的进入并非为了希望尽快倾销产品,获得较大的利润回报,而往往是为了抢占中国巨大的市场,扩大其品牌的知名度,为将来中国居民生活水平有相当提高后潜在的消费需求做准备。正因为如此,洋酒进入中国后,其营销手段也相对比较单一:往往是寻找一个代理商,然后直销或代销,有些则直接与国内的糖烟酒公司签订协议,代以销售。在上海市场洋酒的零售大多集中在大型百货公司或食品公司的某些专柜上,或者宾馆、饭店的商品小卖部里,也有部分是在糖烟酒公司经营的名烟名酒专卖店中销售,而在接近于百姓生活的为数众多的像华联、联华、农工商等连锁超市中几乎没有。4251300110010101011010001010010116这样看来,要推断销售额,只需要调查宾馆、百货公司及专卖店就可以获得所需的数据。由于调查总体范围单一,这样的调查,只要设计合理,时间和费用应该不多,而且从经营单位获得数据,数据的准确性也有相当的保证。于是,刘经理接下了这个项目开始准备市场调查。市场调查之后,刘经理需要根据这些抽样的数据,来估计一下整个上海市洋酒市场的销售额,借此来预测上海市场的洋酒市场容量。刘经理的这种从部分来推断总体的方法就是我们将要讲到的参数估计。参数估计时统计推断的重要内容之一,它是在抽样和抽样分布的基础上,根据样本统计量来推断反映总体特征的总体参数。425130011001010101101000101001011点估计与区间估计4251300110010101011010001010010118点估计(pointestimate)用样本的估计量的某个取值直接作为总体参数的估计值区间估计(intervalestimate)在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到样本统计量(点估计)置信区间置信下限置信上限425130011001010101101000101001011评价估计量的标准42513001100101010110100010100101110无偏性(unbiasedness)无偏性:估计量抽样分布的数学期望等于被估计的总体参数P()BA无偏有偏ˆˆ42513001100101010110100010100101111有效性(efficiency)1ˆ2ˆ有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效AB的抽样分布的抽样分布2ˆP()ˆˆ42513001100101010110100010100101112一致性(consistency)一致性:随着样本量的增大,估计量的值越来越接近被估计的总体参数AB较小的样本量较大的样本量P()ˆˆ42513001100101010110100010100101113区间估计的图示x95%的样本-1.96x+1.96x99%的样本-2.58x+2.58x90%的样本-1.645x+1.645xxxzx2425130011001010101101000101001011141.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平2.表示为(1--是总体参数未在区间内的比例3.常用的置信水平值有99%,95%,90%-相应的为0.01,0.05,0.104.由样本统计量所构造的总体参数的估计区间称为置信区间(confidenceinterval)置信水平(confidencelevel)425130011001010101101000101001011一个总体参数的区间估计总体均值的区间估计总体比例的区间估计总体方差的区间估计42513001100101010110100010100101116一个总体参数的区间估计待估参数均值比例方差大样本小样本大样本2分布2已知2已知Z分布2未知Z分布Z分布Z分布2未知t分布425130011001010101101000101001011总体均值的区间估计(采用Z统计量的情况)42513001100101010110100010100101118大样本方差未知正态总体方差已知或大样本方差已知总体均值的区间估计1.假定条件–总体服从正态分布,且方差(2)已知–或者,如果不是正态分布,是大样本(n30),可由正态分布来近似2.使用正态分布统计量3.总体均值在1-置信水平下的置信区间为)1,0(~Nnxz边际误差2sxzn抽样标准误差2xzn42513001100101010110100010100101119总体均值的区间估计【例】一家食品生产企业以生产袋装食品为主,为对食品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.342513001100101010110100010100101120解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根据样本数据计算得:。由于是正态总体,且方差已知。总体均值在1-置信水平下的置信区间为28.109,44.10192.336.105251096.136.1052nzx该食品平均重量的置信区间为101.44g~109.28g36.105x正态总体方差已知42513001100101010110100010100101121总体均值的区间估计【例】一家保险公司收集到由36个投保人组成的随机样本,得到每个投保人的年龄(单位:周岁)数据如下表。试建立投保人年龄90%的置信区间。36个投保人年龄的数据2335392736443642464331334253455447243428393644403949383448503439454845324251300110010101011010001010010112227.7739.51.6453639.52.1337.37,41.63sxzn解:已知n=36,1-=90%,z/2=1.645。根据样本数据计算得:总体均值在1-置信水平下的置信区间为投保人平均年龄的置信区间为37.37岁~41.63岁5.39x77.7s大样本方差未知425130011001010101101000101001011总体均值的区间估计(采用t统计量的情况)42513001100101010110100010100101124总体均值的区间估计(小样本)1.假定条件–总体服从正态分布,但方差(2)未知,且为小样本(n30)2.使用t分布统计量3.总体均值在1-置信水平下的置信区间为)1(~ntnsxtnstx2正态总体方差未知42513001100101010110100010100101125总体均值的区间估计【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(单位:h)如下。建立该批灯泡平均使用寿命95%的置信区间。16只灯泡使用寿命的数据151015201480150014501480151015201480149015301510146014601470147042513001100101010110100010100101126解:已知X~N(,2),n=16,1-=95%,t/2=2.131根据样本数据计算得:,总体均值在1-置信水平下的置信区间为2.1503,8.14762.1314901677.24131.214902nstx该种灯泡平均使用寿命的置信区间为1476.8h~1503.2h1490x77.24s正态总体方差未知425130011001010101101000101001011总体比例的区间估计42513001100101010110100010100101128总体比例的区间估计1.假定条件–总体服从二项分布–可以由正态分布来近似2.总体比例p在1-置信水平下的置信区间为/2ˆˆ(1)ˆpppzn42513001100101010110100010100101129%35.74%,65.55%35.9%65100%)651%(6596.1%65)1(2nppzp总体比例的区间估计/2ˆˆ(1)ˆpppzn【例】某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。解:已知n=100,=65%,1-=95%,z/2=1.96该城市下岗职工中女性比例的置信区间为55.65%~74.35%ˆp425130011001010101101000101001011总体方差的区间估计42513001100101010110100010100101131总体方差的区间估计1.估计一个总体的方差或标准差2.假设总体服从正态分布3.总体方差2的点估计量为s2,且4.总体方差在1-置信水平下的置信区间为1~1222nsn111122122222nsnnsn42513001100101010110100010100101132总体方差的区间估计(图示)221222总体方差的1的置信区间自由度为n-1的242513001100101010110100010100101133总体方差的区间估计【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知
本文标题:参数估计和假设检验(一).
链接地址:https://www.777doc.com/doc-3280412 .html