您好,欢迎访问三七文档
1第五讲参数估计所有描述总体特征的指数叫参数总体N=73总体平均数u比重用∏表示什么叫统讲量,即体重、身高、年薪、女性比例等2参数估计案例郑州市大瓶装纯水消费需求,消费行为,消费意向估计郑州市4个市区的总户数为327314户,单位的总数为14230个。3参数估计案例郑州市大瓶装纯水市场估计1.估计当前的市场容量2.预测未来市场的潜力3.计算各纯水品牌的知名度4.估计各纯水品牌的覆盖率5.估计各纯水品牌的市场占有率6.估计各纯水品牌的满意度7.中美纯水价格定位4估计当前的市场容量郑州市大瓶纯水市场容量家庭用水总量单位用水总量用水家庭数每家月平均用水量μ用水单位数每单位月平均用水量μ用水家庭数占总家庭户数的比重π用水单位数占总单位数的比重π四个参数5本讲学习要点:参数估计方法点估计:用一个样本数值估计总体水平区间估计6调查数据家庭用户单位用户样本容量800151用水单位6651用水单位占样本容量的比重8.3%33.8%样本平均月用水量3.26桶43.4桶样本用水量的标准差2.947.297统计量反应样本分布特征的指标统称为样本统计量,简称统计量。pssx,,,28总体参数样本统计量NX平均数方差nxxNXX22)()(1)()(22nxxxsNN1nxp比率9郑州市大瓶装纯水市场容量的估计(点估计)市场容量估计(点估计)家庭用水总量单位用水总量用水家庭数占所有家庭户数的比重估计值=8.3%平均月用水总量估计值=3.26用水单位数占所有单位的比重估计值=33.8%平均月用水总量估计值=43.4用水户数估计值用水单位数量的估计10区间估计总体比例的区间估计总体平均数的区间估计11平均数上午区间估计:家庭用户月平均使用量的区间估计3.26桶±误差单位用户月平均使用量的区间估计43.4桶±误差如何选择估计方法12如何得到误差公式推导30)(nnsz样本平均数13样本均值的抽样分布样本比率的抽样分布14样本平均数的概率分布的引出15EAI公司的抽样问题EAI公司的人事主管正在制定一项公司25000名人员的简报。其中包括中层管理人员的人均年薪和公司中已完成管理培训项目的管理人员所占的比率。想知道的指标为:参数:实际可以得到的数据为统计量30n)0.63(19/3051814pX,161718的概率分布正态分布再生定理中心极限定理X19正态分布再生定理当总体服从正态分布时,从中抽取样本容量为n的样本,样本均值一定服从正态分布。样本均值的期望值标准差XXE)(nx20中心极限定理总体为任意分布时,若从该总体中随机抽取样本容量为n的样本,当n很大(n30)时,则样本平均数的抽样分布近似为正态分布,即:21如果有那么有有95.44%的把握估计区间9544.0)22(9544.022nXnXpnXpXXXX22,包含总体均值区间估计公式的简单推导znX22当时,总体平均数的置信区间为23区间估计的几个关键概念置信系数使人相信区间包含总体均值的概率,一般取0.95,0.90,0.99.它的大小说明估计的把握性的大小。即把握性,也可以事先给定。把握性越大,误差越大。(书112页例4-5、4-6)置信区间/置信水平/置信度:在一定概率的保证下,包含总体均值的区间,区间的宽窄说明估计精度的大小.区间越宽,估计的精度就小;否则就大.临界值:置信区间的上限和下限注意置信系数和区间宽窄的关系124郑州市所有家庭用户平均月用水量的95%置信区间为:(3.26±0.71)(2.553.97)郑州市所有家庭用户用水总量的95%置信区间为:(3.26±0.71)*27165(88565±19289)(69276107854)郑州市所有家庭用户用水量总量的95%置信区间25郑州市所有单位用户用水量总量的95%置信区间郑州市所有单位用户平均每户月用水量的95%置信区间为:(43.4±2.00)(41.445.4)95%置信区间为(43.4±2.00)*4810(208754±9620)(199134218374)26区间估计的应用续教材27根据均值区间估计公式可得样本容量n为样本容量的确定•估计总体均值时28举例某消费者组织希望估计某大城市9月份家庭电费均值.基于其它城市的研究情况,标准差约为25元,小组希望以99%的置信度在±10元内估计总体电费均值,问需要多大的样本容量.42户29用EXCEL及SPSS进行区间估计30案例2DEF有限责任公司是中国南部的一家房地产代理商。企业在广告中称他们是真正的地产专家。公司通过搜集有关地点、售价和每套售出花费天数,对房屋的销售进行监督。某海滨城市开发了几处高级别墅群。有的别墅可以直接看到海,把这类房屋则称之为“看得见海湾的房屋”;其他则称之为“看不见海湾的房屋”。该城市行业协会的样本数据,给出了不同房地产公司最近售出的40套看得见海湾的房屋和18套房屋看不见海湾的房屋数据,价格以千美元计。31问题1、对40套看得见海湾的房间,用适当的描述性统计量对3个变量中的每个变量进行汇总。2、对18套看不见海湾的房间,用适当的描述性统计量对3个变量中的每个变量进行汇总。3、比较你的汇总结果,讨论有助于房地产代理商了解地产市场的各种统计结果。4、对看得见海湾的房间,求售价的总体均值以及售出中花费天数的总体均值的95%值信区并解释你的结果。32问题续5、对看不见海湾的房间,求售价的总体均值以及售出中花费天数的总体均值的95%值信区间并释你的结果6、假定分公司的经理要求在40000美元的边际误差下对看得见海湾的房间售价的均值进行估计,在15000美元的边际误差下对看不见海湾的房间售价的均值进行估计。取置信度为95%,应选取多大的样本容量?33数据,见数据文件GulfProp34第五讲小结参数估计参数估计方法样本容量的确定区间估计点估计总体比例的区间估计样本比例±误差样本比例的抽样分布(正态分布)nP5且n(1-P)5总体均值的区间估计样本均值±误差样本均值的抽样分布(正态分布正态分布再生定理中心极限定理P(1-P)Pn35作业都市研究公司该公司是一家消费者研究组织,它设计调查对消费者所使用的大量的产品和服务进行评估。在某一项调研中,该公司调查消费者对A城市某一主要制造商生产的汽车的性能的满意度感兴趣。分发给制造商所生产的一种最大型号小汽车用户的调查表表明,许多人抱怨该车的变速箱过早出现问题。为了更好地了解变速箱的缺陷问题,该公司采用由A城市一家变速箱维修公司所提供的变速箱维修的样本数据36数据85092.0059465.0032534.0032464.0039323.0094219.0092857.0065605.0064342.0067998.00101769.0121352.074276.0040001.0025066.0069922.0074425.00118444.079294.0086813.0037831.0073341.00138114.085586.0077539.0032609.0077437.0064090.0059902.0089641.00116803.063436.0085861.0061978.0059817.0095774.0069568.0066998.0072069.0077098.0035662.0067202.0053500.0064544.00116269.089341.0085288.0053402.0082256.0088798.0037问题用适当的描述统计方法分析变速箱数据建立变速箱失效汽车总体的在变速箱失效之前行使的平均里程的95%的置信区间。并给出这个区间估计的管理解释。根据一些经历过变速箱失效的车主们的意见来讨论你的统计结果的含义?如果该公司想在边际误差为5000英里,估计变速箱失效汽车总体在变速箱失效时所行使的均值里程的95%的置信区间,则应该抽取多少条维修记录?为了更充分地评价变速箱失效问题,你还需要收集哪些信息?2020/1/21王玉荣制作38Theendofchapter5
本文标题:第5讲 参数估计
链接地址:https://www.777doc.com/doc-3208622 .html