您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第四章 抽样及抽样分布
1学习目标抽样推断抽样调查的组织方式和抽样方法抽样误差抽样估计样本容量的确定2第一节抽样推断概述抽样调查按照随机性原则,从全部研究对象中抽取一部分单位进行观察的一种非全面性调查抽样推断在抽样调查的基础上,依据所获得的数据对全部研究对象的数量特征作出具有一定可靠性的估计和判断,从而达到对研究整体认识的一种统计分析方法3抽样推断的特点目的是由部分来估计和判断整体抽样推断是建立在随机抽样的基础之上的运用概率估计的方法,其误差不仅可以事先计算,而且可以控制4抽样推断的作用在无法进行全面调查或进行全面调查有困难的时候,可以运用抽样调查来推断总体采用抽样调查,可以节省费用和时间,提高调查的时效性和经济效果可以用来对全面资料做检验和修正可以用于工业生产过程的质量控制可以对某种总体的假设进行检验,来判断这种假设是否正确以决定行动的取舍5几个基本的概念总体中国计量学院所有学生的身高总体,杭州所有居民的收入总体,金融资产收益总体样本从中国计量学院随机抽取的200个学生的身高随机抽取的1000个杭州居民的收入观察到的金融资产的收益6总体指标和样本指标NXXPQNNPNNNNXXnii221101)(1;1)(1;221101nxxspqnnpnnnnxxnii7样本容量和样本个数样本容量一个样本中所包含的单位数n样本个数从总体中可能抽取或可能构成的样本的数目8第二节抽样中常用的分布及定理9第二节抽样调查的组织方式和方法101112131415抽样方法和样本可能数目考虑顺序的不重复抽样数目考虑顺序的重复抽样数目不考虑顺序的不重复抽样数目不考虑顺序的重复抽样数目16统计学的分析思路总体population样本samplesamplinginferring17变异“世界上没有两片完全相同的叶子”----植物学家“世界的丰富多彩来源于其多样性”----哲学家“个体差异是生物医学领域里普遍存在的现象”----医学家统计学就是研究变异(variation)的科学。18抽样误差变异----抽样误差(variation)----(samplingerror)联系?19抽样实验例1:假定某地正常成年男子的红细胞计数服从正态分布N(5.00,0.502)的总体,单位1012/L。用计算机模拟从该总体中随机抽样,每次抽10例组成一个样本,重复100次抽样。结果见表1。20抽样实验表1正常成年男子红细胞计数抽样实验结果样本号红细胞计数S15.595.114.265.114.74…5.555.040.4424.654.655.595.704.46…5.325.030.5234.564.875.214.534.53…4.234.710.3344.084.734.844.884.65…5.334.660.46::::::1005.164.495.265.024.64…4.564.900.29X21抽样实验1S2S__2X__1X__100X100S总体4.660.5722抽样误差由于事物间普遍存在着变异,由此产生了这么一个现象:由于抽样而引起的误差——抽样误差23抽样误差定义:抽样误差(samplingerror):是指由于样本的随机性引起的统计量与参数的差别,或同一总体的相同统计量之间的差别。24了解抽样误差规律的重要性总体同质个体、个体变异总体参数未知样本代表性、抽样误差随机抽样样本统计量已知统计推断风险25均值的模拟试验考察:样本均值的均值与总体均值有何关系?样本均值的标准差与总体标准差有何关系?样本均值的分布形状如何?不同的样本含量对上述性质的影响如何?26正态分布样本均值的分布样本编号n=4样本均值样本标准差最小值最大值抽样误差198981049799.42.997104-0.6299981009597.81.795100-2.2310310910995104.16.1951094.1493949910096.43.193100-3.6510410590106101.26.4901061.26104921038395.68.683104-4.4799107949799.44.994107-0.68100103969297.94.192103-2.199297949494.31.99297-5.710100102959798.22.895102-1.8从N(100,62)中随机抽样,样本含量为4的10份独立样本的均值、标准差、抽样误差27样本均值的均值和标准差1011199.497.898.298.41001010iiXX22199.498.498.298.42.82101101634niiXXXsn28从N(100,62)中随机抽样,样本含量为4的1000个样本均值的频数分布图0.05.1.1580.090.0100.0110.0120.0SampleMean正态总体分布样本均值服从正态分布29SamplingDistributionofsamplemeansSamplingDistributionofsamplemeansSamplingDistributionofsamplemeansPopulationBXXPopulationCXPopulationDXPopulationAn=10n=4n=25n=2SamplingDistributionofsamplemeansSamplingdistributionformeans30均值的抽样误差之特点各样本均值未必等于总体均值;样本均值间存在差异;样本均值的分布很有规律,围绕总体均值,中间多两边少,左右基本对称;样本均值的变异范围较之原变量的变异范围大大缩小;随着样本含量的增加,样本均值的变异范围逐渐缩小。31抽样误差在实际工作中,由于各种条件所限,一般不可能也没有必要观察总体中的每一个个体,常常是通过抽样来进行研究的。虽然抽样误差是不可避免的,但其大小是可以度量的。问题:如何度量抽样误差的大小?32标准误(StandardError,SE)统计学上将样本均数`X、样本率P等统计量的标准差称为标准误,它可用于说明抽样误差的大小。抽样误差33标准误(standarderror)样本统计量的标准差称为标准误。样本均值的标准差称为均值的标准误。均值的标准误表示样本均值的变异度。当总体标准差未知时,用样本标准差代替,前者称为理论标准误,后者称为样本标准误。XssnXn34抽样误差的计算样本平均值的标准误差在重复抽样下在不重复抽样下nxNnnx135样本成数的的标准误差在重复抽样下在不重复抽样下nPPnp)1()1()1(NnnPPp36综合练习1某电子元件厂对10000个元件使用寿命抽取1%进行检验,结果如表所示。37表11%样品测试数据1.样本平均数=105550/100=1055.5(小时)使用寿命(小时)抽检数f组中值xx·f900以下1875875900~95029251850950~1000697558501000~1050351025358751050~1100431075462251100~115091125101251150~12003117535251200以上112251225合计100—105550x38将表1整理为表2表21%样品标准差计算表xx-(x-)2f(x-)2f875-180.532580.25132580.25925-130.517030.25234060.5975-80.56480.25638881.51025-30.5930.253532558.75107519.5380.254316350.75112569.54820.25943472.251175199.514280.25342840.751225169.528730.25128730.25合计——100269475xxx小时91.511002694752ffxxSx39重复抽样:不重复抽样:2.质量标准规定使用寿命不足1000小时为不合格品,试分别计算不同抽样方法条件下该厂元件成数(合格率)与抽样误差。如表3所示。)(191.510091.51小时nSxx)(165.510000100110091.5112小时NnnSxx40表3成数抽样误差计算表使用寿命(小时)元件质量抽检数(个)比重(成数)(%)900以下900~950950~1000不合格不合格不合格1269.01000~10501050~11001100~11501150~12001200以上合格合格合格合格合格354393191.0合计—100100.041重复抽样:不重复抽样:0285.010000100110009.091.011Nnnppp0286.010009.091.01nppp42影响抽样误差的因素抽样理论研究和实践证明影响抽样误差大小的因素主要有:(一)总体各变量值X间差异的大小如果其他条件不变,离散程度(σX或σP)越大,抽样误差μx或μp越大;反之,则越小。(二)样本单位数(样本容量)的多少其他条件不变,样本单位数n越少,抽样误差越大;反之,则越小。(三)抽样方法重复抽样误差大于不重复抽样误差。(四)抽样调查组织形式不同的抽样组织形式会产生不同的抽样误差。
本文标题:第四章 抽样及抽样分布
链接地址:https://www.777doc.com/doc-3790533 .html