您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 统计学课件第5-7章概率分布抽样分布及参数估计
Tuesday,December17,2019StatisticalResearchOffice1第5、6、7章概率分布、抽样分布及参数估计ProbabilityDistributions&SamplingDistributions&ParameterEstimationTuesday,December17,2019StatisticalResearchOffice2本部分主要研究的问题有:●随机变量的概率分布●常用的随机抽样组织方式●样本均值的抽样分布及总体均值的估计●样本比率的抽样分布及总体比率的估计Tuesday,December17,2019StatisticalResearchOffice3▲常见随机变量的分布●0-1分布-模型-概率分布率(概率函数)-数学期望-方差●二项分布-模型-概率函数),(~pNBXNxppCxXPxpxNxxN,,1,0,)1(}{)(),1(~BX1,0,)1(}{)(1xxXPxpxxEX)1(DXTuesday,December17,2019StatisticalResearchOffice4-期望-方差NpEX)1(pNpDX●几何分布-模型-概率函数-期望-方差)(~pGX,2,1,0,)1(}{)(xppxXPxpxppEX121ppDXTuesday,December17,2019StatisticalResearchOffice5●超几何分布-模型-概率函数-期望-方差),,(~MNnHXnxCCCxXPxpnNxnMNxM,,2,1,0,}{)(NMnEX1)1(NnNNMNMnDX●泊松分布-模型-概率函数-期望与方差)(~PX,2,1,0,!}{)(xexxXPxpxDXEX,Tuesday,December17,2019StatisticalResearchOffice6●均匀分布-模型-概率函数-数学期望与方差],[~baUX其它0],[,1)(baxabxp12)(,22abDXbaEX●指数分布●正态分布●-分布●t-分布●F分布2其它00)(xexfxRxexfx21)(222)(Tuesday,December17,2019StatisticalResearchOffice7●利用EXCEL进行相关概率计算(略)Tuesday,December17,2019StatisticalResearchOffice8●常用的随机抽样组织方式►简单随机抽样(Simplerandomsampling)►分层随机抽样(Stratifiedsampling)►系统随机抽样(Systematicsampling)►整群随机抽样(Clustersampling)常用的随机抽样方法:►重复抽样(Samplingwithreplacement)►不重复抽样(Samplingwithoutreplacement)Tuesday,December17,2019StatisticalResearchOffice9★简单随机抽样-定义:从总体中,按照随机的原则,使得总体中每个个体都有同等被选中的机会,而先后抽出的n个个体作为一个容量为n的样本。-特点:●遵循随机性原则;●总体中每个个体被选中的概率相同;●对总体不作任何划分;●总体本身就是一个确定的抽样框。-抽样方法:重复抽样、不重复抽样Tuesday,December17,2019StatisticalResearchOffice10★系统随机抽样-定义:先将总体单位按某种变量排队(可以按无关变量,也可以按有关变量),然后根据总体单位数N及样本容量n的大小,将总体单位划分为n组(段);最后,在第一组的单位中,按照随机性原则选出第一个单位作为样本中的一个个体,以后每隔相同的间隔保证在每一组中抽取一个个体,则由这n组中所抽取的共n个个体构成一个样本。Tuesday,December17,2019StatisticalResearchOffice11-特点:●遵循随机性原则---随机性主要体现在第一个样本点的选取;●需要一个抽样框;●对抽样框中的个体要排队---若按无关变量排队,则等同于简单随机抽样;若按有关变量排队,则在其他条件相同的情况下,抽样误差要小于简单随机抽样。●排队后个体的相关特性不能有规律地或周期地出现。●简单易行---特别是当总体中的个体总数相当多时。Tuesday,December17,2019StatisticalResearchOffice12★分层随机抽样-定义:将总体首先划分为若干层(类、组),然后在每一层(类、组)内按一定的方法抽取个体(按简单随机抽样或按系统随机抽样),则由每一层所抽个体构成一个样本。-特点:●遵循随机性原则---体现在在每一层抽选中;●每一层内应包含足够多的个体;●在同等条件下,抽样误差要小于简单随机抽样和系统抽样的抽样误差。Tuesday,December17,2019StatisticalResearchOffice13●要求层内个体差异较小,而层与层之间差别较大。★整群随机抽样-定义:首先将总体划分为若干群(类、组),然后根据样本容量大小及各群所含个体数的多少,从所有群中按照随机性原则而抽取一定数量的群作为样本群,则由所抽样本群中的所有个体构成一个样本。Tuesday,December17,2019StatisticalResearchOffice14-特点:●简单易行、调查成本相对较低;●划分的群数应足够多;●各群内个体差异较大,而群与群之间差别较小。●在其他条件相同的情况下,抽样误差要大于分层随机抽样的抽样误差。要求:能简述各随机抽样组织方式的实施,及其各种方式主要实施的条件。Tuesday,December17,2019StatisticalResearchOffice15★样本均值的抽样分布(SamplingDistributionofSampleMean)●统计量:它是样本的函数,且该函数中不含未知参数。-样本均值(SampleMean)niinXnXXXnX1211)(1的个体总数)为样本中具有某种特性其中nnvnvp(niiXXnS122)(11-样本比率(SampleProportion)-样本方差(SampleVariance)Tuesday,December17,2019StatisticalResearchOffice16),(~,,),,,2,1(X212innNXnDXEXniniiii时,则当独立同分布,且设),(~121nNXnXnii即★列维–林德伯格中心极限定理可见,若一个总体的期望与方差存在,只要样本容量足够地大,则从总体中抽选出的简单随机样本的样本均值将近似于正态分布。特别注意:本定理不要求随机变量服从正态分布!!!Tuesday,December17,2019StatisticalResearchOffice17★抽样分布:统计量的统计分布称作抽样分布。求统计量的抽样分布,就是用已知随机变量的分布表示统计量的分布。★样本均值的分布●来自非正态总体的样本均值的分布由列维–林德伯格中心极限定理知:当样本容量n足够大时,(通常必须是大样本)),(~121nNXnXniiTuesday,December17,2019StatisticalResearchOffice18从而,标准化之)1,0(~-XNn给定α(0<α<1)则,1}-X{22ZnZP1}{22nZXnZXP解不等式,得即总体均值位于上述区间内的概率是1-α.Tuesday,December17,2019StatisticalResearchOffice19注当总体标准差δ已知时,则可利用上述不等式求出总体均值μ的概率为1-α的取值范围。所求区间称作置信区间,1-α称作置信水平。1-α0.800.900.950.95450.980.991.271.641.962.002.332.582Z当给定1-α数值时,对应的临界值为Error)tandardSn称作抽样标准误差(Tuesday,December17,2019StatisticalResearchOffice20当总体标准差δ未知但采用大样本时,可以用样本标准差s代替总体标准差δ,此时,总体均值μ的概率为1-α的取值范围为:],[22nSZXnSZX当采用简单随机不重复抽样时,抽样标准误差为:12NnNnTuesday,December17,2019StatisticalResearchOffice211,112222NnNnZXNnNnZX上限为::的置信区间下限为的其中,很大时)当N()1(122NnnNnNn时)当%3Nn(nTuesday,December17,2019StatisticalResearchOffice22●来自正态总体的样本均值的分布则,不管样本容量的大小,都有:),(~121nNXnXnii)1,0(~-XNn1}-X{22ZnZP标准化之,给定α(0<α<1)有,Tuesday,December17,2019StatisticalResearchOffice23所以,总体均值1-α的置信区间为:],[22nZXnZX其中,δ为已知。●若δ为未知,以替代δ,因为)1(~-X*ntnS*STuesday,December17,2019StatisticalResearchOffice24给定α(0<α<1)有,1}-X{2*2tnstP解上述不等式,得nstXnstX*2*2即.-1],[*2*2的概率为nstXnstXniixxns12*)(11其中,Tuesday,December17,2019StatisticalResearchOffice25关于t-分布的说明:)1(~)1(22*2nSn),,(随机变量若10~NX),(随机变量nY2~且随机变量X与Y相互独立,则),(随机变量ntnYX~又)1,0(~-XNn且它们相互独立,Tuesday,December17,2019StatisticalResearchOffice26所以1)-(nt~1/)1(/-X2*2nSnn化简得,)1(~-X*ntnS注意:若是大样本,样本标准差S与修正的样本标准差差别较小,可以用S替代*S若是小样本,则不可以替代。*STuesday,December17,2019StatisticalResearchOffice27●来自非正态分布总体的样本比率的分布由列维–林德伯格中心极限定理))1(,(~),1(,10),,,2,1(X1innNXnDXEXniniiii时,则当即分布,均服从独立同分布,设))1(,(~11nNpnvXnXnini则,Tuesday,December17,2019StatisticalResearchOffice28)1,0(~)1(-Nnp1})1(-{22ZnpZP标准化之,得给定α(0<α<1)有,])1(p,)1(p[22nZnZ所以,总体比率1-α的置信区间为:Tuesday,December17,2019StatisticalResearchOffice29通常总体比率都是未知的,因此,用其样本比率p替代π,所以有]1)1(p[2NnNnppZ若采用简单随机不重复抽样,则])1(p,)1(p[22npp
本文标题:统计学课件第5-7章概率分布抽样分布及参数估计
链接地址:https://www.777doc.com/doc-2064766 .html