您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文化 > 课件-数理统计与多元统计-第一章-数理统计的基本概念-1.2样本分布及统计量
一样本分布二统计量一样本分布1212,,,,,,,:nnXXXXnXXX设为取自总体的个个体如果满足;,,,)1(21相互独立nXXX具有相同的分布。与XXXXn,,,)2(211212,,,,,,nnXXXXxxxX则称为总体的一个容量为n的样本。观测值为总体的一个容量为n的样本值。1样本与样本值3121,,,()(1.1)nniiFxxxFx2样本的分布的分布函数为则样本的分布函数为若总体),,,(),(21nXXXxFX,2,1,)1(ipxXPXii具有概率分布若总体的概率分布为则样本),,,(21nXXX1111,,(1.2)nkknniniiiiiPXxXxPXxp4)分布)服从两点分布((设总体10X则的子样从中取出一容量为),,,,(21nXXXn例1.2.1,niiniixnxpp111的概率分布为则样本),,,(21nXXXniiinnxXPxX,,xX,xXP12211nixxiipp111nixi,,2,11,0nixppxXPixxiiii,,2,11,0,115的概率分布。试求样本),,,(21nXXX服从两点分布设总体X1,0,411411xxXPxx例1.2.26)3.1()(,,,121niinxfxxxf的概率密度为:则样本具有概率密度设总体),,,(),()2(21nXXXxfX与密度函数。的分布函数试求样本的指数分布服从参数为总体设),,,(),(21nXXXZX例1.2.37二统计量称为统计值。观察值为作一次观察对样本),,,(),,,,(,),,,(212121nnnxxxTtxxxXXX1统计量定义定义1.2.1设X1,X2,…,Xn为总体的一个样本,不含任何未知参数的样本的函数:T=T(X1,X2,…,Xn)称为统计量,其中T为连续函数。8则未知已知其中的样本的容量为是来自正态总体设,,,),(),,,(221nNXXXn例1.2.4,)()1(12niiXniiXXnS122)(11,21XX,11niiXnX均为统计量。9niixxns122)(11,)(12niix相应的统计值为,21xx11,niixxn,)()2(12niiX,21XX,),,,(21的函数均为样本nXXX计量。未知时,它们都不是统当其中102顺序统计量(1.4)...)((2)(1)nXXX,),,,(,,,21)()2()1(顺序统计量的为原样本则称nnXXXXXX。个顺序统计量为第称)1()(nkkXk排列为它们按从小到大的次序把的样本为总体设,),,,(21XXXXn定义1.2.211到数据的顺序信息。只去掉了不太重要的得数据信息统计量保留了原样本的顺序注,1个数据。即超过它的恰有不超过它个数据恰有个数据中意味着在注knknXk,,2)(后得到顺序统计值则按从小到大顺序排列若样本值为,,,,21nxxx)5.1(...)()2()1(nxxx12的分布函数为)2()2(XnXXXX,,,min21)1(nnXXXX,,,max21)(易见的分布函数为)1()1(XnNxFxF))(1(1)(nMxFxF)()(论知识知由概率具有分布函数总体若已知注),(3xFX13其值如下表样本作三次观察今对的样本为的容量设,,5,,,21nXXX计值。试求三次观察的顺序统例1.2.5xiXiX1X2X3X4X51311056226728383591014顺序统计值即得从小到大排列解:将上述表中数据按,xiX(i)11356102226783358910)1(X)2(X)3(X)4(X)5(X153描述样本的中心位置的统计量样本均值)1()6.1(11niiXnXniixnx11观察值为,间位置样本均值处于样本的中均值。它可以反映总体分布的16试求其样本均值。其观察值为的样本抽取容量从某种合金强度总体中145130155150140,51445/)145130155150140(X例1.2.617:110,个电子元件的失效时间给出了数据表下表是经过整理的分组表中的组中值xi为每一小组[ti-1,ti)的中值,即21iiittx例1.2.7组中值xi20060010001400频数fi6283723组中值xi1800220026003000频数fi951118niiniiifxfX11平均失效时间近似为那么,200240004000[故组中值为),,可视为如此处第一个分组区间9.1090)13000286006200(1101注意,此处为加权平均19样本中位数)2()7.1(2)(2112)1()()1(knXXknXmkkkn当当20:4.161.150.159.155.145.142.147.160.133.15):(,10,,试求所得数据如下:欧姆单位测定其阻抗值件从产品中任取稳定为控制生产过程保持某工厂制作一种线圈X例1.2.8又为何值?此时件数据为若取第nm,2.1511)2(;)1(的值样本中位数nm21小到大顺序排列为解:先将所得数据按从7.164.169.153.151.150.155.145.142.140.1352101kkn,)可见(2/)()6()5(xxmn05.152/)1.150.15(1.15)6(xmn,2.15)2()11(时若x51211kkn22:,8,7,7,6,6,6,6,6,5,4,4,3,3,3,3,2:的次数如下那么其中每一个值出现现有一数据集合。众数为易见6,(mod)3众数不过它可能不唯一。可能性最大的值即是样本中出现即为众数数据中最常出现的值,,,例1.2.9数值2345678出现次数1421521234描述样本数据分散程度的统计量:常用统计量有以下几种总体取值的分散程度的统计量实际上反映了反映样本数据分散程度,样本极差)1()8.1()1()(XXDnn样本方差)2(niiXXnS122)(11628,10.1nD样本极差中如在例24])144145()144130()144155()144150()144140[(41222222S,7.1中如在例5.113样本标准差)3()9.12(SS6536.10,5.113,)2(,22SSXSXS则中如在上面的量纲是一致的。与而的量纲不一致与25%101.0101.02C变异系数)4(1.10)rSCX(集的分散程度的比较。变异系数用于不同数据变异系数为两者的米测量误差的标准为米均长度为而测得一张桌子的平公里测量误差的标准为公里距离测得北京到上海的平均例如,01.0,1,1,1463%0684.0000684.0146311C精度比后者高。故知前者测量的26阶混合原点矩为样本lkYXnYXnilikilk11)3(5样本矩有相应的样本矩:对不同的总体矩,阶原点矩为样本kXnXnikik11)1(阶中心矩为样本kXXnSnikikn1)(1)2(27阶混合中心矩为样本lkYYXXnSnilikilkXY1)()(1)4(所得式称为样本绝对矩代替上式中若用注,:1iiXX阶原点绝对矩为样本例如kXnniki1||12注niiXnX11样本均值;可作为总体均值的近似28niiiXYYYXXnS1))((12211()1niiSXXn;可作为总体方差的近似样本二阶中心矩阶混合中心矩样本11.),(的近似则可作为协方差YXCov注:可借助统计软件作出性描述统计
本文标题:课件-数理统计与多元统计-第一章-数理统计的基本概念-1.2样本分布及统计量
链接地址:https://www.777doc.com/doc-6816456 .html