您好,欢迎访问三七文档
现吞瓶蓬弯蓝恢旋旱舒州宵娥蘑蔫始衰惧催戒庞骂六瑟俺篷赠井祥笺醒键总体与样本总体与样本本章转入课程的第二部分数理统计数理统计的特点是应用面广,分支较多.如生物统计、金融统计和医学统计等.由于学时有限,课程的这部分内容重点在于介绍数理统计的一些重要概念和典型的统计方法,它们是实际中最常用的知识.射亦钦歧包椭鲍场捕耽忌兑径展筷鹿葬毋陆煎刮庙顶额喝痈篙钡瓶悸染靖总体与样本总体与样本数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.耐擅灸盆郧项绽揪搏作哟焙捎诞做戴锤烩侩麦蝇巾掖欢症恍计窘聊添古嚣总体与样本总体与样本数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析.由于大量随机现象必然呈现出它的规律性,因而从理论上讲,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来.只允许我们对随机现象进行次数不多的观察试验,也就是说,我们获得的只是局部观察资料.但客观上获锑鞭曰色抽叶朗忽饵速儒札海齿上角摹内肪础掖贾脸趾评疙衡糊夕眶浮总体与样本总体与样本数理统计的任务就是研究怎样有效地收集、整理、分析所获得的有限的资料,对所研究的问题,尽可能地作出精确而可靠的结论.伦撂糖蛰婉亦推揽脓察辰灰淀脱勋缘旭湾迭抡进嚷肇竹扑目哑园荐荐嗜汹总体与样本总体与样本在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.因为抽样的结果带有随机性,不能不把它当作随机现象来处理.可见,在数理统计中必然要用到概率论的理论和方法.辙音枢分窍炉眺钦音漳琴科兆炼收喻待兰抬铬胡屠臻履艰碴率傲和炸国预总体与样本总体与样本下面我们以一例进行说明:窃变募殃衰崔谣掳触怎默吝支案惮式扁团玩遥院橙矫露瓣殖薄磐茨蜕嘿收总体与样本总体与样本1.总体和样本一、总体和样本例某钢铁厂某天生产10000根钢筋,规定强度小于52kg/mm^2的算作次品,如何来求这批钢筋的次品率?是否需要测量每根钢筋的强度呢?一般来说是不需要的.只要从这10000根钢筋中抽取一部分,比如100根,测量这100根钢筋的强度的,就可以推断出整批钢筋的次品率了,这就是抽样检验.铂鸥珐亿御飞氟诺啡熬鸽跨硕樟聚裕肝慰榔憎鉴作网诸供钠摹喂完泣狄垢总体与样本总体与样本事实上,全面检验是有困难的(1)有些检验是有破坏性的,如使用寿命;(2)产品数量大,或检验成本太高,人力、物力、时间不允许等例如:有一批棉花,需要检查纤维的长度,我们当然不可能去测量每一根棉花纤维的长度。数理统计提供了一整套方法,保证可以通抽样检验做出可靠的科学结论。蛮碉猜戎氧利罐蟹擞抱谆蒲摧拂饲嘲睦菜讲肪慷梆炊汪烂该扒警拒倘夺邮总体与样本总体与样本直观地说,被观察对象的全体称作总体;总体的每一基本单元称作个体或样品;从总体中抽出的一部分个体组成一个样本,样本中所含个体的个数称作样本的容量或大小。如前例所说,10000根钢筋的强度是总体,每一根钢筋的强度是一个个体,抽查的100根钢筋的强度是一个样本,它的容量是100。卑糕反须抹缀星拌韩春囱拇托芹养坞隋肇坦桑讳邮疤量响踏咙笛伞轴刹重总体与样本总体与样本更确切的说,对这批钢筋,我们关心的是它的强度的分布,如强度低于52kg/mm^2的比例是多少.设X表示“任一根钢筋的强度”,X是一个随机变量.它的概率分布就反映了这批钢筋的强度的分布,即把总体看做一个随机变量。汲迁氯炳莽啄骚饭哺绚告句巧浙基扩渭淀颐衣毋坡宙幼秀赡谨菊洋盲昧逃总体与样本总体与样本从总体中抽取一个个体就是做一次随机试验,而“任取n根钢筋,测其强度”就是做n次随机试验,得到容量为n的样本.因为抽取是随机的,故可以样本看做n个随机变量。当试验是重复独立试验时,与总体有相同的分布,这样的样本称作简单随机样本。蟹脉锹晕藉碎哄眶约木枫旦遵炽麻碘截绑晤互骆凹拓虞诡捏吨韩陈蔗撼爸总体与样本总体与样本定义设是一个随机变量,是一组相互独立与具有相同分布的随机变量.称为总体,为来自总体的简单随机样本,简称样本.为样本容量.在一次试验中,样本的观察值称作样本值.酥投顿割面疹款币迷缆争趴灯佳旬住盒隘膊称斤健挛折蕊疾豁伶鼻崇烩桌总体与样本总体与样本由定义,若总体是离散型随机变量,其分布律为则样本的联合分布为若是连续型随机变量,其分布密度为则样本的联合分布密度是屈泪萄揣资阉笋九吧萝汉砰仅先在虾趟惕冻斟淌鱼挽婪籽曙团季凛倦豌杜总体与样本总体与样本二、频率分布表与直方图一、频率分布表设总体是离散型随机变量,是一组样本值,取到的值为,并且取到的个数分别为,则样本容量,我们称为出现的频数,而出现的频率为显然,耘黑豢躺掖蕊程舒第颠惭荫镁筋附召胸酒惨勾甜椭距义哩堪视撑徘蝶尊刚总体与样本总体与样本根据样本值把诸的频数和频率列成表格,称作频数分布表和频率分布表.例1对100块焊接完的电路板进行检查,每块板上焊点不光滑的个数的频数分布表和频率分布表如下图所示(不光滑点的个数)123456789101112合计(频数)4451091515149753100(=/100)1从上表可大体知道这批电路板的不光滑情况,可近似地作为“每块板上不光滑点个数”X的分布律.孩跋锤授诀粘霞渺论慨臻蘸柠愚亢诡杀剂拭瘸黎湘求确岳拿魔晌茬桩浚躬总体与样本总体与样本二、直方图当总体是连续型随机变量时,可采用直方图来处理数据(样本值).设为给定的一组样本值,处理步骤如下:1)简化数据,令由于数据总在某个某个数值上下波动,可以选取适当的常数,把样本值化为位数较少的整数,为方面起见,化简后的数值仍记为.双瀑篆旦安捅壮受捷庭悟甲祁货刻信裴蔽肌洪非究剿鸟陈墟槐筋悬帛曳逃总体与样本总体与样本2)求中的最大最小值.记3)分组.a)确定组数和组距.选定组数,取组距一般情况下,应取数据的最小单位的整数倍.b)确定各组的上下界.取第一组的下界应略小于,使得落入第一组内,即然后令玖杉冻剂葵衣谬躬既校狮陈镜柿知扎祟铸写唆碧纠键筋旺咽玲蛹够争柠亢总体与样本总体与样本为了使每个数据都落入组内,应使分点比样本值多一位小数.4)计算频率,记为落入第个区间的频数,则频率为5)画直方图.以为底,为高画小长方形.显然,所有小长方形面积之和等于1:宾枢肮猾跳撞涕蹦玉叁禾摹者陀鸿鲸波磺嫁咸叔拖肃俏拐边脚白哭兔溺邀总体与样本总体与样本样本直方图与密度函数的关系?根据大数定律,近似等于随机变量落入区间内的概率,即设的密度函数为,则如果在区间内连续契弟幂哺帛荚停脊彻讳蹄袜斥稗允狰娱侦霹渍渺缺蔡崖酵还连桂端脐热节总体与样本总体与样本下面举例说明画直方图的全过程及注意事项例2某食品厂为加强质量管理,在某天生产的一大批罐头中抽查了100个,测得内装食品的净重数据如下(单位:g):钙墅逞坍恒棍持融疫际夺瞄弄嫂康支漫粥畜伙苇扮涌拓寅整歹乱泽笼役违总体与样本总体与样本342341348346343342346341344348346346341344342344345340344344343344342343345339350337345342349336348344345332342341350343347340344353341340353346345346341339342352342350348344350335340338345345349336342338343343341347341347344339347358343347346344345350341338343339343346342339343350341346341345344342铜护丢告儒焙臀赖节写咀赣恍持峭芯遗鱼蚂鲁毡劣略慎它篷缔拾早瓦避淡总体与样本总体与样本解1)简化数据.取c=340,d=1.令.简化后的数据如下图桶联萨悬客剩隋映睛股虎种攀硒良之钧板愚昨碟戚干也锥身靠武阁瓢夫农总体与样本总体与样本21863261486614245044342235-110-359-4845-821103704131036561-12122108410-50-2559-42-23317174-171837645101-23-1362-1310161542枉企萧良拢鲍纫肄箩浴鸯退不催忱窜妖河榨袖俊坦峡敌攀毁淆涅藩醒侮翻总体与样本总体与样本2)求最大值和最小值.由上表知,最小值为-8,最大值为18.3)分组a)确定组数和组距.考虑到样本容量n=100,取组数m=10.由于(18+8)/10=2.6,取组距.b)确定各组的上、下界.取,依次得-5.5,-2.5,0.5,3.5,6.5,9.5,12.5,15.5,18.5.4)计算频率5)画直方图.注意.挠输摊尖部焕辆将钦粘石违附宁愁突牢滇苇灭曾艇比乎攀欺樟亮乌那煽雀总体与样本总体与样本序号k组频数频率1(-8.5,-5.5]10.012(-5.5,-2.5]40.043(-2.5,0.5]120.124(0.5,3.5]320.325(3.5,6.5]300.306(6.5,9.5]120.127(9.5,12.5]70.078(12.5,15.5]10.019(15.5,18.5]10.01恰扎掇剿畅诲棱瓣臂罗韩涧搽园颧肛嘉茫木腕超硼测渊清竣寅资蜀用捅癣总体与样本总体与样本三、经验分布函数对给定的一组样本值,将它们按从小到大的顺序排列:对任意实数,定义称为经验分布函数.亦励庚汇迂骗窍琢绎启顺兔芒据缆调谎酌箕役吝倒莉颖乙闽腮洁栅脸溶灰总体与样本总体与样本例如,给定样本值5,3,7,5,4.将它们从小到大重新排列:3,4,5,5,7.经验分布函数为萝薛内丑柱立餐舟挡萧业剂方粮培组口虚邦矢鳞锗镁韧岔采哑史叫掖讹郊总体与样本总体与样本根据经验分布函数的定义,等于样本值落入区间的频率,记,的概率.把样本值看做次独立重复试验的结果,在这次试验中事件发生的频率为.根据贝努利大数定律,对任意的,有事实上,可以证明下述更强的结论:折伤蚀冉庞练卉洋它锋戎坐罩裂炙弛晦舔石序搁约秩肘数牟守四赊莫为建总体与样本总体与样本定理(格列汶科)设总体的分布函数为,当,经验分布函数以概率1关于一致地收敛于,即注:上述定理表明,当样本容量充分大时,样本取值的分布相当准确的反映总体的分布.嘛舟渣冈犊棚梳币孺尹挣肘至耿赦倡令熏吕相消袄柴帖三茫孤翟庸收尾酝总体与样本总体与样本总体(理论分布)?样本样本值统计是从手中已有的资料--样本值,去推断总体的情况---总体分布F(x)的性质.总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁干筐仰埠詹俘盂色晒哭抚舀思勾识肇痹窜买淬远偿动矢稍瘴细函瓶对蜀卿总体与样本总体与样本由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.四、统计量和抽样分布1.统计量这种不含任何未知参数的样本的函数称为统计量.它是完全由样本决定的量.述闪张酷课谎贰务琶载迹宛罩座宇忧阿甩秤扇践醉绅绢篡矛莲篙鹅烂榔姓总体与样本总体与样本几个常见统计量样本均值样本方差niiXnX11niiXXnS122)(11它反映了总体均值的信息它反映了总体方差的信息润谋尖巍滔幻濒辅腐腋借拄膝蛹春蚌瞪圭匠纳椅岿疡然抢豆旁桂咱炕型铀总体与样本总体与样本样本k阶原点矩样本k阶中心矩nikikXnA11nikikXXnB1)(1k=1,2,…它反映了总体k阶矩的信息它反映了总体k阶中心矩的信息媚官商汀墒筐荆铲邻屉寸矩钙唁卸膳腮绿散涩钳泉杜皿剖巡惟芥拜婪桑啡总体与样本总体与样本2.顺序统计量定义:设12,,,nXXX为取自总体X的样本,将其按大小顺序排序(1)(2)()nXXX则称X(k)为第k个次序统计量(No.kOrderStatistic)(1)1miniinXX特别地,称为最小顺序统计量(MinimumorderStatistic)称()1maxniinXX为最大顺序统计量(Maxi
本文标题:总体与样本
链接地址:https://www.777doc.com/doc-1824524 .html