您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 概率、信息描述与抽样推断小结
概率与正态曲线1.研究随机性和规律性的两个例子1)20世纪50年代,小儿麻痹症育苗的研究。实验组(疫苗)20万56对照组(安慰剂)20万138问题是:56和138之间的差别是否超过了随机性所能解释的范围。2)1970,美国越战的征兵1183366305931/71/114/98/631/1210011073问题是:73和110之间的差别是否超过了随机性所能解释的范围。思考题拧松水龙头,让其刚好到只有水滴下来,计算并记录15分钟内每个20秒里的水滴数。利用你的数据,请说出该水滴在什么方面是随机的?什么方面又是有规律的?1)随机性和规律性是统计学的两个重要概念。规律性本身包含着随机性。统计可以定义为在随机性中寻找规律性,当两种规律之间的差异超出了随机性本身的影响(或者解释范围),变化趋势就发生了。2)概率为我们从数据中得出结论提供了基础,统计学家利用概率判断数据间的差异是否超出了随机性本身的影响。3)统计很少对总体进行直接的研究,都是通过对具有代表性的样本的研究,来对总体的信息进行推断。一、概率论发展简史1.概率论的起源Pascal(1623~1662)Fermat,(1601-1665)1654年,赌金分配问题赌金分配问题梅雷说:有一次他与某赌友(代称为A先生)掷骰子时,各押32个金币为赌注,双方约定如果谁先赢得3局,就可以把赌金全部拿走,但因为梅雷临时有事,所以赌局不得不中途中断。此时梅雷已经赢得2局,而A先生只赢1局,如何公平分配赌金??起点费马:情况1234胜者梅雷、梅雷梅雷、AA、梅雷A、A帕斯卡尔:1655年,荷兰数学家惠更斯(ChristopherHuygens)访问巴黎时,了解到帕斯卡尔与费马的通信研究,对这类问题产生兴趣,后来,他撰写《骰子游戏》(DiceGame,1657)来探讨机率问题的原理,其中包含许多习题,被许多人认为是机率史上第一本教科书。提出了期望的概念。1713年,瑞士数学家伯努利(JacobBernoulli,1654—1705)出版了《猜度术》一书,提出了大数定理。1765年,法国数学家棣莫弗(A.DeMoivre,1667—1754)的《机会的学说》一书出版,1733年就发现了正态曲线,以及论述了不存在运气。1933年,俄罗斯数学家科尔莫戈罗夫(1903—1987)以德文出版的经典性著作《概率论基础》,标志着概率论的公理化完成,这就是我们现在看到的概率论的情形。2.概率论专有名词随机实验(Randomtrial):满足如下三个条件就可以称之为随机实验:(1)在同一条件下可无限次重复;(2)实验结果有多个,且不确定;(3)事前不知实验结果(outcome)。抛硬币基本事件(Elementaryevent):一次随机实验的可能结果,称为基本事件或者基本随机事件。若随机实验E是“抛两次硬币”,其基本事件就是“+、—”,“+、+”,“—,—”,“—,+”。样本空间(Samplespace):所有基本事件所组成的集合,称为样本空间或基本空间。接上例,其样本空间就是集合{“+、—”,“+、+”,“—,—”,“—,+”}。随机事件(Randomevent):简称事件,指一些由基本事件所组成的集合。例如,接上例,事件“两次出现相同面”,就有两个基本事件组成:+、+”,“—,—”。不相容事件(Mutuallyexclusiveevents):在随机试验中,不能同时发生或其交集为空集的几个事件,称为不相容事件。反之为相容事件接上例,事件“两次同时出现正面”和“两次同时出现反面”就是不相容事件。“至少出现一次正面”和“至少出现反面”就是两个相容事件3.概率的含义概率(Probability)是一个0到1之间的数,描述了一个事件发生的经常程度。小概率(接近于0)的事件很少发生,而大概率(接近于1)的事件则经常发生。概率对统计的意义:对于统计,概率告诉我们,在样本数据的基础上,如果试验重复多次,各种结果发生的经常程度是多大。.501不可能必然4.获得概率的基本方法利用机会均等法则(Equalitylikelyapproach)使用相对频次(Relativefrequency)的方法利用主观概率(Subjectiveapproach)4.1利用机会均等法则如果试验有n种可能的结果,使某特定事件出现的结果数量为k,那么(k/n)就是出现该事件的概率。思考题:一副扑克52张(大、小王去掉),洗均匀,随机取一张牌,那么该张牌是梅花的概率是多少?kn要注意两点:(1)分清楚你求解问题中什么是你的n,什么是你的k。(2)其实我们在这样做的时候,就已经接受了两个前提假设:a)实验的可能结果是已知的;b)由于对称性,每一个结果的可能性都是相同的。往往这两个前提假设不一定满足.思考题再求以下问题的概率中,以上的哪个前提假设不满足:1)一场赛马比赛,有6匹马,求某一匹马胜出的概率。2)求解生男孩和女孩的概率1——4讲小结一、霍桑实验中的群体实验这个实验的目的就是要看看,当每个工人的工作情况不但与自己的报酬、而且与同伴的报酬紧密关联时,工人会如何办?怎样协作?实验条件:(1)人员:14名男职工,其中9名绕线工,3名是焊接工,2名检验工;(2)计件工作制度,但却不是按个人的产量计酬,而是按集体的总产量计酬;报酬由厂方直接支付给个人,而不是交由小组自行分配。这样,工人完成的工作数额,不但决定着自己的工资,而且直接影响着一起干活的同事们的收入。。实验结果:工人每天只完成了6000~6600个焊接点(标准每个工人应该完成7312个焊接点),且天天如此。为什么?解释1:可能是这些工人的智力或者动作协调性有问题。再做研究,研究测试结果否定了这一解释。合理的解释:工人们自动限制产量的理由是,如果他们过分努力地工作,就可能造成群体内同伴的失业,或者公司会制定出更高的生产定额来。所以群体会迫使其中的个体进行一致限产。也就是工人会受到非正式组织的影响。证实在工人当中存在着一种非正式的组织,而且这种非正式的组织对工人的生产率有着极其重要的影响总结一下该研究的研究过程不支持支持提出假设数据分析假设成为一种假说,进而为理论数据支持假设么?理论研究(产生方式)2通过实验或其他方式收集数据二、变量(variable)变量简单的说就是事物的特征或者属性。研究者在研究项目开始的时候,就要确定他们所要研究的变量是什么。变量的值(value)通常是对某一个特定单位的度量,这种单位常常被视为一个个体(element)。什么是个体取决于你的研究问题。2-1变量的测量层次1)思考题:请回答以下收集到的数据,可以进行“、”,“+、—”,“*,/”中的哪些运算?(1)五个人的性别:1,0,0,1,1(1:男性;0:女性)(2)五个人的身高:170,173,165,180,161(单位:厘米)(3)七天的气温(摄氏温度℃):15,24,27,18,34,30,19。(4)五个人对一项政策满意程度的评分:5,3,3,4,2(1:十分不满意;2:不满意;3:一般或中立;4:满意;5:十分满意)2)思考题:(1)我们用一个量表测量人们对一项法律的态度,如果1表示不赞成,2表示无所谓,3表示赞成,对于3个人我们测得的值分别为:3、1、2,这些数据为_____数据。(2)测量10个大学生所在的年级,如果用1表示大一、2表示大二、3表示大三、4表示大四、5表示其他。测量的值为:1、3、4、1、2、3、2、1、1、4,这些数据为________数据。(3)测得5个人的第一次结婚年龄(单位:周岁)为:20、22、24、30和26,这些数据为_____数据。三、频数分布数列1.统计分组后,每个组分配的总体单位数称为频数或次数(f)。频数/总体单位总数=频率。2.意义整理了杂乱无章的数据,同时显示出一批数的分布情况,是数理统计学中随机变量及其概论分布概念在实际中的应用。例1家庭所拥有的电视机数对于广告行业来说是一个重要的信息,下面的数据是随机抽取的50户家庭中每个家庭所拥有的电视机数。111263342432152136223114322223031212311332113151你能从中发现什么?电视机数频次频率010.021160.322140.283120.24430.06520.04620.04思考题:(1)如果要让你去获取你所在楼层的家庭拥有的电视机数量的分布,你怎么去获取??(2)如果要让你去获取广州市家庭拥有的电视机数量的分布,你怎么去获取??四、集中趋势分析集中趋势是数据分布的中心,描述集中趋势的指标有算术平均数()、几何平均数()、中位数()、众数()等。MeoMxG众数中位数平均数位置平均数数值平均数算术平均数调和平均数几何平均数1.平均数的分类2.算术平均数的计算公式算术平均数1.简单算术平均数:假定变量X有N个观察值:X1,X2,X3,…XN,那么它的平均数的计算公式是:2.加权算术平均数:12nXXXXXnnffXffffffkkk212211XXXX例1:应用条件:资料未分组,各组出现的次数都是1。5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为:=73(分)分平均成绩73536558253649075x例2:某车间20名工人加工某种零件资料:按日产量分组(件)x工人数(人)f日产总量xf14228154601681281758518118合计20319件平均日产量1620319x=16(件)1)概念调和平均数是变量值倒数的算术平均数的倒数,故又称倒数平均数。调和平均数是算术平均数的一种,它是根据变量值的倒数计算的。3.调和平均数及计算公式原来只是计算时使用了不同的数据!(1)简单调和平均数123111111nniinnHXXXXX2)调和平均数的计算公式某日三种蔬菜的销售数据蔬菜名称平均价格(元/kg)xi销售额(元)mi销售量(公斤)xi/mi甲乙丙1.200.500.801800012500640015000250008000合计—3690048000例1.某蔬菜市场三种蔬菜的日销售数据如表,计算三种蔬菜该日的平均价格。iiim369000.769m48000xmH(元)(2)加权调和平均数12312311231nnniininiimmmmmHmmmmmXXXXX例2.设某公司下属三个部门的销售资料如下表,若缺少销售额资料而有利润额资料,如下表某公司下属三个部门销售情况部门销售利润率(%)利润额(万元)xmABC12107120200105合计-425则三个部门的平均利润率可以用各部门利润额除以销售利润率得到销售额,然后用各部门利润之和除以总销售额,便可得到平均利润率。其计算公式:%44.94500425%7105%10200%121201052001201mxmH【例3】水果甲级每元1公斤,乙级每元1.5公斤,丙级每元2公斤。问:(1)若各买1公斤,平均每元可买多少公斤?(2)各买6.5公斤,平均每元可买多少公斤?(3)甲级3公斤,乙级2公斤,丙级1公斤,平均每元可买多少公斤?(4)甲乙丙三级各买1元,每元可买几公斤?【例4】自行车赛时速:甲30公里/小时,乙28公里/小时,丙20公里/小时,全程200公里,问三人平均时速是多少?若甲乙丙三人各骑车2小时,平均时速是多少?调和平均数(例题分析)【例3】解(1)(2))/(38.11667.23215.11113n1nH元公斤6.56.56.519.51.38(/)111114.08336.56.56.511.52mHmx公斤元【例3】解(3)(4)32161.24(/)11114.8332111.52mHmx公斤元元)(公斤/5.1325.11nxx
本文标题:概率、信息描述与抽样推断小结
链接地址:https://www.777doc.com/doc-419230 .html