您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 连续随机变量近似服从正态分布
第十章统计思想及其应用主讲:王超重点内容•名词:(本章一般考概念较少)–总体、样本、随机抽样、抽样检验•统计基本内容理解:–概率和随机变量–变异的类型–相关分析–随机抽样和抽样检验•记忆:过程能力评级•计算:过程能力指数控制图的应用程序及计算第一节统计基础•1、数据的类型:–a计量数据:带有小数,变量为连续变量–b计数数据:不带小数,变量为离散变量•可分为计件数据和计点数据–长度、合格品数、重量、缺陷数、化学成分、气泡数哪些是计量数据,哪些是计数数据?•2、总体和样本–总体:是指在某一次统计分析中研究对象的全体。个体、单位总体容量N表示如:研究一批产品的质量–样本:是从总体中随机抽取出来并且要对它进行详细研究分析的一部分个体。样本单位样本容量n表示–如:从4567四个数中随机抽取两个数。第一节统计基础•3、概率和随机变量–(1)概率:–如从4567四个数中随机抽取两个数。–重复抽样可能出现:不重复抽样可能出现:可能事件均值可能事件均值可能事件均值可能事件均值4,445,44.56,457,45.54,54.55,556,55.57,564,655,65.56,667,66.54,75.55,766,76.57,77第一节统计基础–在一定条件下,不总是出现相同结果的现象称为随机现象–罗列出所有可能发生的基本结果为样本点–所有可能样本点的集合称为样本空间–某些样本点的集合称为随机事件。如:所有均值为5.5的样本点构成一个随机事件。–一个随机事件A发生的可能性大小称为概率–用P(A)表示。如均值为5.5的事件发生的概率为4/16=25%–因此某零件随机抽取,重复检验了n个,其中k个合格,则合格品的概率是?–也可以用fn(A)=k/n第一节统计基础•(2)随机变量–离散随机变量特定数值有限个点或可列个点–如均值为5的事件概率,该事件均值是变量,5是变量值–连续随机变量特定数值无限个,不可列–如电视机寿命不超过10000小时的概率–离散随机变量和连续随机变量是由随机变量所代表的特定数值决定的。第一节统计基础•3、随机变量的分布–概率分布是指随机变量在总体中(样本空间中)的取值与其发生概率二者关系的数据模型。–如:电视机寿命不超过10000小时的概率均值44.555.566.57概率1/161/83/161/43/161/81/161/43/161/81/1644.555.566.5710000第一节统计基础–离散随机变量一般分布:二项分布、泊松分布、超几何分布等。–连续随机变量一般分布:均匀分布、正态分布、对数正态分布等–如果样本量足够大,则无论离散、连续随机变量近似服从正态分布。第一节统计基础•4、正态分布的特点:–a正态分布概率密度函数曲线是对称的、单峰的钟形曲线。–b任何一个正态分布仅由均值μ和标准偏差σ这两个参数完全确定;μ确定中心位置,称为位置参数,σ决定分布曲线的形状,称为形状参数;σ越小,曲线越陡,数据离散程度越小,σ越大,曲线越扁平,数据离散程度越大。–c正态分布曲线下面的面积,是随机变量在相应区间取值的概率,或者说总体中有多大比例的数值落在相应的区间范围内。第一节统计基础1/43/161/81/1644.555.566.57第一节统计基础•5、常用统计参数•均值:•中位数:大小排序,在最中间的数–如:2、5、7、8、8中位数7–42、42、43、45、46、46中位数(43+45)/2=44•标准差:总体:样本:•极差R=最大值-最小值niixnx11NXNii12)(1)(12nxxsnii第一节统计基础•例:一总体为2、5、7、8、8,计算均值、中位数、标准差和极差?第二节统计思想和变异理论–变异是在过程运行中,任何与目标或规范要求不一致的变化,也称波动。–如:包装100克±1克某一天后〉=104克为变异•1、变异的来源:–变异来源于过程,过程中变异来源有多种,一般为5M1E:即原材料工具、机器、操作者、环境、测量•2、变异的类型:休哈特认为:–a伴有“不可避免的随机变异”的稳定过程–b伴有“可确定原因引起的变异”的不稳定过程第二节统计思想和变异理论–戴明认为:变异分为一般原因和特殊原因变异–(1)一般原因变异:一个过程中始终存在的、非人力可控的而成为过程的固有组成部分的那些变异因素–一般占变异的80-95%–一般原因是由系统设计导致的,随机出现的–由一般原因支配过程为受控过程、系统为稳定系统–(2)特殊原因变异:除一般原因之外的引起过程变异的那些因素–特殊原因产生于外部,不是随机出现的,可以用统计方法检测并纠正第二节统计思想和变异理论•3、管理者可能会犯的两个根本性错误:–a针对所有的实际上是由一般原因引起的瑕疵、抱怨、差错、故障、事故或短缺等质量问题,像特殊原因那样处理。–b针对所有的实际上是由特殊原因引起的瑕疵、抱怨、差错、故障、事故或短缺等质量问题原因归因于一般原因。第二节统计思想和变异理论•4、统计思想在组织管理中的运用领域:–a组织层次:了解系统、找到关键过程、评估绩效、组织改进–b过程层次:使过程标准化、找到变异,分析原因。–c单体或个人层次:用数据识别变异、识别指标和改进机会第三节常用统计技术和方法–统计技术和方法分为:描述性统计、统计推测和推测统计(预测)•1、描述性统计–描述性统计:是有效的收集、组织和描述数据的统计方法。–图示:频数分布图直方图–指标:集中趋势:均值、中位数、比例离散趋势:极值、标准差、偏差第三节常用统计技术和方法•2、统计推断:–统计推断是一个过程,它根据从总体中抽取的数据、获得关于总体未知特征的结论。–包括:参数估计、假设检验和试验设计–a参数估计:即根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。•有点估计和区间估计•点估计方法:矩估计法、最大似然估计法、最小二乘法、贝叶斯估计法•区间估计方法:抽样分布、区间估计与假设检验、大样本理论第三节常用统计技术和方法–b假设检验:•真实情况为H0成立,而判断H0不成立,犯“以真为假”错误•真实情况为H0不成立,而判断H0成立,犯“以假为真”错误–检验方法:最主要的是似然比法•U检验:如果总体服从正态分布、方差已知,检验均值•t检验:总体正态分布,方差未知,检验均值•F检验:两总体正态分布,方差是否相等第三节常用统计技术和方法–检验原则:•最大功效准则、•无偏性准则、•容许检验、•同变检验、•贝叶斯检验•最小化最大检验–c实验设计:•遵循原则:随机化、局部控制、重复•方法:区组设计、析因设计、部分实施法第三节常用统计技术和方法•3、预测性统计–预测性统计:即基于过去的数据来预测未来的统计过程。–方法:•相关分析:相关系数r(线形),越大越相关•回归分析:一元回归、多元回归、多重回归第四节抽样技术和抽样检验•1、随机抽样–随机抽样:即从总体中随机抽取一定数目的个体单位作为样本进行观察,使每个个体单位都有一定的概率被选入样本,从而使根据样本所做出的结论对总体具有充分的代表性。–随机抽样的方法:•a简单随机抽样•b分层随机抽样先分层,每层等比例抽样•c等距随机抽样•d整群随机抽样先分群,对群随机抽样第四节抽样技术和抽样检验•例:某工厂有3个车间,生产产品量甲车间50000件,乙车间30000件、丙车间20000件,现用分层方法抽取1000件判断合格品率,怎样抽?•某工人10天分别生产产品40、60、50、45、55、50、60、40、50、50,现用整群抽样随机抽取150个左右的产品检验该工人产品合格品率?第四节抽样技术和抽样检验–抽样误差:•误差分为抽样误差和系统误差(非抽样误差)•抽样误差一直存在,•系统误差可以消除:•系统误差来源:偏向、非可比数据、不加鉴别的趋势估计、因果关系、不恰当的抽样第四节抽样技术和抽样检验•2、抽样检验–抽样检验是指按照一定的方案,从一批产品中随机抽取样本进行检验,根据样本的检验结果判断该批产品是否合格,并由此判定该批产品是接受还是拒收的验收方法。–抽样检验有三个参数:(N,n,A)–交验数量N(总体)、样本量n(样本)、合格与否数A–如果不合格数dA,产品不合格–如果不合格数d≤A,产品合格第四节抽样技术和抽样检验•例:灯泡厂从1000箱灯泡中抽取100箱检查,每箱100个灯泡,一共有10箱100个灯泡不合格。现用抽查的不合格灯泡比率代表这些产品的不合格品率,求这些灯泡的合格率?第四节抽样技术和抽样检验•3、抽样检验的特点(优缺点):–优点:•a节约了检验费用•b适用于破坏性测试•c所需要的检验人员较少•d由于拒收的是整批产品,而不是仅仅退回不合格品,因此能更有力的促进产品质量的提高–缺点:•a存在接受“劣质”批和拒收“优质”批的风险•b增加了计划的工作量•c样本所提供的产品信息一般少于全数检验第四节抽样技术和抽样检验•4、抽样检验的类型:–按数据类型•计数抽样检验:离散量•计量抽样检验:连续量–按样本量获得方法•一次抽样、二次抽样、多次抽样、序贯型抽样–抽样方式•标准型、选择型、调整型、连续型抽样检验第四节抽样技术和抽样检验–5、抽样特性曲线(OC曲线):是指一个抽样检验方案(N,n,A)确定后,产品批的接受(确定产品批为合格)概率L(p)与产品批的实际质量水平(合格率p)间的关系曲线。如果不合格品率达到p1(40%)时,这批产品不合格,其接受为合格的概率为L(p1)=β(1%)如果不合格品率达到p0(5%)时,这批产品尽量合格,其拒收概率为1-L(p0)=α(5%)0p0p1100p(%)1L(p)ABβα第四节抽样技术和抽样检验–Oc曲线上的两类错误和风险•当批质量水平(如不合格品率达到5%)可接受时,存在拒收概率1-L(p)=α(5%),这个风险由生产方承担,所以A点为生产方风险点•当批质量水平(如不合格品率达到40%)不满意时,存在接受为合格的概率L(p)=β(1%),这个风险由使用方承担,所以B点为使用方风险点第五节过程能力–1、过程能力:是指一个过程处于稳定状态时,也就是当操作者、机器、设备、原材料、方法和环境(5M1E)等因素处于标准条件下,过程所具有的加工精度和加工能力。–产品质量特性的波动幅度一般用标准差的6倍来表示,过程能力:B=6σ(六西格玛管理)•2、过程能力研究的程序:5M1E–a选择一个有代表性的机器或过程环节(工序)–b确定过程的相关条件(环境)(样本量≥100个)–c选择一个有代表性的操作者–d提供达到标准等级的原材料–e制定所用的计量与测量方法(频数分布图或控制图)–f提供记录测量值和条件的方法(设备)第五节过程能力•3、过程能力指数:CP=T/6σ≈T/6S–T:产品规范确定的容差范围–σ:过程标准偏差S:样本标准偏差–CP值越高代表不合格品率越低,见表10.6p256–计算:4种状况–(1)当样本均值和总体均值相等时,双侧容差。–例:某零件质量要求20±0.15mm,抽样100件,测得样本均值x20mm,S=0.05mm,计算过程能力指数?–CP=T/6S=0.3/6*0.05=1第五节过程能力–(2)当样本均值和总体均值不相等时,双侧容差。–例:某零件质量要求20±0.15mm,抽样100件,测得样本均值x20.05mm,S=0.05mm,计算过程能力指数?–CP=(T-2ε)/6S=(0.3-2*0.05)/6*0.05=0.67–(3)单侧容差,存在容差上限–例:某零件清洁度要求不大于96mg,抽样得样本均值48mg,S=12mg–CP=(Tu-x)/3S=(96-48)/3*12=1.33第五节过程能力–(4)单侧容差,存在容差下限–例:某零件抗拉强度不少于32kg/cm2,抽样得样本均值38kg/cm2,S=1.8kg/cm2–CP=(x-TL)/3S=(38-32)/3*1.8=1.11–例:1、某零件尺寸要求30±0.023,抽样测得样本均值29.997mm,S=0.007mm,计算过程能力指数?例2、某零件直径要求50±0.05mm,抽样100件,测得样本均值50mm,S=0.014mm,计算
本文标题:连续随机变量近似服从正态分布
链接地址:https://www.777doc.com/doc-4053590 .html