您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 食品试验设计与统计分析期末复习资料
第一章1.统计学:研究数据的搜集、整理与分析的科学,面对不确定性数据作出科学的推断。因而统计学是认识世界的重要手段。2.食品试验设计与统计分析:数理统计原理与方法在食品科学研究中的应用,是一门应用数学。3.食品试验科学的特点:1.食品原料的广泛性2.生产工艺的多样性3.质量控制的重要性4.不同学科的综合性4.统计学发展概貌:古典记录统计学、近代描述统计学、现代推断统计学。第二章5.总体:根据研究目的确定的研究对象的全体。6.个体:总体中一个独立的研究单位。7.样本:根据一定方法从总体中抽取部分个体组成的集合。8.样本含量n(样本容量):即样本中个体的数目。(n≤30的样本叫小样本,n≥30的样本叫大样本)9.随机样本:总体中的每一个个体都有同等机会被抽取组成样本。10.参数:由总体计算的特征数。11.统计量:由样本计算的特征数。12.参数和统计量的关系:由相应的统计量来估计参数,如样本平均数估计总体平均数,样本标准差估计总体标准差。13.准确性(准确度):在调查或试验中某一实验指标或性状的观测值与真实值接近的程度。(观测值与真实值之间)14.精确性(精确度):在调查或试验中同一实验指标或性状的重复观测值彼此接近的程度。(观测值与观测值之间)15.试样中的误差:随机误差和系统误差。16.随机误差(抽样误差):由许多无法控制的内在和外在偶然因素所造成的误差,不可避免和消除,影响试验的精确性。17.系统误差(片面误差):由于试验对象相差较大,测量的仪器不准、标准试剂未经校正所引起,可以通过改进方法、正确试验设计来避免、消除,影响试验准确性。18.资料的分类:连续性资料:对每个观测值单位使用仪器或试剂等量测手段来测定其某项指标的数值大小而得到的资料。间断性资料:用计数方式得到的数据资料。分类资料:可自然或人为地分为两个或多个不同类别的资料。等级资料:将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得的资料。19.连续性资料的整理:采用组距式分组1.求全距2.确定组数3.求组距4.确定组限和组中值(最小值为下限,最大值为上限。第一组的组中值以接近于或等于资料中最小值为好。)5.制作次数分布表20.统计表的绘制原则:结构简单,层次分明,内容安排合理,重点突出,数据准确,便于理解和分析21.统计表种类:简单表,复合表22.统计图:用图形将统计资料形象化。长条图、圆图、线图、直方图、折线图。23.平均数X:指出资料中数据集中较多的中心位置,描述资料的集中性。反应了总体分布的集中趋势。24.平均数的种类:算术平均数、中数、众数、几何平均数、调和平均数。25.算数平均数计算方法:直接法、加权法26.算数平均数的特性:离均差为0,离均差平方和最小。27.离均差:每个观测值均有一个偏离平均数的度量指标。算术平均数的离均差之和为零。28.离均差平方和:各个离均差平方后相加。29.方差(MS):也称均方,各数据与平均数的差的平方和与自由度的比。样本方差用S2表示。(无单位)30.自由度df:样本内独立而能自由变动的离均差个数。31.标准差:样本方差的算术平方根。(有单位,与观测值单位相同)32.标准差的特性:1.标准差的大小受每个观测值的影响,若数值之间变异大,其离均差亦大,标准差必然大。2.各观测值加或减同一常数,标准差的值不变。3.每个观测值乘以或除以一个不等于0的常数A时,所得标准差是原标准差的A倍或1/A。33.样本标准差:EXCEL用STDEV函数计算。34.变异系数CV:标准差相对于平均数的百分数。反映了总体的可比程度。CV=%100*XS35.变异系数的作用:当资料所带的单位不同或单位虽然相同而平均数相差较大时,不能直接用标准差比较各个样本资料的变异程度大小。消除了不同单位和平均数的影响。第三章36.伯努利试验:只有两种实验结果的随机试验。37.N重伯努利试验:伯努利试验在完全相同的实验条件下独立的重复n次,并作为一个随机试验。38.二项分布xB(n,p):离散型随机变量分布。P(x=k)=knkqpnkC(k=0,1,2,3…,n)39.二项分布的特征1.Pn(K)≥02.(p+q)n=13.在一定范围内的总概率P等于被包含的几个概率之和。4.当p值较小且n不大时,分布是偏倚的。随着n的增大,分布逐渐趋于对称。5.当p值趋于0.5时,分布趋于对称。40.二项分布的应用条件:(1)试验结果为两大类或两种可能的结果。(2)每次试验的条件不变,每次试验A的发生概率均为π。(3)各次试验独立,每个观察单位的观察结果不会影响到其他观察单位的结果。41.二项分布的平均数:=np42.二项分布的方差:2=npq43.泊松分布xP():可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的分布。(即小概率事件分布,意外事故、自然灾害都近似服从)P(x=k)=!kek44.泊松分布特点:离散型随机变量概率分布,均值与方差相等。μ=σ2=λ。45.泊松分布的应用条件:1.随机地发生在单位时间或空间里的稀有事件的概念分布。2.在二项分布中,n很大,p很小时。3.事件不随机时,不能用泊松分布。46.正态分布xN(,2):连续型随机变量的概率分布。47.正态分布的特点:1.正态分布曲线是以均数为中心左右对称的单峰悬钟形曲线。在平均数的左右两侧,只要(x-)绝对值相等,f(x)值就相等。2.f(x)在x=处达到最大值,且f()=1/(σ2)213.f(x)是非负函数,以横轴为渐近线,分布从-∞到+∞,且曲线在±σ处各有一个拐点。4.是位置参数,σ2是形状参数。5.正态分布的次数多数集中于平均数的附近,离均数越远,其相应的次数越少。6.曲线f(x)与横轴之间所围成的面积等于1。48.标准正态分布uN(0,1):=0,σ2=1的正态分布。49.标准正态变量(标准正态离差)u:u=(x-)/σ50.三种分布的关系:1.二项分布,当n很大,np、n(1-p)接近,该分布接近于正态分布。2.在n∞、p0.5时或p>0.1时可用二项分布代替正态分布。3.当n∞、p0,且np=(较小常数)时,用泊松分布代替二项分布。4.当p<0.1且n很大时,用泊松分布代替二项分布。5.泊松分布,≥30时,用正态分布代替。51.抽样分布:统计量的分布概率。52.抽样误差:由随机抽样造成的误差。53.标准误差(标准误,均数标准误):样本平均数抽样总体的标准差。反应精确性的高低,x越大精确度越低。xnx54.t分布:在计算Sx时,由于采用S来代替,使得t变量不再服从标准正态分布,而是服从t分布。t=(x-)/Sx第四章55.统计推断:根据抽样分布规律和概率理论,由样本结果去推断总体特征。主要包括假设检验(显著性检验)和参数估计。56.表面效应:样本平均数与总体平均数的差异。包含两总体平均数的差异(处理效应)(-0)和试验误差。x-0=+-0=(-0)+57.统计假设检验:对研究总体提出假设,然后在此假设下构造合适的检验统计量,并由该统计量的抽样分布计算出样本统计量的概率,再根据概率值的大小作出接受或否定假设的判断。58.无效假设H0:通过检验,可能被接受,也可能被否定。59.备择假设HA:与无效假设相对应的假设。60.进行假设检验的基本依据:把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理。61.显著水平a:决定接受或否定H0的小概率标准。(常用显著水平有0.05和0.01)62.统计假设检验步骤:1.建立假设2.确定显著水平α3.检验计算4.统计推断63.Ⅰ型错误(第一类错误):指当H0本身正确,但通过假设检验后却否定了它,也就是将非真实差异错判为真实差异。犯第一类错误的概率是。(减少Ⅰ型错误,可将显著水平定得小一点。)64.Ⅱ型错误(第二类错误):当H0本身错误时,通过假设检验后却接受了它,也即把真实差异错判为非真实差异。(减少Ⅱ型错误,通常是通过减少均数标准误来减小第二类错误的概率。而均数标准误的减小是通过精密的试验设计、严格的试验操作和增大样本容量来实现的。由于一般来说α大β就小,增大了犯第一类错误的概率时,犯第二类错误的可能性就小。反之,α小,β大。因此在实践中可以根据试验目的,通过调整α的大小来控制检验时犯错误的概率。)65.两尾检验:备择假设中,包含了μμ0和μμ0两种情况,因而这种检验有两个否定域,分别位于样本平均数分布曲线的两尾。66.一尾检验:否定域位于x分布曲线某一尾的统计假设检验。67.选用两尾检验还是一尾检验应根据专业的要求在试验设计时确定。若事先不知道μ与μ0谁大谁小,为了检验两者是否有差异就用两尾检验。如果能凭借专业只是推测μ不会小于(或大于)μ0时,为了检验μ是否大于(或小于)μ0应用一尾检验。68.u检验:在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法。69.u检验使用范围:若样本资料总体方差已知,或样本含量≥30时用u检验。70.假设统计误差中试验误差:随机误差71.统计假设检验中应注意的问题:1.试验要科学设计和正确实施2.选用正确的统计假设检验方法3.正确理解差异显著性的统计意义4.合理建设统计假设,正确计算检验统计量单个样本平均数的假设检验1)单个样本平均数的u检验:某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布N(500,64)(单位,g)。某日随机抽查10瓶罐头,测其净重见表。分析装罐机当日工作是否正常?2)单个样本平均数的t检验:t检验:在假设检验中利用t分布来进行统计量的概率计算的检验方法。两个样本平均数的假设检验:由两个样本平均数之差,去判断这两个样本所在的总体平均数有无显著差异。一、成组资料平均数的假设检验:1)U检验1、如果两个样本资料都服从正态分布,且总体方差21和22已知。2、总体方差未知,但两个样本都是大样本时,平均数差数的分布呈正态分布。编号12345678910净重(g)5055124974935085155024954905102)t检验1.如果两个样本资料都服从正态分布,且21=22时,不论是大样本还是小样本,都有下式服从具有自由度df=n1+n2-2的t分布:212121xxSxxt。二、成对资料平均数的假设检验:72.二项百分率的假设检验1)单个二项百分率的假设检验2)单个二项百分率的假设检验第五章73.方差分析(变量分析):关于观测值变异原因的数量分析。(三个或三个以上水平的分析,小于3个用t检验。)74.试验设计的作用:1.可以分析清楚试验因素对试验指标影响的大小顺序,找出主要因素,抓住主要矛盾2.可以了解试验因素对试验指标影响的规律性3.可以了解试验因素之间相互影响的情况4.可较快地找出优化的生产条件或工艺条件,确定优化方案5.可以正确估计、预测和有效控制、降低试验误差,提高试验精度6.可以明确为寻找更优生产或工艺条件、深入揭示事物内在规律而进一步研究的方向。75.试验指标:根据研究目的而选定的用来衡量或考核试验效果的质量特性。如:考察加热对果胶酶活性的影响,果胶酶活性是试验指标。(单指标试验,多指标试验)76.试验因素:凡对试验指标可能产生影响的原因或要素。如:酱油质量受原料、曲种、发酵时间等的影响,这些都是影响酱油质量的因素。77.因素水平:试验因素所处的某种特定状态或数量等级。如:比较3个大豆品种蛋白质含量高低,这3个品种就是大豆品种这个试验因素的三个水平78.试验处理:事先设计好的实施在实验单位上的一种具体措施或项目。如:单因素试验中,试验因素的一个水平就是一个处理多因素:水平组合79.平方和与自由度分解:设一个试验共有k个处理n个重复,则该试验资料共有nk个观测值,其数据分组如下:80.F值:两个方差之比。F=22/etSS81.F自由度:两个。df1=dft=k-1df2=dfe=k(n-1)82.F检验:用F值出现概率的大小推断两个方差是否
本文标题:食品试验设计与统计分析期末复习资料
链接地址:https://www.777doc.com/doc-3581158 .html