您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 实验设计-第一讲-实验设计-统计学基础
实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室第一讲统计学基础实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室主要内容1、统计基本术语2、概率论基础3、抽样分布实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.1基本术语实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.1.1总体和样本1、总体某项试验研究的具体对象的全体称为总体,是由许多客观存在的的具有某种共同性质的总体单元所构成的集合体。构成总体的每个单元称为个体。对个体的某种性状加以考察(如称量、度量、计数或分析实验)所得的数值,称为观测值。总体所包含的个体数目(N)称为总体容量。总体具有三个特征:同质性、突异性、大量性。实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室2、样本从总体中抽取一部分个体所组成的集合称为样本。样本所包含的个体数目称为样本容量,记作n。n≥30:大样本;n≤30:小样本。样本的要求:对总体具有代表性。这要求抽样要满足随机取样的要求:等可能性,独立性。实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.1.2误差在一定条件下某客体物所具有的真实数值即为真值。由于受测定过程中许多偶然因素或人为因素的影响,对该客体物进行量测所得到的观测值与其真值之间会有一定的偏差,即误差。任何试验结果都具有误差,在一切科学实验过程中自始至终存在误差,这称为误差公理。根据误差产生原因的可知性,误差分为系统误差和随机误差两类。实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室A、系统误差系统误差是由某种确定的原因所引起的误差。其特点是在相同条件下重复测定时,以相同的大小和正负性重复出现,系统误差是可以测定并校正或消除的。系统误差的来源:方法误差、仪器误差、试剂误差、试剂误差、操作误差。系统误差是重复地以固定形式出现的,因此不能通过增加重复测定次数加以消除。对于分析测试中的系统误差可以通过对照实验、空白试验、校准仪器等办法校正。实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室B、随机误差随机误差又叫偶然误差,是由很多不可避免且无法控制的偶然因素引起的误差。随机误差的特点是:产生原因不确定,其误差大小无规律性,有时大有时小,有时正有时负,不具“单向性”或“重现性”。随机误差只能通过在同样条件下对同一试样进行多次测定,并利用数理统计方法对试验数据进行分析处理来降低。实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室C、错误在试验过程中由于工作出错造成的观测值与真值的差异,称为疏失误差,也称为错误。错误与误差是两个完全不同的概念。一组重复观测值中往往有个别数据与其他数据相差较大,这一数据称为可疑值或极端值,也叫离群值。如是由明显的过失造成,即为错误值,否则需经统计假设检验决定取舍。分析CODcr测定中可能出现误差的种类。实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.1.3准确性与精确性准确性是指观测对象的观测值与其真值的偏离程度,偏离越小则试验越准确。精确性是指同一观测对象的重复观测值之间的彼此相符程度,即试验误差的大小,误差越小则试验越精确。准确性与精确性是不同的概念。准确性表示观测值与真值的相符程度,精确性表示重复观测值间的变异程度。由于一般实验中真值为未知数,所以实验的准确性难以确定。精确性一般是指试验误差,是可以估计的。如何正确估计试验误差,并减少实验误差以提高实验精度是试验方法设计所要解决的核心问题。(分析书中表1.1-1)实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.1.4统计特征数原始资料数据在未加整理前,往往是一堆杂乱无章的数据,无法从中找出规律,需对之进行初步整理。初步整理的基本方法是编制次数分布表或次数分布图(针对大样本)。编制方法详见书中示例。经过初步整理后,可直观地了解样本分布的规律,如变异幅度、集中位置、分布的对称性等情况。在统计分析中,还需要了解表征数据资料的集中趋势或变异程度的一些统计指标值,即统计特征数。实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室A、表征数据资料集中趋势1、平均数算术平均数x几何平均数G调和平均数H2、中位数Me3、众数Mo实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室B、表征数据资料变异程度1、极差R2、方差离均差平方和SS样本方差S2总体方差σ23、标准差样本标准差S总体标准差σ4、变异系数CV实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室下一节课继续…….实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.2概率论基础概率论是研究从大量的试验数据(或偶然现象)中找出规律的方法,是试验统计分析的基础。研究内容:从样本统计数推断总体参数的方法及其可靠性;多个处理之间的差异原因分析;变量之间关系推定;变量之间关系的密切程度分析。实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.2.1随机事件与概率1、随机事件必然事件、不可能事件、随机事件个别随机事件的出现事有偶然性,似乎没有规律可循,但通过大量重复的独立实验,对随机事件进行观测并进行统计分析,可以发现随机事件的发生是有一定规律性的。2、频率与概率次数少——频率次数无限多——概率实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.2.2概率分布随机事件——随机变量随机变量取得不同值的概率是不同的,概率分布就是讨论随机变量的总体分布情况,即探讨某一随机变量可以取哪些值以及取得这些值的概率有多大。1、离散性随机变量的概率分布分布律实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室2、连续性随机变量的概率分布连续性随机变量借鉴次数分布表和次数分布图方式的方法,使组距趋于无穷小,绘成频率密度曲线f(x)。F(x)——X的分布函数,反映了随机变量X的取值落在(-∞,x)的概率。xdxxfxF)()(实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.2.3正态分布分布曲线中间高两头低,以平均数为中心左右对称。22121)σμx(eσπf(x)标准正态分布2221)(ueufxu其中实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室特殊区间u0.01=2.58u0.05=1.96实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.3抽样分布由样本的统计数来推断总体相应的参数,是最基本的统计方法。从特定总体中按一定容量随机抽取所有可能的样本,这些样本的某种统计数将组成新的总体,其概率分布称为抽样分布。实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.3.1样本平均数分布从总体中随机抽取容量为n的所有可能样本,这些样本的平均数将构成新的总体,其分布称为样本平均数分布。nxx22实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.3.2样本平均数差数的分布从A、B两个总体中,分别抽取容量为n1、n2的所有可能样本,所得到的两类样本的平均数之差,构成样本平均数差数分布。2221212212121nnxxxx实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.3.3t分布xsuxt实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.3.4x2(卡方)分布222)1(sn实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室1.3.5F分布2221SSF实验设计方法____第一讲广东工业大学环境科学与工程学院_____环境科学教研室课后练习及预习1、熟悉科学计算器的统计功能的调用:查阅说明书,学会数据组的输入、求平方和、求和、样本容量、平均数、总体标准差、样本标准差、方差、离均差平方和。2、熟悉EXCEL关于数据分析功能的调用,完成第一章所有例题。3、完成课后习题一中所有习题。上交电子作业(15环科X班学号姓名习题一)。2、预习第二章:统计假设检验。
本文标题:实验设计-第一讲-实验设计-统计学基础
链接地址:https://www.777doc.com/doc-6987547 .html