您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 招聘面试 > 第二章资料整理与特征数的计算
试验资料的整理特征数的计算与第二章由调查或试验收集来的原始资料,往往是零乱的,无规律性可循。只有通过统计整理,才能发现其内部的联系和规律性,从而揭示事物的本质。资料整理是进一步统计分析的基础,在生物学试验及调查中,通过对某种具体事物或现象观察获得的结果称为资料。原始数据无序有序统计分析揭示事物本质第一节:试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理对试验资料进行分类是统计归纳的基础。正确地进行资料的分类是资料整理的前提。在调查或试验中,由观察、测量所得的数据按其性质的不同,一般可以分为数量性状资料和质量性状资料两大类。试验资料类型数量性状资料质量性状资料/属性性状资料计数资料/非连续变量资料计量资料/连续变量资料数量性状(quantitativecharacter)是指能够以计数和测量或度量的方式表示其特征的性状。观察测定数量性状而获得的数据就是数量性状资料(dataofquantitativecharacteristics)。数量性状资料的获得有计数和测量两种方式,因而数量性状资料又分为计数资料和计量资料两种。一、数量性状资料1、计数资料指用计数方式获得的数量性状资料。在这类资料中,它的各个观察值只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现,因此各观察值是不连续的,所以该类资料也称为非连续变量资料或间断变量资料或离散变量资料。小麦基本苗数、菌落数、穗数、分孽数等等2、计量资料指用测量或度量法获得的数量性状资料,即用度、量、衡等计量工具直接测定获得的数据资料。其数据是用长度、重量、容积、温度、浓度等来表示,要带单位。这种资料的各个观测值不一定是整数,两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量工具的精确度而定,它们之间的变异是连续性的,因此计量资料也称为连续变量资料。病斑长度、作物产量、株高、土壤水分含量等等二、质量性状资料质量性状(qualitativecharacter)是指能观察到而不能直接测量的性状。观察质量性状而获得的数据就是质量性状资料(dataofqualitativecharacteristics),也称为属性性状资料。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理,其方法有以下两种:1、统计次数法在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。例如,在研究豌豆的花色遗传时,红花与白花杂交,子二代中红花、紫花和白花的株数分类统计如下表。株数频率红花26626.6%紫花49449.4%白花24024.0%总计1000100.0%这种由质量性状数量化得来的资料又叫次数资料。2、评分法对某一质量性状分成不同级别,对不同级别进行评分来表示其性状差异的方法。从而将质量性状进行数量化,以便统计分析。例如,小麦感染锈病的严重程度可划分为0(免疫)、1(高度抵抗)、2(中度抵抗)、3(感染)级;试剂pH值由酸到碱分成14个等级,取待测试剂滴在pH试纸上,与pH标准色版对比,由红到紫分别定义为1-14的数值。两种不同类型的资料相互间是有区别的,但有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。例如:兽医临床化验动物的白细胞总数得到的资料属于计数资料,根据化验的目的,可按白细胞总数过高、正常或过低分为三组,清点各组的次数,计数资料就转化为质量性状次数资料。第一节:试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理调查试验资料搜集的方法资料来源调查和试验。均要求资料完整、准确。(一)调查调查是对已经存在的事情的资料按某种方案进行收集的方法。资料的调查又可以分为两种:普查和抽样调查。1、普查是对研究对象的全部个体逐一进行调查的方法。普查一般要求在一定的时间或范围进行,要求准确和全面。2、抽样调查是根据一定的原则从研究对象中抽取一部分具有代表性的个体进行调查的方法。通过抽样将获得的样本资料进行统计处理,然后利用样本的特征数对总体进行推断。生物学研究中,进行普查的情况较少,多数情况下还是进行抽样调查。随机抽样必须满足2个条件:一是总体中每个个体被抽中的机会是均等的;二是总体中任意一个个体是相互独立的,是否被抽中不受其他个体的影响。二、试验试验是对已有的或没有的事物加以处理的方法。常见的试验设计方法有:对比设计、随机区组设计、平衡不完全区组设计、裂区设计、拉丁方设计、正交设计、正交旋转设计等等。试验设计须遵循的三大原则是:随机、重复和局部控制。第一节:试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理三、试验资料的整理(一)原始资料的检查与核对调查试验原始数据核对:数据本身是否有错误检查:取样是否有差错订正:不合理数据的订正检查和核对原始资料的目的:确保原始资料的完整性和正确性。完整性:是指原始资料无遗缺或重复。正确性:是指原始资料的测量和记载无差错或未进行不合理的归并。检查中要特别注意特大、特小和异常数据(可结合专业知识作出判断)。对于有重复、异常或遗漏的资料,应予以删除或补齐;对有错误、相互矛盾的资料应进行更正,必要时进行复查或重新试验。不必分组,直接进行统计分析小样本n30将数据分成若干组以便统计分析大样本n≥30次数分布表次数分布图统计分析样本大小三、试验资料的整理(二)次数分布表统计表的结构和要求:结构简单,层次分明,安排合理,重点突出,数据准确。总横标目(或空白)纵标目1纵标目2……横标目1横标目2数字资料……表号标题1、标题简明扼要、准确地说明表的内容,有时须注明时间、地点。2、标目标目分横标目和纵标目两项。横标目列在表的左侧,纵标目列在表的上端,标目需注明计算单位,如%、kg、cm等等。3、数字一律用阿拉伯数字,数字以小数点对齐,小数位数一致,无数字的用“─”表示,数字是“0”的,则填写“0”。4、线条多用三线表,上下两条边线略粗。三、试验资料的整理1计数资料的整理计数资料基本上采用单项式分组法进行整理。特点:用样本变量自然值进行分组,每组用一个或几个变量值来表示。151712141314121114131614141317151414161414151514141411131214131413151413151413141516161413141513151315151514141614151713161416151314141414161213121412151615161413151714131412171415表2-1100只来亨鸡每月的产蛋数11~17来亨鸡每月产蛋数变动范围:分为7组统计各组次数计算频率和累积频率制表每月产蛋数次数频率累积频率FrequencyPercentCumulativePercent1120.020.021270.070.0913190.190.2814350.350.6315210.210.8416110.110.951750.051.00表2-2100只来亨鸡每月产蛋数次数分布表1自然值进行分组,最大值17,最小值11。2数据主要集中在14,向两侧分布逐渐减少。表2-3小麦品种300个麦穗穗粒数的次数分布表每穗粒数次数频率累积频率FrequencyPercentCumulativePercent18-2230.01000.010023-27180.06000.070028-32380.12670.196733-37510.17000.366738-42680.22670.593443-47530.17660.770048-52410.13670.906753-57220.07330.980058-6260.02001.0000三、试验资料的整理2计量资料的整理计量资料一般采用组距式分组法。全距组数组距组限归组制表表2-4150尾鲢鱼体长(cm)564962784147654558555965696273525260516278664558586057525148564658707276775666585855535065635765855958546248634661625738585254556652485675725737467656637565485255546271486258465738545365428366485358464626367655605458495256826365547565864677706940565861545352435264585854785256615954596468515968635263(1)求全距,又称极差(range):R=Xmax-Xmin=85-37=48(cm)(2)确定组数和组距(classboundary)组数是根据样本观测数的多少及组距的大小来确定的,同时考虑到对资料要求的精确度以及进一步计算是否方便。组数组距多小统计数精确,计算不方便少大统计数不精确,计算方便组数的确定样本容量分组数30~605~860~1007~10100~2009~12200~50010~1850015~30表2-5样本容量与分组数的关系组距的确定即每组内的上下限范围。组距=全距/组数=48/10=4.85cm(3)确定组限(classlimit)和组中值(classmidvalue)组限是指每个组变量值的起止界限。上限下限组中值是两个组限的中间值。组中值=下限+上限2=组距2下限+=组距2上限-第一组的组中值最好接近于资料的最小值表2-4150尾鲢鱼体长(cm)564962784147654558555965696273525260516278664558586057525148564658707276775666585855535065635765855958546248634661625738585254556652485675725737467656637565485255546271486258465738545365428366485358464626367655605458495256826365547565864677706940565861545352435264585854785256615954596468515968635263最小一组的下限必须小于资料中的最小值,最大一组的上限必须大于资料中的最大值;组限可取到10分位或5分位上;临界值就高不就低。35~,40~,45~,…,85~。(4)分组确定好组数和各组上下限后,可按原始资料中各观测值的次序,将各个数值归于各组,计算各组的观测数次数、频率、累积频率,制成一个次数分布表。计数的方法卡片法唱票法画“正”字画“”组限组中值次数频率累积频率FrequencyPercentCumulativePercent35~37.530.02000.020040~42.540.02670.046745~47.5170.11330.160050~52.5280.18670.346755~57.5400.26660.613360~62.5250.16670.780065~67.5170.11330.897370~72.560.04000.933375~77.570.04670.980080~82.520.01330.993385~87.510.00671.0000表2-6150尾鲢鱼体长的次数分布表三、试验资料的整理(三)次数分布图和频率分布图定义:把次数(频率)分布资料画成统计图形。特点:直观、形象包括:条形图、直方图、多边形图、饼图和散点图三、试验资料的整理统计图绘制的基本要求:(1)标题简明扼要,列于图的下方;(2)纵、横两轴应有刻度,注明单位;(3)横轴由左至右,纵轴由下而上,数值由小到大;图形长宽比例约5:4或6:5;(4)图中需用不同颜色或线条代表不同事物时,应有图例说明。051015202530354011121314151617图2.1月产蛋数次数分布柱形图00.050.10.150.20.250.30.350.411121314151617图2.2
本文标题:第二章资料整理与特征数的计算
链接地址:https://www.777doc.com/doc-3178158 .html