您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 交通运输 > 生物统计附试验设计第二章资料的整理(2017)
第二章资料的整理第一节资料的分类第二节资料的整理第三节常用统计表与统计图第一节资料的分类•—数量性状资料(dataofquantitativecharacteristics)•—质量性状资料(dataofqualitativecharacteristics)•—半定量(等级)资料(semi-quantitativeorrankeddata)一、数量性状资料数量性状是指能够以量测、称量或计数的方法表示其特征的性状。数量性状资料—计量资料—计数资料计量资料(连续性变异资料)计数资料(不连续性变异资料或间断性变异资料)用量测手段用计数方式各观察值不一定是整数各观察值只能是整数两相邻的整数间可以有带小数的任何数值出现两个相邻整数不得有任何带小数的数值出现变异是连续性的变异不连续性体重、体长、剪毛量、产蛋量、日增重等产仔数、产蛋数、鱼的尾数、寄生虫虫卵数等二、质量性状资料质量性状是指只能观察而不能直接测量的性状(如:颜色、性别、死/活等)。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理。数量化方法——统计次数法(次数资料)评分法(一)统计次数法•在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。•例如,在研究猪的毛色遗传时,白猪与黑猪杂交,子二代中白猪、黑猪和花猪的头数分类统计如下表:表2-1白猪和黑猪子二代的毛色分离情况毛色次数频率/%白色33273.78黑色9621.33花色224.89合计450100.00这种由质量性状数量化得来的资料又叫次数资料。(二)评分法对某一质量性状,因其类别不同,分别给予评分。例如,在研究绵羊油汉色泽遗传时,可将5种油汉色泽分别给以不同的分数1-5分,以便统计,如下表。评分后再进行次数统计表2-2某羊群170只绵羊油汉色泽统计表性状类别油汉色泽总计深黄黄浅黄乳白白评分12345次数1016324270170三、半定量(等级)资料半定量或等级资料是指将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得的资料。这类资料既有次数资料的特点,又有程度或量的不同•如粪便潜血试验的阳性反应,在涂有粪便的棉签上加试剂后观察颜色出现的快慢及深浅程度分为六个等级;•又如用某种药物治疗畜禽的某种疾病,疗效分为“无效”、“好转”、“显效”和“控制”四个级别;•然后统计各级别的供试畜禽数。半定量资料在兽医研究中是最常见的•三种不同类型的资料相互间是有区别的,但有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。例如,兽医临床化验动物的白细胞总数得到的资料属于计数资料,根据化验的目的,可按白细胞总数正常或不正常分为两组,清点各组的次数,计数资料就转化为质量性状次数资料;如果按白细胞总数过高、正常、过低分为三组,清点各组次数,就转化成了半定量(等级)资料。第二节资料的整理一、资料的检查与核对原始资料的检查与核对—完整性(有无遗漏或重复)—真实性—准确性是否正确、合理,有无矛盾,特别注意特大或特小数据及异常数据(可结合专业知识判断)。对于有重复、异常或遗漏的资料,应予以删除或补齐;对有错误、相互矛盾的资料应进行更正,必要时进行复查或重新试验。(一)计数资料的整理—当观察值不多(n≤30),变异范围不大时,不必分组,直接进行统计分析。—当观察值较多(n30),变异范围较大时,须将观察值分成若干组,以便统计分析。整理程序:将观察值分组归类制成次数分布表(“唱票式”)看出资料的集中和变异情况二、资料的整理小鸡出壳天数在19-24天范围内变动,有6个不同的观察值。用各个不同观察值进行分组,共分为6组,可得表2-4形式的次数分布表。现以50枚受精种蛋孵化出雏鸡的天数为例,说明计数料的整理。表2-350枚受精种蛋孵化出雏鸡的天数2120202123222222212220232223221922232422192221212122222422212122222322222122222322232222222323222122表2-450枚受精种蛋出雏鸡天数的次数分布表有些计数资料,观察值较多,变异范围较大,对于这样的资料,可以几个相邻观察值为一组,适当减少组数,计算分析也比较方便。例如:观测某品种100只蛋鸡每年每只鸡产蛋数(原始资料略),其变异范围为200-299枚。这样的资料如以每个观察值为一组,则组数太多(最多可分为100组),如间隔10枚为一组,则可使组数适当减少。经初步整理后分为10组,资料的规律性就比较明显,见表2-5。表2-5100只蛋鸡每年产蛋数的次数分布表(二)计量资料的整理—组距式分组法基本步骤和方法计量资料在分组前需要确定全距、组数、组距、组中值及组限,然后将全部观测值划线计数归组。【例2.1】将126头基础母羊的体重资料(见表2-6)整理成次数分布表。表2-6126头基础母羊的体重资料单位:kg•全距是资料中最大值与最小值之差,又称为极差(range),用R表示,即R=Max(x)-Min(x)本例R=65.0-37.0=28.0(kg)1、求全距(极差)2、确定组数组数的多少视样本含量及资料的变动范围大小而定,一般以达到既简化资料又不影响反映资料的规律性为原则。一般组数的确定,可参考表2-7。表2-7样本含量与组数关系(参考)样本含量(n)组数30~605~860~1007~10100~2009~12200~50012~17500~17~30本例中,n=126,根据表2-7,初步确定组数为10组。3、确定组距每组最大值与最小值之差称为组距,记为i。分组时要求各组的组距相等。组距的计算公式为:组距(i)=全距/组数本例i=28.0/10≈3.04、确定组限及组中值组限(组下限、组上限)组中值:每组的中点值,是该组观察值的代表值。相邻两组的组中值间的距离等于组距,第一组的组中值加上组距就是第二组的组中值,第二组的组中值加上组距就是第三组的组中值,其余类推。组距组上限组距组下限组下限)(组上限组中值21212•一般地,第一组的组中值以接近或等于资料中的最小值为好(?)。最末一组的上限应大于资料中的最大值。•依次分组下去,直到资料中的最大值归入最后一组为止。表2-6中,最小值为37.0,第一组的组中值取37.5,因组距已确定为3.0,所以第一组的下限为:37.5-(1/2)×3.0=36.0;第二组的下限也就是第一组的上限为:36.0+3.0=39.0;第三组的下限也就是第二组的上限为:39.0+3.0=42.0,……,以此类推,一直到某一组的上限大于资料中的最大值为止。于是可分组为:36.039.0,39.042.0,……。为了使恰好等于前一组上限和后一组下限的数据能确切归组,约定将其归入后一组。通常将上限略去不写。(P17)第一组记为36.0,第二组记为39.0,……5、归组划线计数,作次数分布表分组结束后,将资料中的每一观测值逐一归组,划线计数,然后制成次数分布表。表2-8126头基础母羊的体重的次数分布表在归组划线时应注意,不要重复或遗漏,归组划线后将各组的次数相加,相加结果应与样本含量相等,如不等,证明归组划线有误,应予纠正。(三)质量性状资料、半定量(等级)资料的整理可按性状或等级进行分组,分别统计各组的次数,然后制成次数分布表和次数分布图。如:条形图表2-9F2代山羊的有角无角分离情况例如:在研究山羊角的遗传规律中,用有角母羊与无角公羊杂交,对其后代(F2)有无角情况进行调查,结果如下:表2-10仔猪死亡情况汇总表又如:对某养殖场仔猪死亡原因进行调查,结果如下:第三节常用统计表与统计图一、统计表(一)统计表的结构和要求统计表由标题、横标目、纵标目、线条、数字及合计构成。表号标题总横标目(或空白)纵标目合计横标目1数字资料横标目2数字资料合计标题标题要简明扼要、准确地说明表的内容,有时须注明时间、地点。标目标目分横标目和纵标目两项—横标目列在表的左侧,说明事物的主要标志—纵标目列在表的上端,说明横标目各统计指标的内容,并注明计算单位,如%、kg、cm等。编制统计表的总原则:结构简单,层次分明,内容安排合理,重点突出,数据准确,便于理解和比较分析。具体要求如下:表号纵标目横标目1总横标目标题横标目2数字一律用阿拉伯数字,数字以小数点对齐(后对齐),小数位数一致无数字的用“─”表示数字是“0”的,则填写“0”线条表的上下两条边线略粗纵、横标目间及合计用细线分开表的左右边线可省去,表的左上角一般不用斜线(P19)(二)统计表的种类统计表可根据纵、横标目是否有分组分为简单表和复合表两类。1、简单表由一组横标目和一组纵标目组成,纵横标目都未分组。此类表适于简单资料的统计,如下表。2、复合表由两组或两组以上的横标目与一组纵标目结合而成,或由一组横标目与两组或两组以上的纵标目结合而成,或由两组或两组以上的横、纵标目结合而成。此类表适用于复杂资料的统计,如下表。二、统计图常用的统计图有长条图(barchart)、饼图(piechart)、线图(linearchart)、直方图(histogram)和折线图(broken-linechart)等。一般情况下,计量资料采用直方图和折线图,计数资料、质量性状资料、半定量(等级)资料常用长条图、线图或饼图。(一)统计图绘制的基本要求1、标题简明扼要,列于图的下方。2、纵、横两轴应有刻度,注明单位。3、横轴由左至右、纵轴由下而上,数值由小到大;图形长宽比例约5:4或6:5。4、图中需用不同颜色或线条代表不同事物时,应有图例说明。(二)常用统计图及其绘制方法1、长条图它用等宽长条的长短或高低表示按某一研究指标划分属性种类或等级的次数或频率分布。如果只涉及一项指标,则采用单式长条图;如果涉及两个或两个以上的指标,则采用复式长条图。在绘制长条图时,应注意以下几点:(1)纵轴尺度从“0”开始,间隔相等,标明所表示指标的尺度及单位(一般地)。(2)横轴是长条图的共同基线,应标明各长条的内容。长条的宽度要相等,间隔相同。间隔的宽度可与长条宽度相同或者是其一半。(3)在绘制复式长条图时,将同一属性种类、等级的两个或两个以上指标的长条绘制在一起,各长条所表示的指标用图例说明,同一属性种类、等级的各长条间不留间隔。2、饼图•用于表示计数资料、质量性状资料或半定量(等级)资料的构成比。•所谓构成比,就是各类别、等级的观测值个数(次数)与观测值总个数(样本含量)的百分比。•把饼图的全面积看成100%,按各类别、等级的构成比将园面积分成若干分,以扇形面积的大小表分别表示各类别、等级的比例。绘制饼图时,应注意以下三点:(1)饼图每3.6°(园心角)所对应的扇形面积为1%。(2)饼图上各部分按资料顺序或大小顺序,以时钟9时或12时为起点,顺时针方向排列。(3)饼图中各部分用线条分开,注明简要文字及百分比。3、线图用来表示事物或现象随时间而变化发展的情况。线图有单式和复式两种。(1)单式线图表示某一事物或现象的动态。(2)复式线图在同一图上表示两种或两种以上事物或现象的动态。这时可用实线“”,断线“------”,点线“····”,横点线“-•-•-•-”等来标志区别。4、直方图(柱形图、矩形图)对计量资料,可根据次数分布表作出直方图以表示资料的分布情况。其作法是:在横轴上标记组限,纵轴标记次数(f),在各组上作出其高等于次数的矩形,即得次数分布直方图。如:150头6月龄保山猪体长的直方图(见书P21图2.4)5、折线图对于计量资料,还可根据次数分布表作出次数分布折线图。其作法是:在横轴上标记组中值,纵轴上标记次数,以各组组中值为横坐标,次数为纵坐标描点,用线段依次连接各点,即可得次数分布折线图。
本文标题:生物统计附试验设计第二章资料的整理(2017)
链接地址:https://www.777doc.com/doc-1796897 .html