您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 1-实验数据的收集、整理
第一章统计数据的收集、整理教学基本要求:了解资料的类型;理解次数分布表与次数分布图的概念;掌握次数分布表与次数分布图的制作方法。了解常用统计量的种类;理解样本平均数、样本标准差、样本变异系数的意义、作用;掌握样本平均数、样本标准差、样本变异系数的计算方法。教学重点难点:重点:大样本连续型变数资料的分组方法,次数分布表与次数分布图的制作。样本平均数、样本标准差、样本变异系数的意义、作用和计算方法。难点:分组数列的确定。样本标准差的统计意义教学建议:分组收集资料一、攻关目标建立节水型的优质高效农业发展模式。提高区域农业水资源利用率及生产效率。为节水条件下农业高效持续发展提供技术支持和示范模式。第一章实验数据的收集、整理1.1资料的分类1.2数据的收集1.3资料的检查和核对1.4资料的整理和分组1.5特征数1.5.1平均数1.5.2变异数3一、攻关目标建立节水型的优质高效农业发展模式。提高区域农业水资源利用率及生产效率。为节水条件下农业高效持续发展提供技术支持和示范模式。第一节资料的分类正确地进行资料的分类是资料整理的前提。在调查或试验中,由观察、测量所得的数据按其性质的不同,一般可以分为:数量性状资料质量性状资料4一、攻关目标建立节水型的优质高效农业发展模式。提高区域农业水资源利用率及生产效率。为节水条件下农业高效持续发展提供技术支持和示范模式。第一节资料的分类一、数量性状资料能由计数和量测的方式获得的性状数量资料为数量性状资料。因数量性状(quantitativetrait)的度量有计数和量测两种方式,其所得数据不同。5一、攻关目标建立节水型的优质高效农业发展模式。提高区域农业水资源利用率及生产效率。为节水条件下农业高效持续发展提供技术支持和示范模式。第一节资料的分类1、连续型数据(continuousvariable):指由称量、度量或测量、分析化验等方法所得到的数据。其各个变量并不仅限于整数,在两个相邻数值之间可以有微量差异的其他数值存在。例如:测定粒重,产量、株高、长度、营养元素的含量等。6一、攻关目标建立节水型的优质高效农业发展模式。提高区域农业水资源利用率及生产效率。为节水条件下农业高效持续发展提供技术支持和示范模式。第一节资料的分类2、间断型数据(discretevariable):是指由计数方法所获得的数据,其各个数据必须以整数表示,在两个相邻的整数间不能有带小数的数值存在。由于两个整数间是不连续的故称为不连续型或间断型数据。如动物头数、穗数、每穗粒数等。7一、攻关目标建立节水型的优质高效农业发展模式。提高区域农业水资源利用率及生产效率。为节水条件下农业高效持续发展提供技术支持和示范模式。第一节资料的分类二、质量性状资料质量性状(qualitativetrait)指能观察而不能量测的性状,即属性性状,如肤色,花、子粒等器官的颜色,绒毛的有无等。由只能观察描述或感觉而难以量测的性状获得的数量资料为质量性状资料。这些性状本身不能以数字来表示,要获得这类性状的数量资料,可采用下列两种方法进行数量化:8一、攻关目标建立节水型的优质高效农业发展模式。提高区域农业水资源利用率及生产效率。为节水条件下农业高效持续发展提供技术支持和示范模式。第一节资料的分类1.统计次数法在一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别计其次数或相对次数,以次数作为质量性状的数据。例如在320株水稻植株中有240株为紫色柱头的,80株黄色柱头的。这类由质量性状数量化得来的资料也称为次数(或频次)资料。9一、攻关目标建立节水型的优质高效农业发展模式。提高区域农业水资源利用率及生产效率。为节水条件下农业高效持续发展提供技术支持和示范模式。第一节资料的分类2.给予每类性状以相对数量的方法(给分法)对某一质量性状,因其类别不同,分别给予不同的级别或分值,例如,小麦子粒颜色有白有红,可令白色的数量值为0,呈红色的数量值为1。从这类变异所得资料,处理方法同间断型变数资料。第二节数据的收集1、数据的收集方法:调查试验2、收集数据的要求:1.突出研究目的2.严格执行研究方案3.控制误差一、攻关目标第三节资料的检查和核对检查和核对原始资料的目的在于确保原始资料的完整性和正确性。完整性是指原始资料无遗缺或重复。正确性是指原始资料的测量和记载无差错或未进行不合理的归并。要特别注意特大、特小和异常数据;有重复、异常或遗漏的资料,应予以删除或补齐;有错误、相互矛盾的资料应进行更正,必要时复查。资料的检查与核对工作虽然简单,但却是一项非常重要的步骤,只有完整、正确的资料,才能真实地反映出调查或试验的客观情况,才能经过统计分析得出正确的结论。第四节资料的整理和分组试验或调查研究所得资料,经检查核对后,根据资料中观测值的多少确定是否分组。当观测值不多(n≤30)时,不必分组,直接进行统计分析。倘包含很多观察值,未加整理很难得到明确的概念。如果把这些观察值按数值大小或数据的类别进行分组,制成不同组别或不同分类单位的频数分布表,就可以看出资料中不同表现的观察值与其频率间的规律性,即可以看出资料的频率分布的初步情况,从而对资料得到一个初步概念,以便统计分析。13一、攻关目标第四节资料的整理和分组一、次(频)数分布表的编制将数据可能出现的整个范围化分成若干个互斥的组区间,再统计出现在各个组区间内的数据个数(次数),可以发现数据都有着一定的分布规律。由不同区间内数据出现的次数组成的分布,就叫做变数的次数分布,简称次(频)数分布。资料整理方法之一,就是编制次(频)数分布表。次(频)数分布表的制作方法因数据种类不同而略有不同,分述如下。14一、攻关目标第四节资料的整理和分组(一)、间断型数据资料的整理1、相同观察值归一组以某小麦品种的每穗小穗数为例,随机采取100个麦穗,计数每穗小穗数,未加整理的资料列成表。15第四节资料的整理和分组上述资料为间断型数据资料,每穗小穗数在15-20的范围内变动,有6个不同的观察值,把所有观察值按每穗小穗数多少加以归类,共分为6组,组与组间相差为1小穗,称为组距。这样可得次数分布表:从表中看到,一堆杂乱的原始资料,经初步整理后,就可了解资料的大致情况。另外,经过整理的资料也便于进一步的分析。P3例1.1属此类。16第四节资料的整理和分组2、相邻几个观察值归一组资料观察值较多,变异幅度较大,若以每一观察值为一组,则组数太多,而每组内包含的观察值太少,资料的规律性显示不出来。对这类资料,可扩大为以几个相邻观察值为一组,适当减少组数,资料的规律性就较明显,对资料进一步计算分析也比较方便。如每组包含若干粒数的幅度,例如以5粒为一组,则可使组数适当减少。17一、攻关目标第四节资料的整理和分组从下表可以看出,半数多的稻穗的每穗粒数在46-60粒间,大部分稻穗的每穗粒数在41-70间;但也有少数稻穗少到26-30粒的,多到81~85的。18一、攻关目标第四节资料的整理和分组(二)、连续型数据资料的整理连续型数据资料不能按间断型数据资料的分组方法进行整理,在分组前需要确定全距、组数、组距、组中值及组限,然后将全部观测值划线计数归组,制作成次(频)数分布表。以140行水稻试验的产量为例,说明整理方法。19第四节资料的整理和分组次(频)数分布表的制作步骤:1.数据排序:将所取得的数据按从小到大排列(升序)或从大到小排列(降序)。2.求极差R:资料中最大观察值与最小观察值之差,即整个样本的变异幅度。用R表示,即R=Ymax-Ymin从表中查到最大观察值为254g,最小观察值为75g,极差为:R=254-75=179g20第四节资料的整理和分组3.确定组数和组距:组数指将数据出现的整个数量范围分成多少个组区间。每组的距离称为组距。组数和组距是相互决定的,一般以达到既简化资料又不影响反映资料的规律性为原则。组数过多或过少,不能反映资料的规律性。如果组数过多,看不到资料的集中情况,且不便于以后的继续分析。21第四节资料的整理和分组3.确定组数和组距:在确定组数和组距时应考虑:(1)数据个数的多少;(2)极差的大小;(3)便于计算;(4)能反映出资料的真实面貌等方面。22第四节资料的整理和分组样本大小(即样本内包含观察值个数的多少)与组数多少的关系可参照下表来确定。23第四节资料的整理和分组确定组距。指每个组区间的高限和低限的差值,组距的大小由全距与组数确定,记作i。i=极差/分组数以140行水稻产量为例,样本内观察值的个数为140,查表可分为8-16组,假定分为12组,则组距为i=179/12=14.9g≈15g以15g作为组距,方便分组。24第四节资料的整理和分组4.确定组界和组中值(组值):每组应有明确的界限,才能使各个观察值划入一定的组内,为此必须选定适当的组中点值及组限。各组的最大值与最小值称为组界,最小值称为下界,最大值称为上界,反映各组的的变异范围。组中值是各组的上界(数值大者)与下界之和除以2所得,即:组中值=(上限+下限)/2=组下限+1/2组距=组上限-1/2组距每组组中值是该组的代表数值。25第四节资料的整理和分组确定组距后,首先要选定第一组的组中值。第一组的中点值以最接近最小观察值为好。确定第一组的组限以后,其余各组的组中值和组限便可依次确定。以140行水稻产量为例:选定第一组的中点值为75g,与最小观察值75g相等;则第二组的中点值为75+15=90g,余类推。各组的中点值选定后,就可以求得各组组界。第一组的组限为67.5-82.5g。按照此法计算其余各组的组界。26第四节资料的整理和分组注意:组值最好为整数或与观察值的位数相同,以便于以后的计算。组限要明确,最好比原始资料的数字多一位小数,便于归组。最末一组的上限应大于资料中的最大值。27第四节资料的整理和分组5.归组:按依次表将观察值归入各个组内,并统计各组数据出现的次数,制成频数分布表。例如表中第一个观察值177应归于第8组,组限为172.5-187.5;……。依次把140个观察值都进行归组,即可制成140行水稻产量的次数分布表。“上限不在内”约定28第四节资料的整理和分组(三)、属性数据资料的整理属性数据的资料,也可以用类似次数分布的方法来整理。在整理前,把资料按各种质量性状进行分类,分类数等于组数,然后根据各个体在质量属性上的具体表现,分别归入相应的组中,即可得到属性分布的规律性认识。例如,某水稻杂种第二代植株米粒性状的分离情况,归于下表。29第四节资料的整理和分组如果把频数分布表中频次换算成频率(组频数/总数),则可做成频率分布表。如P3表1-1、P5表1-3。30第四节资料的整理和分组二、频数分布图:试验资料除用频数分布表来表示外,也可以用图形来表示,频数分布图可以更形象地表明频数分布的情况。较普遍应用的图示有:方柱形图、多边形图、条形图和饼图。31第四节资料的整理和分组(一)方柱形图方柱形图(histogram)适用于表示连续型数据的频数分布。以140行水稻产量的次数分布表为例加以说明。1.等分横轴:在横轴上分为13等分(因第一组下限不是从0开始,在其前加∥),每一等分代表一组。第一组的上限即为第二组的下限,如此依次类推。2.标定次数:在纵轴上标定次数。横坐标与纵坐标的长度比例一般为5:4或6:5为好。3.画方柱:查表3.6第一组有次数为2,所以在两组限处绘两条纵线,其高度等于纵坐标上两个单位,再画一横线连接两纵线的顶端,成为方柱形。其余各组可依次绘制,即成方柱形次数分布图3.1。32第四节资料的整理和分组(二)多边形图多边形图是表示连续型数据资料的一种普通方法,且在同一图上可比较两组以上的资料。以140行水稻产量次数分布为例,图示时:以每组的中点值为代表,在横坐标各等分的中点向上等于该组单位数处标标点,表示该组含有的次数。把各点依次用直线连接
本文标题:1-实验数据的收集、整理
链接地址:https://www.777doc.com/doc-4567655 .html