您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 招聘面试 > 试验资料的整理与特征数的计算
1Chapter2试验资料的整理与特征数的计算一试验资料的搜集与整理(数据资料处理的首要环节)二试验资料特征数的计算2一、试验资料的搜集与整理资料类型资料搜集资料整理31.计量资料2.计数资料3.质量资料4.三类资料间关系(一)数据类型数量性状资料4住院号身高体重年龄住院天数职业文化程度妊娠结局202565516571.5275无中学足月202565316074.0225无小学足月202583015868.0256管理员大学足月202254316169.0235无中学足月202246615962.02511商业中学足月202453515768.0272无小学早产202583415866.0204无中学早产201946415870.5243无中学足月202578315457.0297干部中学足月观察单位计量资料计数资料某医院妇女妊娠资料表质量资料变量5质量性状是指只能观察而不能测量的性状。如花药、茎、种子、果实、叶片的颜色、籽粒的饱满度等。2质量性状本身不能用数值表示,要获得这类性状的资料,须对其观察结果作数量化处理。数量化方法可分为以下两种:6在一个样本内,分别统计具有某种性状、不具有该性状的个体数,这种数量化的资料又叫次数资料。(1)统计次数法例如:分别统计红花豌豆与白花豌豆株数7先根据性状的变异情况分级,给每级分别赋予一个适当的数值作代表值,然后统计样本中属于各个级别的个体数。例如:调查作物受某种病虫害危害情况,将作物性状分为免疫、高抗、中抗、中感、高感5个级别,分别用1,2,3,4,5表示,统计样本内各种级别的植株数。(2)评分法83.三类资料间关系例:一组2040岁成年人的血压以12kPa为界分为正常与异常两组,统计每组例数8低血压8正常血压12轻度高血压15中度高血压17重度高血压计量资料质量资料计数资料9(二)试验资料的搜集调查普查抽样调查随机抽查的条件:概率相等、样本独立试验随机重复独立无论哪种方式都力求完整、准确。10(三)试验资料的整理1、次数分布表计数资料次数分布表计量资料次数分布表质量性状资料次数分布表2、次数分布图柱形图直方图多边形图11统计表的结构和要求:结构简单,层次分明,安排合理,重点突出,数据准确。总横标目(或空白)纵标目1纵标目2……横标目1横标目2数字资料……表号标题1、标题简明扼要、准确地说明表的内容,有时须注明时间、地点。2、标目标目分横标目和纵标目两项。横标目列在表的左侧,纵标目列在表的上端,标目需注明计算单位,如%、kg、cm等等。3、数字一律用阿拉伯数字,数字以小数点对齐,小数位数一致,无数字的用“─”表示,数字是“0”的,则填写“0”。4、线条多用三线表,上下两条边线略粗。12例:13(1)【例】某小麦品种的每穗粒数的次数分布。变异较小的资料,可按观察值分组。每穗粒数记数符号次数151617181920正一正正正正正正正正正T正正正正正正正正T正615322517514【例】研究水稻品种的每穗粒数,共测115个穗,每穗粒数的变幅在20–139,极差达119。变异较大的计数资料,可分组统计。分组20-2930-3940-4950-5960-6970-7980-8990-99100-109110-119120-129130-139次数1491415182214773115(2)计量资料分布表计量资料一般采用组距式分组法。全距组数组距组限归组制表16【例】100株湘菊梨的单株产量如表,其次数分布表的制作方法如下:171).求全距(极差)R=max{xi}-min{xi}本例:R=73.7-47.9=25.8(kg)全距为资料中的最大观察值与最小观察值的差数,它表示了整个样本的变异幅度.182).确定组数与组距确定适当的组数,应考虑:(1)观察值个数的多少;(2)极差(R)的大小;(3)便于计算;(4)能反映出资料的真实面貌。19确定组数经验公式或者k=1+3.3log(n)式中:n为总体单位数统计数精确,计算不方便组数组距多小少大统计数不精确,计算方便20组距是每个组区间的上限与下限之差,常用i表示。组距、组数、极差有如下关系:i=R/为了便于计算,组距一般取整数。本例R=25.8,分为9组,故组距:(i)=25.8/9=2.9≈3.0(kg)213).确定组中值与组限组中值是各组区间的中点值,它可作为各组的代表值,最好取整数或与观察值位数一致。一般先确定第一组的组中值。本例九个组中值分别为:48.5,51.5,54.5,57.5,…,72.522组限即各组的界限,常用L表示,同一组中数值小者称为下限,数值大者称为上限。47.01---50.0050.01---53.0053.01---56.00|71.01---74.00本例的组限分别为:23组限的小数位数比观察值多取一位;为避免归组时出现差错,组限一定要明确,不能有重叠、交叉。24100株湘菊梨单株产量的次数分布表4).数据归组25(三)质量性状资料的次数分布表例如,用某微肥处理后,红星苹果果实着色果实着色分级代表值果实数全红2/3果面红色1/3-2/3果面红色1/3果面红色全绿5432114369753726统计图绘制的基本要求:(1)标题简明扼要,列于图的下方;(2)纵、横两轴应有刻度,注明单位;(3)横轴由左至右,纵轴由下而上,数值由小到大;图形长宽比例约5:4或6:5;(4)图中需用不同颜色或线条代表不同事物时,应有图例说明。2728051015202530354011121314151617图1月产蛋数次数分布条形图1条形图(barchart),又称柱形图特点:柱形之间要间隔一定的距离适用于计数资料和质量性状资料。2930鲢鱼体长次数分布图2直方图(histogram),又称矩形图计量资料354045505560657075808590特点:各组之间没有距离适用于表示连续性变异资料的次数分布。31323饼图(piechart)11121314151617来亨鸡月产蛋次数分布图计数资料质量性状资料334多边形图(polygon),又称折线图(broken-linechart)05101520253035404537.542.547.552.557.562.567.572.577.582.587.5计量资料鲢鱼体长次数分布图适用于计量资料的次数分布图,且在同一图上可比较两组以上资料。体长(厘米)尾数(尾)345散点图(scatter)123456432112345643211234564321a.正向直线关系b.负向直线关系c.曲线关系35以复习为主三试验资料特征数的计算反应其离散性的特征数:变异数。反应资料集中性的特征数:平均数;36算术平均数中位数众数几何平均数极差方差标准差变异系数集中性平均数离散性变异数37算术平均数分类:总体算术平均数μ=计算方法:直接计算法减去(或加上)常数法加权平均法样本算术平均数niixnx11NiixN11niiixfnx1138中位数观测值个数n的奇、偶性决定计算方法:n为奇数:第(n+1)/2位置的观测值n为偶数:第n/2和n/2+1位置的观测值之和的1/239众数资料中出现次数最多的那个观测值或次数最多一组的中间值(组中值)40几何平均数适用于变量为对数正态分布,经对数转换后呈正态分布的资料nniinnxxxxG12141它由两个极端观察值决定,受资料中不正常的极端值的影响大,没有充分利用资料的全部信息,不能精确表示资料的变异度。极差(R)minmaxxxR42每个观察值与平均数之差即离均差;表示观察值偏离平均数的距离。离均差的平方再求和简称平方和(sumofsquare)。记为SS。样本容量除离均差平均和,得到平均的平方和,简称方差(variance)或均方(meansquare,MS)。43总体方差通常无法得到,而由样本方差估计,样本方差称为均方:2sdfSSnnxxnxxs1)(1)(2222自由度(degreeoffreedom)指样本内能独立自由变动观察值的个数。440)(xx【例】有5个观察值,其中4个观察值的离均差为3,-2,3,5,那么第5个观察值的离均差必为-9,才能满足:45在估计其他统计数时,如该统计数受k个条件限制,则自由度等于样本观察值个数减去约束条件数k,即样本自由度为n-k。46统计学上把方差或均方的平方根取正值称为标准差(standarddeviation,Sd)。总体标准差:NN/xxNx222)()(样本标准差:1)(1)(222nn/xxnxxs471/(1)(222nnfxfxnxxfs)对于已分组的资料,可采用加权的公式进行计算:48变异系数(coefficientofvariation,CV)统计上,为比较具有不同单位,或单位相同但平均值差异相差悬殊的两个样本之间的变异度,需用相对变异量。%100xsCV49【例】今测得金柑树冠直径平均数为132cm,标准差为12cm,干周长的平均数为15cm,标准差为2cm,试比较其变异孰大?50可见,虽然干周的平均数与标准差的绝对数比树冠直径小得多,但相对变异程度比冠径要大些。变异系数的计算:冠径:CV=12/132×100%=9.09%干周:CV=2/15×100%=13.33%51作业23页习题2.9以上100个数据属于哪种资料?任挑一组数据进行分组统计后制表并用绘图软件做成直方图。52Chapter2.2Origin作图53启动后的界面541.导入数据默认是横轴默认是纵轴55多个纵轴的情况:562.作图两列一定要选中!折线图柱形图或直方图饼图散点图575859606162633.调整图1)修改坐标轴2)修改图像641)修改坐标轴双击坐标轴选择要修改的坐标轴坐标轴最小值坐标轴最大值坐标轴的取值(线性、对数、指数…)坐标轴上单位长度每个单位长度内端点的数目坐标轴第一个数字65Title&Format选择坐标轴修改坐标轴名称坐标轴刻度内外选择坐标轴颜色刻度的长短坐标轴粗细66TickLables坐标轴单位(时间、日期…)坐标轴尺度(科学计数)刻度下数字的颜色刻度下数字的尺度刻度下数字的字体加粗672)修改图像双击图像特征点的形状Symbol特征点的大小特征点的颜色68Line:线的链接形式线的类型线的粗细线的颜色线与特征点是否间断线下是否填充69707172
本文标题:试验资料的整理与特征数的计算
链接地址:https://www.777doc.com/doc-3270862 .html