您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 医学统计学总复习【江大京江版For医学检验】
目录:①在研究设计与资料分析中统计方法选择1)统计方法的流程图2)统计方法选择的思路3)教学中各类统计方法的应用条件②几个容易混淆的基本概念一、统计方法的流程图二、统计方法选择的思路1)统计方法选择的四级思维资料类型→分布类型→设计类型→具体条件2)统计分析的两个方面统计描述(统计指标与图表)→统计推断三、教学中各类统计方法的应用条件1)集中趋势与离散趋势的统计指标2)t检验与u检验3)率的u检验4)c2检验5)方差分析6)秩和检验7)线性相关与回归PS:思考题1)完全随机设计实验资料如何作假设检验?2)配对试验设计资料如何进行假设检验?1、t检验与u检验的应用条件1)两组数值变量资料比较;2)小样本时用t检验,要求资料为随机样本并服从正态分布;3)大样本时用u检验,仍要求资料为随机样本,但正态性条件可以放宽;4)在两样本均数比较的t和u检验中,要求两组总体方差相等,即方差齐性;5)组间要求具有均衡可比性。2、率的u检验的应用条件1)样本例数n较大(是一个不确定的数值,与率的大小有关);2)率p或(1-p)不接近于0,也不接近于100%;3)np和n(1-p)均大于5;4)在两样本率比较时,两率均应达到上述要求。3、c2检验的适用资料1)两组样本率的比较;2)多组样本率的比较;3)两组或多组构成比的比较;4)两个事物关联性的检验5)配对设计下两分类或多分类资料检验。4、线性相关与回归的应用条件1)散点图有线性趋势;2)专业上要求分析两变量间关系密切程度和变化方向,通过一个变量预测或控制另一变量;3)两变量服从双变量正态分布,或X可以精确测量的,Y服从正态分布。5、秩和检验和适用范围1)极度偏态分布2)未知分布或分布不规则3)等级分组资料4)一端或两端无界资料5)两组或多组资料离散度不同—方差不齐6、集中趋势与离散趋势统计指标集中趋势离散趋势正态分布均数方差、标准差对数正态几何均数几何均数标准差偏态等中位数四分位数间距变异系数:在两组或多组资料变异度比较组间单位不同组间均数相差较大几个容易混淆的基本概念1)样本与总体2)资料(变量)类型3)相对数指标:构成比、率、相对比4)统计图类型5)统计图的适用条件6)统计表1、抽样误差与标准误1)抽样研究才有抽样误差2)抽样误差的概念3)标准误是衡量抽样误差大小的指标2、标准差与标准误关系联系:离散度指标,计算上的联系区别:描述对象不同,意义与应用不同,与n的关系不同3、参考值范围与可信区间关系联系:均为一个数值范围区别:意义不同,与,同一资料两范围的不同4、假设检验的意义是通过两组或多组间有差别的样本(均数或率),或样本与总体(均数或率)推断他们的总体(均数或率)是否相同。5、检验假设与检验结论1)无效假设与备择假设(单双侧);2)是对总体所作,H0假设总体相同或两者无关,检验方法建立于此;3)对检验方法的H0与H1作总的;4)检验结论有统计结论与专业结论;5)是针对检验假设(总体)而作的;6、检验水准a与P值1)a是预先确定的表示在拒绝H0,可能犯错误的最大概率,属于第一类错误;2)P值是指由H0规定的总体中进行随机抽样,所观察到的等于及大于(或等于及小于)现有样本统计量(如u值)的概率,也可表示为在拒绝H0时可能犯错误的实际概率大小;3)a与P值间的关系:Pa,接受H0,差异无统计学意义;P≤a,拒绝H0,接受H1,差异有统计学意义7、自由度确定1)能够自由选择其数值的变量个数;2)总结各类统计方法的自由度计算;8、单侧与双侧1)正常值范围估计中单双侧的选取;2)组间比较的假设检验中单双侧选取;3)线性相关与回归系数检验单双侧选取。9、多组比较问题1)卡方检验与秩和检验中有多组比较问题2)检验思路是先作总的比较,再作两两组间比较;注意H1。10、u检验与c2检验的关系1)两法均用于两个率比较2)u检验是有条件的,u检验可用资料c2一定可用,u检验不能用,一般c2也可用。3)u2=c211、线性相关与线性相关系数1)前提是散点图有线性趋势;2)两变量线性关系密切程度和变化方向;3)检验的意义与r值的意义;12、线性回归与线性回归系数1)前提是散点图有线性趋势;2)配线求直线回归方程;3)线性回归系数b意义;13、调查与实验研究实验研究调查研究研究因素研究者给予研究对象客观存在误差控制控制较好影响因素较多随机性对象随机接受处理因素与对象是固定的,抽样是随机的14、三个基本要素与基本原则研究因素、研究对象、实验效应重复原则、对照原则、随机化原则15、完全随机设计与配对设计1)完全随机设计是将研究对象随机在分为两组或多组;2)配对设计是将研究对象按一定条件配成对子,再随机分到两组,随机区组设计为多组;3)组间均衡性与统计方法不同;4)应用上不同;30道精要问答题1、正态分布有什么基本特征?有哪几个参数?如何判断一组数据是否服从正态分布?基本特征:①正态分布只有一个高峰,高峰位置在X=μ;②正态分布以均数为中心,左右对称参数:均数、标准差(μ是随机变量X的总体均数,σ为标准差)①X轴与正态曲线所夹面积恒等于1或100%②区间μ±σ的面积为68.27%③区间μ±1.96σ的面积为95.00%④区间μ±2.58σ的面积为99.00%判断:频数分布图,前人经验,偏度系数和峰度系数的检验。2、如何把正态分布数据转换成标准正态分布数据?对任何服从正态分布N(μ,σ2)的随机变量X作线性变换都变换成均数为0,方差为1的正态分布,称为标准正态分布,简记为μ~N(0,1)3、什么叫标准正态分布?正态分布、标准正态分布和t分布有什么联系和区别?均数为0,方差为1的正态分布都称为标准正态分布,简记为μ~N(0,1)联系:都是对称的连续型分布;正态分布可以通过线性转换转化成标准正态分布;t分布在自由度较大时趋向标准正态分布。区别:曲线图形不同;功能不同(正态分布和标准正态分布可用于u检验、参考值范围制定,质量控制等,而t分布主要用于t检验或总体均数的可信区间。)4、什么是正常值范围?制定正常范围的基本步骤是什么?正态分布法与百分位数法制定正常值范围各有什么特点?正常值范围:又称参考值范围,指绝大多数正常人的某指标范围基本步骤:①抽取足够例数的正常人样本②对选定的正常人进行准确而统一的测定③决定取单侧范围值还是双侧范围值④选定适当的百分范围⑤估计界值特点:①正态分布法:应用本法的条件是资料服从正态分布,样本均数和标准差趋于稳定,样本含量不少于50例为宜,亦可用于经变量变换后服从正态分布的资料,如对数正态分布②百分位数法:应用本法的条件是样本含量较多,分布趋于稳定,样本含量不少于150例,适用于偏态分布资料4、总体均数的可信区间中的可信度和区间的宽度各说明什么?总体均数的可信区间中的可信度说明可信区间的准确度,可信区间的宽度则说明了精密度。可信度越高,准确度越高;区间越短,精密度越高。5、两样本均数比较时为什么要作统计检验?样本均数之间的差异是客观存在的,这种表面的差异不能直接判断总体均数间一定有差别,为了判断总体间均数是否有差别,我们必须对现有的样本均数作统计上的假设检验。我们班级全体男女同学的平均血压作比较,要不要作统计检验?班级全体男女同学的平均血压已经是两个总体均数(这两个总体不是太大所以全面调查可行),总体均数已经知道的话,比较就不用分别抽样作假设检验了。6、两样本均数的差别作统计检验,P0.05,你对此结果如何解释?若P0.05,又有哪些具体解释?P>0.05,P>α(α=0.05),接受H0(检验假设),总体均数相同P<0.05,P<α(α=0.05),接受H1(备择假设),总体均数不全相同7、两样本均数差别的t检验中,什么情况下作单侧检验?什么情况下作双侧检验?单侧检验时(专业角度能排除另外一侧可能性)H1:μ>μ0或μ<μ0双侧检验时H1:μ≠μ08、对样本均数与总体均数或对两样本均数的差别作统计检验,怎样使用可信区间做判断?对样本均数与总体均数μ0比较(单样本t检验)对未知的总体均数μ求出可信区间,这个可信区间若包含μ0,者可以认为μ=μ0;未知的总体均数μ求出的可信区间若不包含μ0,则认为μ≠μ0。两样本均数比较的统计检验分成配对样本和独立样本配对样本的话,可以求出配对数据的一组差值d,然后求出这组差值的总体均数μd的可以信区间,这个可信区间若包含0,则认为总体均数相等;反之,不等。两独立样本的话,可以通过两个样本分别求出两总体均数的可信区间,如果两个可信区间有交叉重叠部分,则可认为两总体均数相等,反之,不等。9、t检验要求什么条件?①正态性:即样本来自正态总体,特别是n较小时②方差齐性:即样本代表的总体方差相等,特别是对于两样本均数比较的t检验(一般情况下,满足方差齐性,会认为同时满足正态性的要求)③样本例数较小(n<50)10、t检验基本步骤是什么?①建立检验假设②确定检验水准和单、双侧③选定检验方法和计算统计量④确定P值⑤推断结论11、实验设计的要素与原则?要素:处理因素、受试对象、实验效应原则:①对照原则:设立对照组,除给予处理因素不同外,其他非处理因素尽量均衡一致②随机化原则:指总体中每个个体都有相等的机会被研究者抽取为样本③重复原则:要求有一定的样本含量12、线性回归和线性相关分析的目的是什么?线性回归的目的是要建立回归方程,了解自变量X与应变量Y之间的数量关系,以便于通过X去推算或预测Y.线性相关是通过相关系数刻画两个变量之间的相互紧密程度和变化方向。13、线性回归和线性相关分析对数据有什么要求?线性回归(又叫直线回归):要求自变量可精确测量和严格控制误差。线性相关(直线相关):要求两个变量服从双变量正态分布。14、建立回归方程用的是什么原则?最小二乘法:各散点距离回归直线纵向距离平方和为最小而得到直线15、为什么要对样本回归系数及样本相关系数作统计检验?样本统计量都存在抽样误差,样本回归系数及样本相关系数都是用数学公式计算的,但是如果他们的对应总体参数本身为0的话,那么总体就没有线性相关或没有线性回归关系,所以必须对他们的总体参数作假设检验。如果假设检验结果总体系数不为0,样本回归系数及样本相关系数就有统计学意义,可以证明他们的回归或相关关系;如果总体系数为0,那么样本回归系数及样本相关系数就没有统计学意义。16、同一批样品用两种方法测定结果的相关系数是0.95,能否说两方法测定结果相同?不能,相关系数本身还需要假设检验,另外就算两个变量高度相关,也不能说明测量结果一致。测定一致的两种结果一定高度相关,但是高度相关的两个结果未必相同。17、行×列表资料作χ2检验的目的是什么?推断两个或多个总体率或构成比是否相同18、四格表的χ2检验对数据有什么要求?哪些情况下要用四格表确切概率法检验?⑴要求:①T5,而且N40直接用2检验②1T5,而且N40校正2检验③T1或N40不能用2检验,可用四格表概率法⑵四格表确切概率法:当T1或N40时19、什么叫非参数统计方法?非参数统计方法有哪些优点和缺点?非参数统计方法:总体分布未知或者不清楚,不对对总体分布中的参数进行估计或检验的统计方法①优点:适用范围广;收集资料方便;计算相对简单②缺点:对于符合参数检验要求的资料,如果用非参数的方法,会降低统计效率不能对总体参数进行估计,因此没有概括性的数字说明整体20、表达中心位置(集中趋势)的指标有几个,各适用于什么情况,有什么优缺点?①均数(μ):又称算术均数,反映一组观察值在数量上的平均水平应用:单峰对称分布的资料,特别是正态分布或者近似正态分布优点:直观,容易理解,计算简单缺点:对等比级数资料、近似倍数关系的资料等集中趋势的代表性较差②几何均数(G):变量对数值的算术均数的反对值应用:等比级数资料、近似倍数关系的资料或者对数正态分布资料优点:回避了极大极小值的影响缺点:对呈明显偏态的资料,分布的一端或者两端无确定数值的资料(开口资料),分布不清的资料不能很好地反映平均水平③中位数(M):将一组观察值从小到大顺序排列,居于中间位置的数值应用:呈明显偏态的
本文标题:医学统计学总复习【江大京江版For医学检验】
链接地址:https://www.777doc.com/doc-2640391 .html