您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 医学统计学历年考题及答案
医学统计学历年考题及答案试题】2021-01-05/山东大学/医学院/2021级/研究生/医学统计简答1给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等2一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对?为什么?如果是你,用什么?3假设检验的基本思想和原则4给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么?5给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么?你的设计是什么?6一型错误和二型错误的区别和联系7什么是抽样误差?举例说明分类资料和数量资料的抽样误差计算1给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值(1)比较白天晚上血压有无差别(配对t检验计算)(2)白天和晚上血压有无相关(相关分析)(3)如何用白天血压估计晚上血压(回归分析)2多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分)3样本率与总体率的比较(u检验)(也有人说:配伍组方差分析)20211.列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等)2.医学统计中,将正态分布视为近似正态分布有哪几种情况?列出应用条件和公式3.数值资料的统计描述指标?公式?4.多元回归模型的基本形式?参数含义?回归效果的评价?5.什么叫截尾值?产生原因?举例说明6.一同学两样本率的比较用了卡方检验,你有什么建议?若不符合卡方检验的应用条件,你又有什么建议?他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议?7.一个三因素的2X2X2的析因设计的实验设计及分析思路8.给了一个数值资料:小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值小鼠的体重增加量也有十个值(1)对体重增加量资料进行统计描述(2)求饮食量和体重增加量的关系(3)由体重增加量的样本估计其代表总体均数的可信区间(4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间(5)(3)和(4)中的可信区间有什么差别?20211直线回归中的b与多元线性回归中的B有什么区别?多元线性回归中,是否可以用B来表示各自变量对因变量的影响?为什么?2数值变量的完全随机设计的样本与总体的比较,配对设计的两样本的比较,成组设计两样本比较的统计分析思路3统计分析中P.a,B以及1-B的意义4给了一个单向有序资料,统计效应是有序的,他用了t检验,问你对不对,为什么?应该用什么统计方法,并写出统计思路5有一个两样本的秩和检验的应用题,写思路,不要求计算6生存分析中,有哪些非参数检验的方法?两个生存率的比较用什么检验?7给了一个实验,测量抗体.样本序列抗体滴度效应是否有效11:40+是21:160++是....就是几个表格,让你给每个列个表,并且应该用哪些指标来描述.8正态分布,二项分布,poisson分布的可信区间9有两个变量,让你说出分析它们相关的统计分析思路10有个析因设计的题,让你写出检验的思路,好象是还要写出公式.2021(研究生)1.举例说明变量及变量类型。(10分)答案:变量:在搜集资料时,首先要根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,该特征称为变量。如身高、体重、疗效等变量按其性质可分为两种类型:(1)数值变量:其变量值是定量的,表现为数值的大小,通常是使用仪器或某种尺度测定出来的,多有度量衡单位。如身高(cm)、体重(kg)、心律(次/min)、血压(mmHg)等。(2)分类变量:表现为互不相容的类别或属性,它又分为无序与有序两类:a.无序分类变量:是指所分类别或属性之间无程度或顺序上的差别,如:性别(男、女)血型(A、B、O、AB)等。b.有序分类变量:是指所分类别或属性之间有程度或顺序上的差别。如尿糖化验结果按-、+-、+、++、+++分类,疗效按治愈、好转、无效、恶化分组。2.在假设检验过程中,若设定a为0.05,算得统计量后,得p值为0.015,按a=0.05的检验水准拒绝无效假设。请对这一结论做出适当的评论,并为此写例假设检验中p值的含义,以及p与a的关系。(10分)答案:P值为0.015小于检验水准a(0.05),依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝H,接受H1,尚可以认为现有样本所代表的总体与已知总体不相等。P值的含义是指从H所规定的总体中随机抽样时,获得等于及大于(负值为等于及小于),可认为现有样本所代表的总体现有样本统计量的概率。若pa,按a检验水准不拒绝H与已知总体的差别是由抽样误差造成的。若p3.写出数值变量资料中完全随机设计的多个样本比较的统计分析思路(不必写出计算公式)。(15分)答案:(1)统计描述:描述资料的类型:数值变量资料频数表资料的分布:正态性检验服从正态分布:均数、标准差(方差);不服从正态分布,服从对数正态分布:几何均数、几何标准差;偏态分布:中位数、四分位数间距(2)统计推断:资料的设计类型:完全随机设计的多个样本比较分布:正态性检验和方差齐性检验:(1)如果样本服从正态分布且方差齐,就用完全随机设计的多个样本的方差分析来作统计推断;(2)如果样本不服从正态分布或者方差不齐,经变量变换转换为正态分布方差齐,再用方差分析推断;(3)如果变量变换不能使样本服从正态分布且方差齐,就用秩和检验来做统计推断。4.写出两变量之间相关关系的分析思路。(15分)答案:(1)绘制散点图:在直角坐标系内绘制散点图,看两变量之间有没有线性趋势,如果有就做相关分析。如果两变量都服从双变量正态分布,则做直线相关分析;如果不服从线性模型条件要求即不服从或总体未知的资料,则作Spearman等级相关分析。或者进行曲线拟合。(2)计算直线相关系数r或者Spearman秩相关系数rs。(3)对相关系数作假设检验,由于抽样误差的存在,即使从p=0的总体中做随机抽样误差,所得的R值也不一定等于零,应对样本相关系数做假设检验。根据检验目的,检验假设为:H0:P=0;H1=/0.常用t检验,212--==nrrsrtrv=n-2,拒绝H0认为两变量间存在直线相关。(4)总体相关系数的可信区间估计,先对相关系数做Z变换,估计Z的可信区间,其分布服从正态分布原理,,按正态分布原理100(1-a)%可信区间(3,3/-+--nuznuzaa),再对Z的可信区间上下限按r=tanhz进行逆变换。5.请利用下面的随机数字表将15只小白鼠完全随机的分配到甲、乙、丙3个实验组中,使各组例数相等。要求写出随机分配方案。(10分)随机数字表(部分数据)编号1-1011-2021-3031-4041-50122176865816895239235870222575161094395065824820347219362759461379933755397732770985520530624783516274316772302770961872521280624259316711359782305474725478437671612044903264976763996146380393226981219921503282826087337320405693016090588695828993507447547答案:先把十五只动物按体重从小到大分别编号:123456789101112131415;在随机数字表任意指定某行某列,如取第三行的1列开始,向下录入不重复的二位随机数字:167723020961872521280624937113;对应于十五只动物的编号,对随机数字有小到大编秩得出序号R如下:513713111496102815124;并规定:一到五号分到甲试验组,六到十号分到乙组,十一到十五号分到丙组;随机分配结果是:甲实验组动物有:1451115;乙组动物为:3891012;丙组动物有:2671314。6.某试验需在5%和15%两种氧浓度下进行,每种氧浓度下分别使用甲、乙、丙三种药物对K562细胞进行抑制。此研究宜用何种试验设计,并写出设计方案;若每种实验条件下各观察4个独立的样品,共需多少样品(即样本含量)?(10分)答案:此研究宜用析因试验设计,析因设计是一种多因素多水平交叉分组进行全面试验的设计方法,可以研究两个或两个以上因素多个水平的效应,也可以检验各因素间的交互作用;因本试验中有2个试验因素,即氧浓度和药物,一个因素有2个水平,另一个因素有3个水平,而且氧浓度和药物之间可能存在交互作用;因此选用析因试验设计。设计方案:该试验是一个2X3的析因设计,共有2X3=6个试验组,用a1表示5%的氧浓度,a2表示15%的氧浓度;用b1表示甲药物。b2表示乙药物,b3表示丙药物。先按随机分组的原则,将试验动物按随机化原则分配到各组,各组先进行不同试验因素的处理,间隔一段时间后,再把各组之间的处理方法交换,并统计处理的结果。分析两因素之间有无交互作用及其交互作用的性质。同时分析两个因素各个水平之间的效应来评价对细胞的抑制作用。样本含量:2X3X4=247.某研究者随机测定了某地100例健康成人血清NSE酶(ug/l)含量,请你充分利用该资料所能提供的信息,写出全面的分析思路。(20分)答案:(1)资料的类型,列频数表,观察分布类型和分布特征:经判断资料为数值变量资料,对该资料作正态性检验,如果资料服从正态分布,进行统计描述,用均数、标准差(方差)来描述资料;不服从正态分布,进行变量变换使其服从正态分布,若是服从对数正态分布,用几何均数、几何标准差来描述资料;若资料服从偏态分布,则用中位数、四分位数间距对资料进行统计描述。统计描述:(2)通过资料来估计制定医学参考值范围:比如估计该地健康成年人血清NSE酶含量的上双侧95%(90%、99%)参考值范围,如果资料为正态分布资料,则95%医学参考值范围为(SX96.1-,SX96.1+);如果资料为对数正态分布资料,则95%医学参考值范围为1lg-(Xlgx-1.96xSlg,Xlgx+1.96xSlg);如果资料为偏态分布,则95%医学参考值范围为(5.975.2~PP)。(3)统计推断:参数估计包括均数的抽样误差即标准误:nSSx=和总体均数的可信区间估计①σ未知且n较小:可信区间为(XaXaStXStXνν,2/,2/,+-);②σ未知但n足够大:(XaXaSuXSuX,2/,2/,+-);③σ已知:(XaXauXuXσσ,2/,2/,+-)。8.多元回归方程为:yhat=b0+b1x1+b2x2+…+bjxj+…+bpxp,其中bj的名称是什么,它的意义是什么?若比较各自变量对因变量影响的大小,应通过什么统计量比较?判断多元线性回归分析的效果应看那些指标?(10分)答案:bj称为偏回归系数,意义是在其他自变量固定不变的条件下,自变量xi每改变一个单位时所引起的因变量y的平均改变量。比较各自变量对因变量影响的大小,应通过bj的大小来比较。常用的多元线形回归分析的效果指标有决定系数R2(是回归平方和占总平方和的比例,值越大,回归效果越好)、复相关系数(决定系数的算术平方根,反应应变量和自变量线性组合见得相关关系的密切程度R越就接近1,线性关系越密切)、校正决定系数(越大回归效果越好)、剩余标准差(不能有m个自变量的变化解释的Y的变异,越小回归效果越好)等。2021级七年制临床医学专业考试试题答案1、同质:对研究指标影响较大的、可以控制得主要因素尽可能相同。变异:同质基础上各观察单位的某变量值得差异称为变异。2、均数的抽样误差:由抽样研究造成的样本均数与总体均数间的差异称为均数的抽样误差。3、假设检验P值含义:P值是指从所规定得
本文标题:医学统计学历年考题及答案
链接地址:https://www.777doc.com/doc-7849651 .html