您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 1999级预防医学专业卫生统计学考试试题(A)答案
1999级预防医学专业《卫生统计学》考试试题(A)答案一.简答题1.在卫生统计学教材和课程中,大部分内容与抽样误差有关,如抽样误差的概念,抽样误差的估计,抽样误差应用等,请你:(1)以实际例子解释抽样误差的概念。(2)写出正态分布(数值型资料)、二项分布资料、泊松资料及回归系数的抽样误差计算公式。(3)抽样误差的主要用途有哪些?(4)在常用的抽样方法中哪些抽样方法误差大?哪些抽样方法误差小?2.测量某样本的一项指标(数值型变量且服从正态分布,样本量较小)得其均数及标准差,与推断该样本所来自总体与已知总体是否属同一总体,研究者选择样本与总体比较的t检验。结果P值小于0.05,因此研究者认为样本不是来自已知总体。(1)请解释卫什么要计算t值,研究者的结论根据什么得此结论。(2)研究者的结论是否一定正确,若有错,出错的概率为多少?3.请结合授课内容,说明正确分析列联表资料的统计思路。4.请说明分析两个变量X、Y相关关系和数量依存关系的统计思路?5.某卫生监督所欲研究某杀虫剂污染粮食后对动物生长发育是否有影响,设计了如下实验:用大白鼠作为受试对象,实验分组如下:(1)用污染米作饲料;(2)用污染带糠皮米作饲料;(3)用未污染米作饲料。将全部受试对象完全随机地分入3个实验组中去,每组均有足够多的受试对象。实验一段时间后,测定大白鼠的某些生长发育指标,以反映粮食污染对大白鼠生长发育地影响。试分析该实验设计时候完善合理,若不完善或存在不合理之处,请写出完善合理的实验设计思路。二、计算题1.试推断工人前后不同时间的尿氟含量(mg/L)是否相同,结果如下表:工人编号工作前工作后11.722.7921.683.1031.403.2042.342.1651.902.7560.882.4071.402.6482.002.4091.642.30101.141.402.某地随机测定120名12岁男童身高。试分析之。身高组段(cm)频数12411282132101362214037144261481515241562160-1641合计1203.某医师研究各期矽肺患者的血清铜蓝蛋白含量(活性单位、100ml),结果如下表,问不同期次患者的血清铜蓝蛋白是否相同?0期0-1期1期8.08.511.39.08.39.06.311.09.55.49.08.58.56.79.65.69.010.85.410.59.05.57.712.67.28.711.95.68.55.84.某疾病控制中心对社区抽查的12000名居民进行了健康检查,发现乳腺癌68例。试估计该社区乳腺癌患病率的95%可信区间。5.某实验室研究高压氧舱的螺纹管消毒前后的消毒效果的研究结果如下表:螺纹管消毒采样份数合格份数合格率(%)前20315.00后201890.00试比较消毒前后的消毒效果是否有统计学意义?35.3)27,2(05.0F,41.4)18,1(05.0F,262.29,05.0t,306.28,05.0t,093.219,05.0t参考答案:一.简答题1.在卫生统计学教材和课程中,大部分内容与抽样误差有关,如抽样误差的概念,抽样误差的估计,抽样误差应用等,请你:(1)以实际例子解释抽样误差的概念。(2)写出正态分布(数值型资料)、二项分布资料、泊松资料及回归系数的抽样误差计算公式。(3)抽样误差的主要用途有哪些?(4)在常用的抽样方法中哪些抽样方法误差大?哪些抽样方法误差小?答:(1)由于变异的存在,抽样研究所造成的样本统计量与总体参数之间的差异或各样本统计量之间的差异称为抽样误差。某市16岁女中学生的身高值分布服从均数4.155(cm),标准差3.5(cm)的正态分布。现用计算机作抽样模拟试验,每次随机抽出10个观察值(即样本含量10n),共抽取100个样本,求得100个样本均数X,这些样本均数与总体均数或各样本均数之间的差别称为抽样误差。(2)正态分布:nX(理论值),nsSX(估计值)。二项分布:np)1((理论值),nppsp)1((估计值)。Poisson分布:X(理论值),XSX(估计值)。回归系数:2nSSSsb剩,XXXYblSS.(3)估计总体可信区间;用于假设检验。(4)整群抽样单纯随机抽样系统抽样分成抽样。2.测量某样本的一项指标(数值型变量且服从正态分布,样本量较小)得其均数及标准差,与推断该样本所来自总体与已知总体是否属同一总体,研究者选择样本与总体比较的t检验。结果P值小于0.05,因此研究者认为样本不是来自已知总体。(1)请解释卫什么要计算t值,研究者的结论根据什么得此结论。(2)研究者的结论是否一定正确,若有错,出错的概率为多少?答:(1)在=0的前提下,从正态分布的总体中做随机抽样,当样本含量n较小时,统计量XsXt服从自由度为1-=n的t分布,所以,可通过计算t值后根据t分布的原理确定P值。P值是在零假设成立的前提下,抽得的大于统计量t的概率,P0.05,即零假设成立是一个小概率事件,再一次抽样中可以认为是不可能发生的,因此研究者得出了样本不是来自已知总体的结论。(2)由于Ⅰ类错误的存在,研究者结论错误的概率为0.05.3.请结合授课内容,说明正确分析列联表资料的统计思路。答:CR表资料可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同4类。(1)双向无序CR表资料CR表资料中两个分类变量皆为无序分类变量。对于该类资料:①若研究目的为多个样本率(或构成比)的比较,可用行列表资料的2检验;②若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可用行列表资料的2检验以及Pearson列联系数进行分析。(2)单向有序CR表资料有两种形式。一种是CR表资料中的分组变量(如年龄)是有序的,而指标变量(如传染病的类型)是无序的。其研究目的通常是分析不同年龄组各种传染病的构成情况,此种单向有序CR表资料可用行列表资料的2检验进行分析。另一种情况是CR表资料中的分组变量(如疗法)为无序的,而指标变量(如疗效按等级分组)是有序的。其研究目的为比较不同疗法的疗效,此种单向有序CR表资料宜用秩转换的非参数检验进行分析。(3)双向有序属性相同的CR表资料CR表资料中的两个分类变量皆为有序且属性相同。实际上是配对四格表资料的扩展,即水平数3的配伍资料,如用两种检测方法同时对同一批样品的测定结果。其研究目的通常是分析两种检测方法的一致性,此时宜用一致性检验或称Kappa检验(也可用特殊模型分析方法(可用SAS软件)。(4)双向有序属性不同的CR表资料CR表资料中两个分类变量皆为有序的,但属性不同。对于该类资料,①若研究目的为分析不同年龄组患者疗效之间有无差别时,可把它视为单向有序CR表资料,选用秩转换的非参数检验;②若研究目的为分析两个有序分类变量间是否存在相关关系,宜用等级相关分析或Pearson积矩相关分析(见第九章);③若研究目的为分析两个有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。4.请说明分析两个变量X、Y相关关系和数量依存关系的统计思路?答:相关关系统计思路:(1)根据原始数据在直角坐标纸上绘制散点图,观察二者关系。(2)若二者均服从正态分布,求相关系数:YYXXXYlllr,11r。相关系数的假设检验:0:0H0:1H05.02102nrrsrtr,2n。(2)若有一个以上不服从正态分布,计算等级相关系数,公式略。(4)根据需要估计总体相关系数的可信区间回归分析思路:①绘制散点图,若有呈直线的趋势,则②选择判断自变量与因变量计算回归系数、截距,建立回归方程③对回归方程假设检验5.某卫生监督所欲研究某杀虫剂污染粮食后对动物生长发育是否有影响,设计了如下实验:用大白鼠作为受试对象,实验分组如下:(1)用污染米作饲料;(2)用污染带糠皮米作饲料;(3)用未污染米作饲料。将全部受试对象完全随机地分入3个实验组中去,每组均有足够多的受试对象。实验一段时间后,测定大白鼠的某些生长发育指标,以反映粮食污染对大白鼠生长发育地影响。试分析该实验设计时候完善合理,若不完善或存在不合理之处,请写出完善合理的实验设计思路。答:该实验设计完善,实际上是一个2*2析因实验设计,但缺少未污染带糠皮做资料组。标准答案见王洁贞教授主编的《医学统计学》129页。二、计算题1.试推断工人前后不同时间的尿氟含量(mg/L)是否相同,结果如下表:工人编号工作前工作后11.722.7921.683.1031.403.2042.342.1651.902.7560.882.4071.402.6482.002.4091.642.30101.141.40(1)配对资料t检验结果:0:0dH0:1dH05.0(双侧)t=4.5872,P=0.0013.因此拒绝零假设,接受备择假设,可认为两组结果有差别。(2)符号秩和假设0:0MH0:1MH05.0(双侧)T+=1.00,T-=54.00,P=0.0039(直接概率法),因此拒绝零假设,接受备择假设,可认为两组结果有差别。2.某地随机测定120名12岁男童身高。试分析之。身高组段(cm)频数12411282132101362214037144261481515241562160-1641合计120(1)该资料服从正态分布,按正态分布原理对该资料进行统计描述和推断。(2)均数及标准差:X=142.97,00.6s。(3)估计95%正常值范围:SX96.1(,SX96.1)=(131.24,154.76)(4)估计95%可信区间::nsX961.(,).nsX961=(141.93,144.07)3.某医师研究各期矽肺患者的血清铜蓝蛋白含量(活性单位、100ml),结果如下表,问不同期次患者的血清铜蓝蛋白是否相同?0期0-1期1期8.08.511.39.08.39.06.311.09.55.49.08.58.56.79.65.69.010.85.410.59.05.57.712.67.28.711.95.68.55.8对资料进行正态性检验和方差齐性检验:若资料呈正态、方差齐,或经变量变换后资料呈正态、方差齐,则用完全随机设计资料地方差分析(单因素方差分析);若不满足方差分析条件,则用成组设计多样本比较的秩和检验(H检验)。单因素方差分析计算步骤如下:H0:321,即3期血清铜蓝蛋白含量的测定结果的总体均数相等H1:3期血清铜蓝蛋白含量的测定结果的总体均数不全相等=0.05变异来源SSMSF总变异*2Cx29组间变异Cnxiijnjkij211)(2组间组间/SS组内组间MSMS/组内变异组间总SSSS27组内组内/SS*C为校正数nxC/)(2按1=2,2=27查F界值表,若),(05.021FF,则050.P,拒绝0H,接受1H,认为3期血清铜蓝蛋白含量的测定结果有差别;若),(.21050FF,050.P,认为3期血清铜蓝蛋白含量的测定结果无差别。若结论为拒绝拒绝0H,接受1H,可进一步通过多个样本均数间的两两比较(q检验或最小显著差t检验)推断任两期血清铜蓝蛋白含量的测定结果有无差别。4.某疾病控制中心对社区抽查的12000名居民进行了健康检查,发现乳腺癌68例。试估计该社区乳腺癌患病率的95%可信区间。本例符合poisson分布,且达到了近似正态分布条件,可用正态法进行参数估计。(XuX2,XuX2)=(51.84,84.16)5.某实验室研究高压氧舱的螺纹管消毒前后的消毒效果的研究结果如下表:螺纹管消毒采样份数合格份数合格率(%)前20315.00后201890.00试比较消毒前后的消毒效果是否有统计学意义?35.3)27,2(05.0F,41.4)18,1(05.0F,262.29,05.0t,306.28,05.0t,093.219,05.0
本文标题:1999级预防医学专业卫生统计学考试试题(A)答案
链接地址:https://www.777doc.com/doc-3101461 .html