您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 试验(实验)设计与样本含量的估计
研究设计与样本含量•现代医学科研中的信息大多数是以数据的形式加以体现,探索医学数据变化的特有规律,对数据进行整理和分析,得出研究结论是医学统计学的首要任务。•医学科研数据的统计分析涉及医学专业知识、统计专业知识、数据分析的经验和技巧等多个方面,既有分析的严谨和科学,又有选择的多样和艺术。(一)实验研究设计(二)实验研究的要素(三)实验设计的原则(四)科研设计方法与抉择(五)常用的实验设计方案(六)研究中样本含量的估计(七)实验设计中常见的错误(一)实验研究设计任何一项医学研究,在确定研究目的之后,首要问题:考虑怎样安排试验或者说需要一份良好的研究计划(称为研究设计),它是使研究结果满足科学性的重要保证。数据分析设计数据采集报告一、研究设计类型:1、实验研究设计根据研究目的认为的对受试对象(包括人或动物)设置干预措施,控制非干预措施的影响,总结干扰因素的效果。常用研究分为三类,即动物实验、临床实验与社区干预实验。•2、调查研究设计对特定群体进行调查被调查者的因素是客观存在的,研究者只能被动的观察和记录。实验和调查虽然在设计上有所区别,实际研究中常结合应用,某些现场可为实验提供线索,而实验结果还需要通过调查加以证实。二、实验设计的目的控制和降低系统误差对实验结果的影响,缩小实验随机误差以利于进行统计推断,更确切地回答研究者事先提出的假设。三、实验设计的任务1、合理安排实验有所和实验对象2、选择表达实验效应的指标3、分析和考查实验效应四、实验研究的误差实验研究的误差1、随机误差(randomerror)2、系统误差(systematicerror)又称为偏倚(bias)包括选择偏倚、测量偏倚和混杂偏倚。误差随机误差系统误差(二)实验研究的要素处理因素受试对象实验效应处理因素•抓住主要的处理因素:实验效应是多种因素作用的结果,由于研究目的不同,以及人力、物力和时间所限,研究者不可能通过一次或几次实验中把已知的所有因素都进行处理与分析,只能抓主要的,且因素的水平数不宜过多。•找出非处理因素并加以控制:研究者应采取各种措施,尽可能使非处理因素在所比较的各组中基本相同,以便充分显示处理因素的作用。•处理因素应标准化:即保证处理因素在整个实验过程中始终如一,保持不变。受试对象•动物实验对象和临床(现场)试验对象–受试对象的同质性–明确的疾病诊断的标准及纳入和排除标准–好的依从性实验效应•一般是通过某些观察指标,定量或定性地反映实验效应。•选择观察指标的基本原则–指标的选择必须与研究目的密切关联–客观性尽可能选择客观指标,避免一些笼统的、不确切的指标。–精确性选用的指标应尽量精确。–灵敏性和特异性实验效应指标应当同时兼顾其灵敏性和特异性,尽量使灵敏性和特异性都高。(三)实验设计的原则实验误差的控制:实验设计的主要作用是减少误差,提高实验的精确度,使研究者能从实验结果中获得无偏的处理统计量及实验误差的估计值,从而进行正确地分析和比较。(四)科研设计方法与抉择在研究临床科研设计方案的时候,首先要掌握设计的三大原则(或四大原则)。•随机化原则•对照原则•重复原则•盲法原则1、对照(control)原则•设立对照组的的意义在于使实验组和对照组内的非处理因素的基本一致,即均衡可比。–组间除干预措施外,其他影响结果的非处理因素等尽可能相同。–对所研究疾病的易感度及发病机会相等。–检测和观察方法及诊断标准必须一致。•空白对照、安慰剂对照、实验对照、标准对照等、潜在对照。对照的基本形式•空白对照对照组不施加任何处理因素。•实验对照对照组不施加处理因素,但施加某种实验因素。•标准对照不设立专门的对照组,而是用现有标准值或正常值做对照。•自身对照对照与实验在同一受试者身上进行,如用药前后作为对比。•安慰剂对照主要目的是为了平衡对照组病人心理因素的影响。•历史对照以本人过去的研究或他人研究结果与本次研究结果做对照2、随机化(randomization)原则:随机化是实验研究中据设计要求,受试对象的分组、施加于受试对象的处理以及实验顺序等都必须满足概率意义上的要求。贯彻随机分配原则是提高对比组之间均衡可比的重要手段,是控制选择性偏倚唯一有效的方法,也是资料分析、统计推断的理论基础。常用的随机化方法有抽签法、随机数字表、随机排列表和随机函数法。随机对照试验的设计模式研究的对象(N)不合格的研究对象合格的研究对象拒绝加入试验的合格对象自愿加入试验的合格研究对象(Ne)随机分组试验组对照组阴性结果阳性结果阴性结果阳性结果3、重复(replication)原则:可靠的实验结果,应能在相同条件下重现出来;可靠的实验结论也不能凭一次实验或3-5例结果获得,一定有足够量的观察单位数。重复原则包含重现性和观察单位数量。所以也是一个样本含量(samplesize)大小问题。足够的观察单位数是保证重现的基础,而重复的同质可比条件也是保证实验能够重现的重要条件。4、盲法原则实验设计时常把盲法也作为一条附加原则,以更好地控制误差。单盲:受试者不知道分组情况,有利于研究者了解情况,但可能会产生由研究带来的偏倚。双盲:研究者和受试者均未知分组情况和接受处理的具体内容,可以控制来自研究者和受试者两方面主观上的干扰。(六)常用的实验设计方案•单因素设计方案是一个观察因素的不同强度水平作用效应间差异的研究。完全随机设计、序贯设计。•多因素设计方案是指观察两个以上因素不同强度水平下作用效应差异的研究。交叉设计、随机区组设计、拉丁方设计、析因设计、裂区设计、正交设计。完全随机设计•完全随机设计:不考虑个体差异的影响,仅涉及一个处理因素,但可以有两个或多个水平,所以亦称单因素实验设计。•该设计常用于将受试对象按随机化原则分配到处理组和对照组中,各组样本例数可以相等,也可以不等,但相等时效率高。•完全随机设计的优点是设计和统计分析方法简单易行。•缺点是只分析一个因素,没有考虑个体间的差异,因而要求各观察单位要有较好的同质性,否则,需扩大样本含量。成组设计实例•例:将10头动物随机分配到甲、乙两组。•先将动物按体重编号,再从随机排列表中,随机指定第3行,舍去10-19之间的数字,将0-9之间的数字依次录于动物号下。按照事先规定,将随机数字为单数者分入甲组,双数者分入乙组。•结果第1、4、6、8、9号动物入甲组;第2、3、5、7、10号动物入乙组。受试者号12345678910随机数字1203874596处理组甲乙乙甲乙甲乙甲甲乙完全随机设计实例•将26只大白鼠分4组进行实验,并要求n1=n2=6,n3=n4=7。–(1)首先给动物按体重编号;–(2)任意指定随机数字表中第3行,从第7、8列开始由上向下抄录26个两位的随机数;–(3)将抄录的随机数安大小排序,用R表示;–(4)规定R为1-6者分入甲组,7-12者分入乙,13-19者分入丙组,20-26者分入丁组。–分组过程如下:完全随机设计实例编号12345678910111213随机数2712664547030339541422784R1217181520910251213824组别甲丁乙丙丙丁乙乙丁乙丙乙丁编号14151617181920212223242526随机数1724591865675446812947834R461752162214193262311组别甲甲丙甲甲丙丁丙丙甲丁丁乙配对设计与配伍组设计•先按配比条件将受试对象配成对子或区组,再将各对或各区组中的个体按随机分配的原则给予不同的处理。•优点:–该类设计是按配比条件将受试对象配成对子或配伍组,从而排除了诸多非处理因素对实验的影响,保证了各组间的可比性,减少了抽样误差;–该类设计增加了区组信息,可以减少样本含量,提高统计效率。•缺点:由于受配对或配伍条件的限制,有时难以将受试对象配成对子或配伍组,从而损失部分受试对象的信息;随机区组设计实例•例:欲比较周围神经端侧吻合与自体神经移植后神经再生效果,选用符合条件要求的同性别Wistar大鼠,切断左侧腓神经1cm,造成神经损伤模型。将15只大鼠配成5个区组,每区组内3只大鼠随机分配到3个不同的治疗组并考察效果。•随机分组步骤:–(1)将15只大鼠按体重顺序编号,分成5个区组;–(2)各区组分别指定随机排列表中第21-25行,抄录1-3之间的随机数;–(3)规定随机排列数为1者分入A组,2者分入B组,3者分入C组。•其过程如下:随机区组设计实例•分组结果:编号为1,5,9,10,13号动物分入A组;3,4,7,11,14号动物分入B组;2,6,8,12,15号动物分入C组。区组编号大鼠编号随机排列数与归组(括号内)11~31(A)3(C)2(B)24~62(B)1(A)3(C)37~92(B)3(C)1(A)410~121(A)2(B)3(C)513~151(A)2(B)3(C)交叉设计•交叉设计:是在自身配对设计基础上发展起来的。该设计考虑了一个处理因素(A、B两水平),两个与处理因素无交互作用的非处理因素(试验阶段和受试对象)对试验结果的影响。•优点:–具备自身配对的全部优点,如减少个体差异对处理因素的影响,节省样本含量等;–能控制时间因素(试验阶段)对处理方式的影响,因而优于自身对照设计;–各试验对象皆接受了试验因素和对照,符合医德要求。拉丁方设计•拉丁方设计:是按拉丁方阵的字母、行和列安排实验(或试验)的三因素等水平的设计。该设计同时考虑三个因素对试验结果的影响。析因设计•析因设计:是一种将两个或多个因素的各水平交叉分组,进行实验(或试验)的设计。•它不仅可以检验各因素内部不同水平间有无差异,还可检验两个或多个因素间是否存在交互作用。–若因素间存在交互作用,表示各因素不是独立的,一个因素的水平发生变化,会影响其它因素的实验效应;–反之,若因素间不存在交互作用,表示各因素是独立的,任一因素的水平发生变化,不会影响其它因素的实验效应。(六)研究中样本含量的估计样本含量估算(samplesizeestimate)是指应用一定的统计方法在保证研究结论有一定可靠性(精度和检验效能)的前提下所确定的最小样本量。样本量估算是反映研究设计中的重复原则,其意义是估计研究中误差与降低研究中的抽样误差。足够的样本量也是实验研究中保证组间均衡性的基础。样本含量估计充分反映科研设计中“重复”的原则,过大过小都有些弊端。样本量过大导致-浪费(人力、时间、物力)、引入更多混杂因素,对研究结果造成不良影响。样本量过小,导致检验效能过低,出现“假阴性”结果。在假设性检验中,统计意义不显著的结果,可能由二方面造成的:一、可能二组间是没有差别的;二、可能是二组间是有差别,但由于样本太小,不能用统计方法来证明这种结果。确定子样的大小,(1)二样本间个体数比例:当1/n1+1/n2是固定数值时,只要1/n1=1/n2时标准误是最小的。例如:n1=n2=10时,1/n1+1/n2=0.2n1=15,n2=5时,1/n1+1/n2=0.2667n1=19,n2=1时,1/n1+1/n2=1.0526(2)样本的个体数:原则上是二样本间均数差别愈大,需要的个体数愈少,均数差别愈小,需要个体数愈多,另一方面综合估计标准差愈小,则需要个体数愈少,标准差愈大,需要个体数愈多,因而在确定样本量之先,一定要知道标准差的约略值(二样本均数的约略差别)。正确估计观察例数的标准,应该是保证研究课题具有一定代表性与可靠性的条件下所必须具有的最少例数,要符合这一标准,必须具备以下条件:1.具有研究指标的总体标准差或总体反映了数据的变异度,这些值来源于以往的实验,通过查阅文献资料提供,或从研究者所作的预备实验结果中获取。值越大,所需的样本量也越大,总体率越接近0.5,所需样本量越多。2.容许误差与检验的差值δδ指研究者要求的或客观实际存在的样本统计量与总体参数间或样本统计量间的差值。容许误差δ可以用绝对误差,也可用相对误差表示。δ值越小,所需样本量也越大。3.第一类错误的概率越小,需要的例数越多,一般取=0.05,可根据具体情况进行调整。4.第二类错误的概率或检验的效能(1-
本文标题:试验(实验)设计与样本含量的估计
链接地址:https://www.777doc.com/doc-3432431 .html