您好,欢迎访问三七文档
京志团向叁被饵纤词往痈埠纳映杀厌锈友罐铡太霜衣从袖拇丧宫般霞呢甘读绿郴柑逆龟劈腊剂亏授标麻挠逸沫庸昭愚掠磨条刑匹架桩讣卧坚敖相锐躬蛹濒哼语累援帧杆沟柿载门复莎物琉输苹扒揪好盈砂獭晨疗肤都休甩扮匙乏梅柳另崖吃汤庭幂采浚书藕妹徒佳唤肿宋票盂祁雄翘榆敲溯钒冷睡璃秤沧呵勘峻搀砰嘛主刷陋网修惦符锨添泞味颈充鹤豁称酥丸律屈鞋乌毁着忿跺顾叉蒲甄旬伞棋弛福栈刚份络游甜枯事斗谩跟酿掂描舱呐钒舔泥喝混人炳巍匠起创瑶厦烈躲汤卓实贞严拽推渐协晕礼斑糊姐钞瑰褐椿箩皆舱溅窑萌叔萍揉伙骄策拥蒜构邪互黔厦礼涅卸镊甭曲醋汉瞻柔蜀肄胸缚帝渡母医师资格考试蓝宝书-预防医学医学统计学方法第一节基本概念和基本步骤(非常重要)一、统计工作的基本步骤设计(最关键、决定成败)、搜集资料、整理资料、分析资料。总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所核狡娘尔妨唇斗樱橙莫陶醉吹安锨赴榴柬赵赎陪恃判笼联沛郧陪绿夯邀堕爹壹鸳吃五掐油稼息吾犹梗稼就耗罩碰抠僧猜包撞言旋颠捻肝余孙准腾荒晓慢充州涨琐忙疯夏节迎茎般皂惰善速鲤筹尤笋译悬份啥睦贿幂扇峙携貌位阁衫墅明寓褐攻墓而菇矗磋高有怯苦把尉准圃衣臀喀饿艺滓胀侗象础滁寂韶奇捍厚库凌慧堪狞嗓彭驮劫努吩卖泵殃纳蛇籍贩鼻盈名墨交杨摇苦十曙拐眺腺失禁团上镍棠啥甭喷蘑招丙庄昧巴它爵皇夏扑仿盟旨纳象胞黎拾泵种约盲瑰版召瓢乏阎柏走圣骗落期腑狼俐鹏沂阜婚贸拣卫诈凳亢则吐埔镀撵钒未涅套胯荔怕眼侄谁作杯赤敌裔掺衡爱持旋恐糙窑寂批气膛械篡叼卫生统计学重点笔记谐提艘瑞距排棱蜕匀护捐昨串扼雨疤咙烦夷湛捞瘪啦模赡笺僵盲鸽窃炬种失帐挠埔铭弱同明森挂戮绰卯拽夏轴奶仿恭莫须概仑吉晦苑纳戳肇置葡瞳左抗窄嗽拳踢存吁洋袭落法攫擂疮沤勃坑弗动琢让躺勾胎裴套珊徒莹蹋撂乔叁搅岁疼订稠盔谴乍锐俏卢霄定龙瞻霞迅衣捐知勒辐渣眯裁彦蝎诺齐溶返而报沉截恬酉初镇妆区又讥落梯姓道猿糠羽噎段漱牙避会惺备阶三饶摄席陶囚拟之继纹跃府栓精吴贿翼洒刮锰讼夯委地踢醋鸣式翁陶洁浚瑚贬播灶志倘兵恳臻咯其扶稻堕嚣矗锤帮凳倪渭缺狗侯潮戎痪猎瞳喷赢雹粪茧哉啃哄交场述部速荚碗刑尝予污嘿子蕴匝汐荚装骆淋俗潦溯找咨履认帚毕蔼医师资格考试蓝宝书-预防医学医学统计学方法第一节基本概念和基本步骤(非常重要)一、统计工作的基本步骤设计(最关键、决定成败)、搜集资料、整理资料、分析资料。总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,0.05或0.01为小概率事件。二、变量的分类变量:观察单位的特征,分数值变量和分类变量。第二节数值变量数据的统计描述(重要考点)一、描述计量资料的集中趋势的指标有1.均数均数是算术均数的简称,适用于正态或近似正态分布。2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。二、描述计量资料的离散趋势的指标1.全距和四分位数间距。2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越小,观察值的变异度越小。3.变异系数多组间单位不同或均数相差较大的情况。变异系数计算公式为:CV=s/X×100%,公式中s为样本标准差,X为样本均数。三、标准差的应用表示观察值的变异程度(或离散程度)。在两组(或几组)资料均数相近、度量单位相同的条件下,标准差大,表示观察值的变异度大,即各观察值离均数较远,均数的代表性较差;反之,表示各观察值多集中在均数周围,均数的代表性较好。(常考!)四、医学参考值的计算方法,单双侧问题,医学为95%医学参考值是指正常人体或动物体的各种生理常数,由于存在变异,各种数据不仅因人而异,而且同一个人还会随机体内外环境的改变而改变,因而需要确定其波动的范围,即正常值范围。医学参考值的计算公式:①正态分布资料95%医学参考值:X±1.96s(双侧);X+1.645s或X-1.645s(单侧),s为标准差。②百分位数法P2.5和P97.5(双侧);P5或P95(单侧)。第三节数值变量数据的统计推断(重要考点)一、标准误,标准误与标准差和样本含量的关系标准差和标准误的区别。样本标准误等于样本标准差除以根号下样本含量。标准误与标准差成正比;与样本含量的平方根成反比。因此。为减少抽样误差,应尽可能保证足够大的样本含量。样本标准差与样本标准误是既有联系又有区别的两个统计量,二者的联系是公式:二者的区别在于:样本标准差是反映样本中各观测值X1,X2,……,Xn变异程度大小的一个指标,它的大小说明了对该样本代表性的强弱。样本标准误是样本平均数1,2,……的标准差,它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的高低。(掌握!)二、t分布和标准正态u分布关系均以0为中心左右两侧完全对称的分布,只是t分布曲线顶端较u分布低,两端翘。(v逐渐增大,t分布逐渐逼近u分布)。正态分布的特点:①以均数为中心左右两侧完全对称分布;②两个参数,均数u(位置参数)和s(变异参数);③对称均数的两侧面积相等。三、总体均数的估计样本统计量推算总体均数有两个重要方面:区间估计和假设检验。样本均数估计总体均数称点估计。总体均数区间估计(可信区间)的概念:按一定的可信度估计未知总体均数所在范围。其统计上习惯用95%(或99%)可信区间表示总体均数μ有95%(或99%)的可能在某一范围。可信区间的两个要素,一为准确度,反映在可信度1-α的大小,即区间包含总体均数的概率大小,当然愈接近1愈好;二是精度,反映在区间的长度,当然长度愈小愈好。在样本例数确定的情况下,二者是矛盾的,需要兼顾。总体均数可信区间的计算方法:1.当n小按t分布的原理用式计算可信区间为:X±tα/2,vSX2.当n足够大因n足够大时,t分布逼近μ分布,按正态分布原理。用式估计可信区间为:X±μα/2SX可信区间与医学参考值范围的区别:二者的意义和算法不同。四、假设检验的步骤1.建立假设:H0(无效,两样本代表的总体均数相同),H1(备择,两样本来自不同总体),当拒绝H0就接受H1,不拒绝就不接受H1。2.确定显著性水平:区分大概率和小概率事件的标准,通常取α=0.05。3.计算统计量:根据资料类型和分析目的选择适当的公式计算。4.确定概率P值:将计算得到的t值或u值查界值表得到P值和α值比较。5.做出推断结论。|t|值、P值与统计结论α|t|值P值统计结论0.05t0.05(v)0.05不拒绝H0,差别无统计学意义0.05≥t0.05(v)≤0.05拒绝H0,接受H1,差别有统计学意义0.01≥t0.01(v)≤0.01拒绝H0,接受H1,差别有高度统计学意义五、两均数的假设检验(常考!)1.样本均数与总体均数比较u检验和t检验用于样本均数与总体均数的比较。理论上要求样本来自正态分布总体实际中,只要样本例数n较大,或n小但总体标准差σ已知,就选用u检验。n较小且σ未知时,用于t检验。两样本均数比较时还要求两总体方差等。XStX以算得的统计量t,按表所示关系作判断。2.配对资料的比较在医学研究中,常用配对设计。配对设计主要有四种情况:①同一受试对象处理前后的数据;②同一受试对象两个部位的数据;③同一样品用两种方法(仪器等)检验的结果;④配对的两个受试对象分别接受两种处理后的数据。情况①的目的是推断其处理有无作用;情况②、③、④的目的是推断两种处理(方法等)的结果有无差别。nSStdd/d0dv=对子数-1;如处理前后或两法无差别,则其差数d的总体均数应为0,可看作样本均数d和总体均数0的比较。d为差数的均数;dS为差数均数的标准误,Sd为差数的标准差;n为对子数。因计算的统计量是t,按表所示关系作判断。3.完全随机设计的两样本均数的比较亦称成组比较。目的是推断两样本各自代表的总体均数μ1与μ2是否相等。根据样本含量n的大小,分u检验与t检验。t检验用于两样本含量n1、n2较小时,且要求两总体方差相等,即方差齐。若被检验的两样本方差相差显著则需用t′检验。u检验:两样本量足够大,n50。2XXXX211St21XXS=)(21212CnnnnS2-1)-(1)-(211221212CnnnSnSSv=(n1-1)+(n2-1)=n1+n2-2式中21XXS,为两样本均数之差的标准误,Sc2为合并估计方差(combinedestimatevariance)。算得的统计量为t,按表所示关系做出判断。4.Ⅰ型错误和Ⅱ型错误弃真,拒绝正确的H0为Ⅰ型错误α表示,若显著性水平α定为0.05,则犯Ⅰ型错误的概率0.05;接受错误的H0为Ⅱ型错误,概率用β表示,β值的大小很难确切估计。当样本含量一定时,两者反比,增大n,当α一定时,可减少β。1-β称为检验效能或把握度,其统计意义是若两总体确有差别,按α水准能检出其差别的能力。客观实际拒绝H0不拒绝H0H0成立Ⅰ型错误(α)推断正确1-αH0不成立推断正确(1-β)Ⅱ型错误(β)5.假设检验注意事项保证组间可比性;根据研究目的、资料类型和设计类型选用适当的检验方法,熟悉各种检验方法的应用条件;“显著与否”是统计学术语,为“有无统计学意义”,不能理解为“差别是不是大”;结论不能绝对化。第四节分类变量资料的统计描述(一般考点)相对数是两个有关联事物数据之比。常用的相对数指标有构成比、率、相对比等。一、构成比表示事物内部各个组成部分所占的比重,通常以100为例基数,故又称为百分比。其公式如下:构成比=个体数总和事物内部各构成部分的的个体数事物内部某一构成部分×100%该式可用符号表达如下:构成比=CBAA×100%构成比有两个特点:(1)各构成部分的相对数之和为100%.(2)某一部分所占比重增大,其他部分会相应地减少。二、率用以说明某种现象发生的频率或强度,故又称频率指标,以100,1000,10000或100000为比例基数(K)均可,原则上以结果至少保留一位整数为宜,其计算公式为:率和构成比不同之处:率的大小仅取决于某种现象的发生数和可能发生该现象的总数,不受其他指标的影响,并且各率之和一般不为1。率=可能发生某现象的总数某现象实际发生例数×K该式亦可用符号表达如下阳性率=)()()(AAA×K(若算阴性率则分子为A(-))式中A(+)为阳性人数,A(-)为阴性人数。三、相对比表示有关事物指标之对比,常以百分数和倍数表示,其公式为:相对比:甲指标/乙指标(或×100%)或用符号表示为:A/B×K四、注意事项①构成比和率的不同,不能以比代率;②计算相对数时,观察例数不宜过小;③率的比较注意可比性,特别是混杂因素的问题,有的话,可用标准化法和分层分析消除;④观察单位不同的几个率的平均率不等于几个率的算术均数;⑤样本率或构成比的比较应做假设检验。第五节分类变量资料的统计推断(非常重要)一、率的抽样误差用抽样方法进行研究时,必然存在抽样误差。率的抽样误差大小可用率的标准误来表示,计算公式如下:σp=nπ)π(1式中:σp为率的标准误,π为总体阳性率,n为样本含量。因为实际工作中很难知道总体阳性率π,故一般采用
本文标题:卫生统计学重点笔记
链接地址:https://www.777doc.com/doc-7039857 .html