您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > 广东省健康教育信息统计骨干培训班教材
广东省健康教育信息统计骨干培训班教材(2009年)广东省健康教育研究所二OO九年一月目录第一部分部分调查设计……………………………………………1.1调查读者论坛概述……………………………………………………1.2抽样调查及样本量计算……………………………………………1.3常见的调查方式………………………………………………………1.4调查表设计及调查表评价…………………………………………1.5调查组织与实施……………………………………………………1.6统计分析步骤和调查报告撰写…………………………………第二部分数据管理软件EpiData应用…………………2.1EpiData概述………………………………………………………2.2创建数据库……………………………………………………………2.3生成数据文件…………………………………………………………2.4编写核对程序…………………………………………………………2.5数据录入………………………………………………………………2.6数据转出………………………………………………………………2.7数据双录入核对……………………………………………………2.8数据的追加和合并…………………………………………………第三部分资料统计分析过程中常用的软件介绍中常用的软件介绍……………………………………第四部分SPSS学习手册………………………………………4.1SPSS的概述………………………………………………………4.2SPSS数据文件的建立…………………………………………4.3描述性分析……………………………………………………………4.4统计图…………………………………………………………………4.5连续变量的假设检验(t检验、方差分析)………………112571313161617191921222222243333363839434.6分类变量的假设检验(X2检验)………………………………47505563第五部分附录5.1EpiDataEntry[数据录入模块]介绍………………………5.2EpiDataAnalysis[数据分析模块]介绍……………………5.3统计公式………………………………………………………………说明:①EpiData和EpiDataAnalysis请在以下地址下载②SPSS学习手册的数据文件请在以下地址下载③更多信息请关注“广东健康教育网”调查设计调查设计广东省健康教育研究所林丰广东省健康教育研究所林丰•广东省健康教育信息统计培训班提要…1•调查设计概述2•抽样调查及样本量计算3•常见的调查方式4•调查表设计及调查表评价5•调查组织与实施6•统计分析步骤和调查报告撰写美国大选•据美国皮尤(PEW)研究中心昀新的民调显示,奥巴马以52%对36%的支持率优势在全美领先麦凯恩16个百分点。在已参与提前投票的选民中,奥巴马领先19个百分点。•调查显示,自九月中旬以来,麦凯恩在多数选民人群中连续四次支持度大幅下滑。目前,麦凯恩只在福音派新教徒人群中扔占有较大优势。9月初,麦凯恩在白人选民中有52%的支持率,奥巴马仅有38%。但是现在两位候选人在白人选民中的支持率均为44%。在各红色州,奥巴马与麦凯恩的支持率也基本持平。•在已经参与提前投票的选民中(占选民人数15%),奥巴马以53%对34%的优势大幅领先麦凯恩19个百分点。在准备提前投票投票但尚未投票的选民中(占选民人数16%),有56%支持奥巴马,37%支持麦凯恩,奥巴马同样领先19%。•调查还显示,有半数选民认为,麦凯恩如果当选,将偏袒富人;与此同时,只有17%的选民认为,奥巴马当选后会偏袒非洲裔美国人。•此次调查是在全美1325名已注册选民中进行的。调查同时还显示,尽管距离大选仅有一周,但仍有8%的选民尚未决定投票给麦凯恩或奥巴马。第五次全国人口普查根据国务院的决定,我国于2000年11月1日进行了第五次全国人口普查的登记工作。调查(survey)是指在没有任何干预措施的条件下客观地观察和记录研究对象的现状及其相关特征。对客观事物不加任何人工干预的观察研究称为“调查研究”。“调查设计”是对调查研究做的周密计划。1•调查设计概述调查设计的基本原则与内容1、明确调查目的每一项调查,必须有明确的调查目的。调查目的一般可分为调查的总目的和具体目的。调查目的是选定调查指标的依据。2、确定调查对象和观察单位根据调查目的确定调查对象,即明确调查总体的同质范围。在确定的总体范围内,组成调查对象的每个个体即为观察单位。观察单位可以是一个人、一个家庭或一个群体。3、确定调查方法按调查的涉及面,一般可分为普查(overallsurvey)和抽样调查(samplingsurvey)。抽样调查是医学科研中昀为常用的方法。调查方法还可按调查的内容发生的时间,分为横断面调查(cross-sectionalstudy)和纵向调查(longitudinalstudy);按资料的来源,可分为现场调查和利用现有资料两种;按调查方式,可分为面对面调查和非面对面调查(信访、电话采访等)两种。4、确定调查指标和变量调查目的是选定调查指标的依据,调查指标是调查目的的具体体现。设计时,应将调查目的转化为具体的调查指标。调查指标可分为客观指标和主观指标,还可分为定性指标和定量指标。一个指标可以是一个或几个变量,也可以是几个指标构成一个变量。指标的设立应注意灵敏性、特异性和客观性,并紧扣研究目的,做到少而精。5、调查工具准备和调查表设计调查工具(instruments)可分为两类,一类是“硬”工具,一类是“软”工具。如尺、秤、温度计等是“硬”工具;调查表和问卷等是“软”工具。调查工具必须标准化,要防止系统误差。工具的使用和调查结果的记录也必须标准化。6、确定样本含量为什么要确定样本含量或者说其意义有哪些?可以控制统计量的抽样误差,样本含量越大,标准误越小;提高估计的精度,增大样本含量是控制可信区间的宽度的有效办法;增大样本含量是控制统计分析中Ⅱ型错误的概率大小的有效措施;表示抽样误差的指标(各种标准误)的抽样误差也与样本含量有关(如样本方差的方差)。7、调查员培训8、资料录入与分析,撰写调查报告普查也称全面调查(completesurvey),是对调查范围内的全部观察对象(总体)进行调查,一般用于了解总体在某一特定“时点”的情况。抽样调查是一种非全面调查,是从总体中抽取一定数量的观察单位组成样本,然后根据样本信息来推断总体特征。2•抽样调查及样本量计算•调查•普查•非全面调查(广义的抽样调查)•概率抽样调查•非概率抽样调查调查方法为什么要抽样1、解决不可能或不必要进行普查的社会经济现象对具破坏性或耗损性检验:某种品牌的医用胶布有无残留细菌对无限总体调查:空气质量2、经费、人力、物力和时间有限下,采取抽调查方式。3、可对同一现象在不同时间连续进行,了解发展变化。4、运用抽样调查对普查进行验证。概率抽样调查概念:按照一定的概率从构成总体的所有单元中随机抽取一部分单元进入样本的抽样方法。特点:1、能够表明一个确定的样本包含哪些单元;2、对每个样本,都有一个确定的被抽中的概率;3、以随机原则抽取样本;4、可以通过样本统计量推断总体参数。常用的概率抽样方法包括:简单随机抽样、系统抽样、分层抽样和整群抽样。各种抽样方法的抽样误差一般是:整群抽样≥简单随机抽样≥系统抽样≥分层抽样(1)简单随机抽样在某个总体中以完全随机的方法抽取一部分个体组成样本。具体方法:将调查总体的全部观察单位编号,再用抽签法或随机数字表等方法在抽样框中随机抽取部分观察单位组成样本。总体较大时,难以对总体中的每一个体一一编号,且样本分散,不易组织调查简单直观,均数(或比率)及标准误计算简便缺点优点简单随机抽样举例及实施某班有学生100人,欲抽取10人参加夏令营活动。为了体现公平性,使每个学生都有同等机会参与,采取单纯随机抽样。方法是:1、随机表法:先将100个学生编为0-99号,然后用随机数字表,从任意一个随机数字开始(比如从第一行第一列的两位数22开始),横向(也可纵向)依次读取10个随机数字(每个都是两位数,有相同者跳过)2、抽签法:先将100个学生编为0-99号,然后做分别写上0-99的签,随机抽取10个。3、EXCEL操作:产生[M,N]之间的随机整数可以使用公式Int(Rand()*(M-N+1))+NExcle抽样举例注:本功能需要使用Excel扩展功能,如果您的Excel尚未安装数据分析,请依次选择“工具”-“加载宏”,在安装光盘的支持下加载“数据分析库”。加载成功后,可以在工具的下拉菜单中看到“数据分析”选项。选择“工具”-“数据分析”-“抽样”后,出现对话框,依次选择。选中样本数据列,依次执行“数据”-“筛选”-“高级筛选”。简机随机抽样的样本量计算总体均数估计的样本量计算总体率估计的样本量计算22/2222/2NunNuαασδσ××=×+×2/222/2(1)(1)NuPPnNuPPααδ∧∧∧∧××−=×+×−e.g.资料显示冠心病患者血清胆固醇的标准差约为0.94mmol/L。现准备抽样调查了解10000名冠心病患者血清胆固醇的总体均数。要求估计的总体均数与真实值之差大于0.1的概率不超过0.05。问应该调查多少人?某大学10000名本科生,现欲了解在暑期参加各类英语培训班的学生的比例。假设比例约为0.30,容许误差定为5%。问需要抽样调查多少学生?22/22222/2(1)10001.960.3(10.3)24410000.051.960.3(10.3)(1)NuPPnNuPPααδ∧∧∧∧××−××−==≈×+×−×+×−2222/2222222/2100001.960.942535()100000.11.960.94NunNuαασδσ××××==≈×+××+×取整数(2)系统抽样又称机械抽样,按照某种顺序给总体中的各个体编号,然后随机地抽取一个编号作为第一个调查个体(即随机起点),其它的调查个体则按照某种确定的规则抽取。昀简单昀常见的系统抽样是等距抽样。具体方法:机械地每隔若干号码抽取一个个体组成样本,抽取的样本编号为:i,i+K,i+2K,i+3K,……,I+(0-1)k若总体观察对象有周期趋势或单高增(减)时,容易产生明显的偏倚易于理解,简便易行;容易得到一个有代表性的样本缺点优点机械抽样举例及实施如要在1000名大学一年级新生中抽取200人作为样本。方法:1000名同学编号1-1000计算抽样间隔为1000/200=5从1到5中随机抽一个数若随机抽取的第一号为2,则抽取的个体号依次为2,7,12,17,22,27…系统抽样的样本量计算22/2222/2NZnNZαασδσ××=×+×总体均数估计的样本量计算总体率估计的样本量计算2/222/2ˆˆ(1)ˆˆ(1)(1)ZPPNnNZPPααδ−=−+−e.g.从4000名生活在某地区的儿童中,等距随机抽取50名作初步调查,发现30人有蛔虫。欲以95%的置信度,估计与总体患蛔虫概率P的相差不大于5%,需用多大样本?±2/222/2222ˆˆ(1)ˆˆ(1)(1)1.960.6(10.6)40003380.05(40001)1.960.6(10.6)ZPPNnNZPPααδ−=−+−××−×=≈−+××−(3)分层抽样分层抽样:所谓分层抽样(stratifiedsampling)是先按对观察指标影响较大的某种特征,将总体分为若干类别(统计上称之为“层”,strata),再从每一层内随机抽取一定数量的观察单位,合起来组成样本。分层的原则是层间差别越大越好,层内差别越小越好。在样本总含量n确定后,有两种比较常用的方法来分配各层的观察单位数ni。组织较难代表性好,抽样误差小,可以对不同层进行独立分析缺点优点分层方
本文标题:广东省健康教育信息统计骨干培训班教材
链接地址:https://www.777doc.com/doc-976189 .html