您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 社会统计分析与SAS应用习题及答案及程序数据
《社会统计分析与SAS应用》习题及答案及程序数据附录A:1-17章习题及答案习题1答案1.社会调查的方法主要有哪些?答:社会调查的方法有多种,但最主要的有以下几种方法:问卷调查法、文献追踪法、内部资料调研法、访谈调查法、亲自实践法等。2.市场预测的主要内容是什么?答:所谓市场预测,是根据市场营销的状况以及供需趋势,总结现在,测算未来。预测的主要内容有:消费者的需求、国内市场动向、国外市场动向等。3.请仿照本章表1-3,自行设计出一份民意测验方面的问卷。答案:略4.问卷调查方式有哪几种?答:问卷调查至少有三种形式:(1)普查某个企业、某个群体的情况。(2)抽样调查(即抽查)某地区某几家企业的市场营销情况。(3)典型调查。5.问卷的基本结构有哪几大部分?答:在一般情况下,问卷的基本结构有以下三部分:(1)封面致敬信(2)正文问答题(3)封底指导语或(1)封面致敬信(2)扉页指导语(3)正文问答题上述两种结构形式,可任选其一。6.致敬信的内容主要是什么?答:致敬信的内容是给被访者看的一封求助信,其内容亲切诚恳与否,直接影响到被访者填表的态度认真与否,因此务必要语气亲切、求贤若渴,让人一看便能责无旁贷地、认真地填答。因此致敬信应是一封简短亲切的求助信。7.致敬信的正文应如何写?答:①正文的内容要中心突出,简明扼要。②正文内容要突出保密性。③一定要向被访者指明填答的方法。8.问卷编码时必须注意哪些事项?答:(1)一个编码格“□”只能填入一个数字(或一个字母),之后,每一份问卷都要如此编码。(2)一个变量的数值类型要保持一致,不能数字与字母混编。比如数字“1”表示男性,“2”表示女性时,那么,下一份问卷就不能改用“M”表示男性,“F”表示女性。(3)数据超范围的处理。如对年龄等变量,设计的是两个编码格“□□”,但偶尔遇到100岁以上的被访者,则属于数据超范围,最好应该统一增加一个编码格,这时,26岁应编码为026。(4)编码格“□”是为了清晰可见,对于熟练的研究人员,可以省略不用编码格“□”,而像第1章表1-4那样直接在问题的右端编码。9.写指导语要注意什么?答:指导语主要用来告诉填答者如何填好问卷中的答案,比如:(1)问卷中画横线“_____”处,请您填入符合自己情况的数字和答案。(2)问卷中的多项选择题,请在符合您自己情况的该项前面的序号上,画一个“○”;如:性别:①-男2-女(3)如果某些问题比较复杂,则应该逐一在题后用括号加以说明。比如:“(此题有5个答案,请选择最重要的1个)”,“(此题填法与上面相同)”,“(居住面积不包括阳台)”等。总之,问卷中模糊不清的地方一定要加以详细说明。10.问卷设计有何原则?答:(1)要便于回答。(2)要消除被访者的顾虑。(3)要按定量分析或定性分析分别设计问卷。(4)根据计算机处理或手工处理分别设计问卷。(5)根据自填式或他填式分别设计问卷。11.问卷中的问题有哪几类?答:(1)填答式:在问题的后面划出一道横线,答案要填在横线上,(2)是非题:在问题的后面列出两种判断(是与否、好与坏、对与错)。(3)多项选一:在一个问题的后面列举出两个以上的答案,供被访者选答其中最符合自己实际情况的一个答案。(4)矩阵式:把问题排成行,而把各种答案排成列。(5)表格式:是上述矩阵式的特殊形式。12.问卷中问题的答案有几大类?答:问卷中的问题有两大类:封闭式问题和开放式的问题。封闭式问题的答案可以由调查单位规定具体的答案。开放式的问题往往有五花八门的答案,一般难于硬性规定其答案(收入、身高、体重等区间(定距)以上变量除外)。13.封闭式答案必须注意哪些问题?答:封闭式问题的答案:设计时必须注意到“互斥性”、“穷尽性”。14.什么是区间(定距)以上的变量?宜用什么样的答案?答:所谓区间变量,国内俗称定距变量。它的变量值可以测量出一个区间的距离,比如:个人月收入、家庭的人均收入、年龄、身高、体重、分数,以及购买电视机有多少年等。区间(定距)以上的变量宜用开放性的答案。15.为什么说区间(定距)以上变量的答案不宜分组?答:对区间(定距)以上的变量值分组貌似有理,但是统计分析时就会犯难了。因为不能真正统计出本批问卷中人均月收入为多少。错误之处是很明显的:收入被分组后,原来的区间(定距)以上的数据就成了次序(定序)型数据,而次序型的数据只能计算它们的中位数,计算其平均收入则失去了原有的意义。16.问卷设计中常见的错误有哪些?答:问卷设计超出了计算机实际处理的能力,区间(定距)以上的变量错划了范围,问题的答案犯了嵌套的错误等。17.在社会调查和市场调查时为什么要采用量表法?答:此类调查需要了解消费者对某种商品的认可程度、购物意向,以及对某种商品价格的看法等深层次的问题。如果只是简单地采用“是”与“否”或“好”与“坏”的问法,甚至分为几个阶段,这样做固然可以,但是统计时往往无法预测出内在的结果;而且,遇到政策性较强或带有某种政治色彩的问题时,如果简单而直接地采用“是”与“否”或“好”与“坏”的问法,被访者因出于各种考虑而往往难于道出内心深处的真实看法。因此有必要采用量表法。18.什么是利克特的量表法?答:利克特是美国的一位社会心理学家,在20世纪30年代,他和一些科学家对上述量表中的“是”与“否”(或“赞成”与“不赞成”)两种答案进行了改进,分别增加了“头”、“尾”和“中间”三种答案,例如:“非常不赞成→不赞成→无所谓→赞成→非常赞成”;根据这5种回答,然后依次记为:1分→2分→3分→4分→5分。某人如果赞成什么事则记为4分,不赞成则记为2分,依此类推。从中可以计算出每人的得分以及群体总分是多少,以此可以判断某人对某事所持的态度。因此,利克特量表也被称为“累加量表”。习题2答案1.什么是观察值OBS?什么是变量及变量值?答:一份问卷或一个被访对象就是一个观察值。一份问卷中的每一个问题都是变量。每一个变量所对应的数据(如sex=1或sex=2)就叫做变量值VALUE。2.有哪几种变量类型?答:有2种变量类型。变量值是用阿拉伯数字表示时,该变量被称为“数值型”变量(或数字型变量)。变量值若用字母(或字母与数字的混合型)表示时,该变量则称作“字符串型”变量;此时,该变量名的后面必须附加一个美元符号“$”。同一个变量必须赋于同一类型的数据(变量值)。习题3答案1.变量值的栏目位置(栏位)有哪几种?答:自由格式和固定格式两种。2.如何定义“一行多个观察值数据的挖掘方法?答:用@符号定义。比如:INPUTEDCocu1sal1@@;3.SAS用什么命令调用外部数据文件?答:用INFILE命令调用外部数据文件。比如:INFILE’Older.Dat’;(调用当前目录中的Older.Dat数据文件)4.SAS用什么命令定义变量标签?变量标签处于程序的第几行?答:用LABEL命令定义变量标签。变量标签必须处于程序的DATA行后面。比如:DATAolder;LABELID1=’地区名称’CASEID=’观察值编号’EDC=’老年人的文化程度’ocu1=’退休前的职业’;INFILE’older.DAT’;5.SAS如何创造新变量?答:创建一个新变量,它等于老变量(在INPUT中已定义的变量)之间的数学运算。可使用的数学运算符及其书写方法见表A.1。表A.1SAS的数学运算符及其写法运算符功能及其公式SAS程序中通用写法+相加:Z=X+YZ=X+Y-相减:Z=X-YZ=X-Y*相乘:Z=X*YZ=X*Y/相除:Z=X/YZ=X/Y**乘方:Z=X**2Z=X*X例:Z=X+Y;6.SAS如何进行数据重新编码?答:举个年龄的例子,年龄可分为:①20岁以下,②20~40岁,③40~60岁,④60岁以上等年龄组,重新编码的命令如下:PROCFORMAT;VALUEageFLOW-20=’1’20-40=’2’40-60=’3’60-High=’4’;FORMATageageF.;习题4答案1.熟练掌握“在Work工作区中直接输入数据”的技巧。(答案略)2.请比较ASSIST视窗与“分析”(Analysis)对话框在统计中的用法。(答案略)3.为什么说用2.2节和4.4节介绍的数据输入法是最佳的方法?答:对于样本量只有几十个OBS的数据,在Work工作区中直接输入数据目前是SAS系统的一种简易的数据输入法。而图2.1这种数据输入法也叫命令编程法,是最切实可行又多快好省的数据输入法。习题5答案1.总体与样本有何本质区别?答:总体(population)是样本测量值的集合。对于感兴趣的整个组中,每个成员都对应一个这样的值。具体说来是某省的人口(总体)或工业产值(总体)中的某个指标测量值的集合,而不是那些人或物的集合。样本(sample)虽然也是一些值的集合,但不代表整个感兴趣的组。比如,一个样本可以是某省中某县的人口的集合或某县工业产值的集合。2.参数与统计量有何本质区别?答:由于总体与样本的不同,由此派生出参数与统计量的差别。(1)参数:参数(parameters)是总体的测量值,用希腊字母表示。(2)统计量:统计量(statistics)则是样本的测量值,用一般的英文字母表示见第5章表5.1。3.在SAS统计分析软件中,均值、标准偏差、方差这三种测量值是什么含义?答:(1)均值:用以描述数据(变量值)分布的中心位置。定距以上的数据计算均值才有意义。比如,对于一个总体(某省)的人口,其平均值称为总体均值(populationgmean),记为μ。对于某样本(某县)的人口,其平均人口则称为样本均值(sampleaverage),记为-X。总体均值和样本均值的计算公式是相同的。但是其他测量值不一定相同。此外,还有方差、标准偏差等概念。(2)标准偏差:也称为标准差。表示某人的身高或收入等测量值偏离均值多少。比如甲班语文成绩的标准偏差为20,乙班语文成绩的标准偏差为30,那么,乙班语文成绩比甲班的语文成绩变化(波动)大。(3)方差:标准偏差的平方则是方差。方差表示数据内部的变异性。4.什么是正态分布?它有什么特征?答:统计学上,一般都是假设被统计的样本是来自正态分布(Normaldistribution)的总体。正态分布是关于总体的一种理论分布,是有严格的数学定义的。从正态分布的总体中抽取的样本一般是服从正态分布的。正态分布的重要特征有:(1)均值:均值是观察值的平均值(Meanvalue)。定距(Interval)以上的变量值的均值才有意义。(2)众数:众数是最经常发生的频数。众数是对定类变量(Nominal)而言的。比如某班有男生25名、女生15名,那么,该班男生的人数是众数。(3)中位数:中位数是对次序(Ordinal)变量值而言的。中位数是比取值的一半大、同时又比取值的一半小的值。或者说,中位数的一半落在均值之上,同时,另一半则落在均值之下。中位数的取值方法有两种:·单数情况下的观察值的中位数;·双数情况下的观察值的中位数。(4)正态分布的均值、众数、中位数重叠:将正态分布的图形沿着中心位置对半折叠时,均值、众数、中位数三者重叠在一起。5.经验规则有哪些?答:如果数据来自服从正态分布的总体,可用下面的经验规则很快地概括出我们的数据。经验规则有:·68%的观察值是落在离均值一个标准偏差(1σ)的范围内。·95%的观察值是落在离均值两个标准偏差(2σ)的范围内。·99%的观察值是落在离均值三个标准偏差(3σ)的范围内。6.检验数据正态性的主要统计量有哪些?答:正态性检验的重要统计量是取决于概率P值(参阅第5章图5.2中Pr<W后面的值)。Pr<W:这是概率值,此值在0~1之间,表示对于正态性的可拒绝程度。当此值小于给定的5%(α值)时,说明数据不是来自正态分布的总体。比如概率值为0.05,由于不小于α值0.05,所以没有理由拒绝H0;说明该样本数据服从正态分布。如果样本规模太小(一般不少于200个OBS),则要观察附加的统计量(比如条形图、正态概率图、茎叶图、框图或偏度、峰度)。在附加的统计量中茎叶图和正态概率图比较直观;但在只有几十个观察值的情
本文标题:社会统计分析与SAS应用习题及答案及程序数据
链接地址:https://www.777doc.com/doc-2230202 .html