社会统计分析与SAS应用习题及答案及程序数据

《社会统计分析与SAS应用》习题及答案及程序数据附录A：1-17章习题及答案习题1答案1.社会调查的方法主要有哪些？答：社会调查的方法有多种，但最主要的有以下几种方法：问卷调查法、文献追踪法、内部资料调研法、访谈调查法、亲自实践法等。2.市场预测的主要内容是什么？答：所谓市场预测，是根据市场营销的状况以及供需趋势，总结现在，测算未来。预测的主要内容有：消费者的需求、国内市场动向、国外市场动向等。3.请仿照本章表1-3，自行设计出一份民意测验方面的问卷。答案：略4.问卷调查方式有哪几种？答：问卷调查至少有三种形式：（1）普查某个企业、某个群体的情况。（2）抽样调查（即抽查）某地区某几家企业的市场营销情况。（3）典型调查。5.问卷的基本结构有哪几大部分？答：在一般情况下，问卷的基本结构有以下三部分：（1）封面致敬信（2）正文问答题（3）封底指导语或（1）封面致敬信（2）扉页指导语（3）正文问答题上述两种结构形式，可任选其一。6.致敬信的内容主要是什么？答：致敬信的内容是给被访者看的一封求助信，其内容亲切诚恳与否，直接影响到被访者填表的态度认真与否，因此务必要语气亲切、求贤若渴，让人一看便能责无旁贷地、认真地填答。因此致敬信应是一封简短亲切的求助信。7.致敬信的正文应如何写？答：①正文的内容要中心突出，简明扼要。②正文内容要突出保密性。③一定要向被访者指明填答的方法。8.问卷编码时必须注意哪些事项？答：（1）一个编码格“□”只能填入一个数字（或一个字母），之后，每一份问卷都要如此编码。（2）一个变量的数值类型要保持一致，不能数字与字母混编。比如数字“1”表示男性，“2”表示女性时，那么，下一份问卷就不能改用“M”表示男性，“F”表示女性。（3）数据超范围的处理。如对年龄等变量，设计的是两个编码格“□□”，但偶尔遇到100岁以上的被访者，则属于数据超范围，最好应该统一增加一个编码格，这时，26岁应编码为026。（4）编码格“□”是为了清晰可见，对于熟练的研究人员，可以省略不用编码格“□”，而像第1章表1-4那样直接在问题的右端编码。9.写指导语要注意什么？答：指导语主要用来告诉填答者如何填好问卷中的答案，比如：（1）问卷中画横线“_____”处，请您填入符合自己情况的数字和答案。（2）问卷中的多项选择题，请在符合您自己情况的该项前面的序号上，画一个“○”;如：性别：①-男2-女（3）如果某些问题比较复杂，则应该逐一在题后用括号加以说明。比如：“（此题有5个答案，请选择最重要的1个）”，“（此题填法与上面相同）”，“（居住面积不包括阳台）”等。总之，问卷中模糊不清的地方一定要加以详细说明。10.问卷设计有何原则？答：（1）要便于回答。（2）要消除被访者的顾虑。（3）要按定量分析或定性分析分别设计问卷。（4）根据计算机处理或手工处理分别设计问卷。（5）根据自填式或他填式分别设计问卷。11.问卷中的问题有哪几类？答：（1）填答式：在问题的后面划出一道横线，答案要填在横线上，（2）是非题：在问题的后面列出两种判断（是与否、好与坏、对与错）。（3）多项选一：在一个问题的后面列举出两个以上的答案，供被访者选答其中最符合自己实际情况的一个答案。（4）矩阵式：把问题排成行，而把各种答案排成列。（5）表格式：是上述矩阵式的特殊形式。12.问卷中问题的答案有几大类？答：问卷中的问题有两大类：封闭式问题和开放式的问题。封闭式问题的答案可以由调查单位规定具体的答案。开放式的问题往往有五花八门的答案，一般难于硬性规定其答案（收入、身高、体重等区间（定距）以上变量除外）。13.封闭式答案必须注意哪些问题？答：封闭式问题的答案：设计时必须注意到“互斥性”、“穷尽性”。14.什么是区间（定距）以上的变量？宜用什么样的答案？答：所谓区间变量，国内俗称定距变量。它的变量值可以测量出一个区间的距离，比如：个人月收入、家庭的人均收入、年龄、身高、体重、分数，以及购买电视机有多少年等。区间（定距）以上的变量宜用开放性的答案。15.为什么说区间（定距）以上变量的答案不宜分组？答：对区间（定距）以上的变量值分组貌似有理，但是统计分析时就会犯难了。因为不能真正统计出本批问卷中人均月收入为多少。错误之处是很明显的：收入被分组后，原来的区间（定距）以上的数据就成了次序（定序）型数据，而次序型的数据只能计算它们的中位数，计算其平均收入则失去了原有的意义。16.问卷设计中常见的错误有哪些？答：问卷设计超出了计算机实际处理的能力，区间（定距）以上的变量错划了范围，问题的答案犯了嵌套的错误等。17.在社会调查和市场调查时为什么要采用量表法？答：此类调查需要了解消费者对某种商品的认可程度、购物意向，以及对某种商品价格的看法等深层次的问题。如果只是简单地采用“是”与“否”或“好”与“坏”的问法，甚至分为几个阶段，这样做固然可以，但是统计时往往无法预测出内在的结果;而且，遇到政策性较强或带有某种政治色彩的问题时，如果简单而直接地采用“是”与“否”或“好”与“坏”的问法，被访者因出于各种考虑而往往难于道出内心深处的真实看法。因此有必要采用量表法。18.什么是利克特的量表法？答：利克特是美国的一位社会心理学家，在20世纪30年代，他和一些科学家对上述量表中的“是”与“否”（或“赞成”与“不赞成”）两种答案进行了改进，分别增加了“头”、“尾”和“中间”三种答案，例如：“非常不赞成→不赞成→无所谓→赞成→非常赞成”;根据这5种回答，然后依次记为：1分→2分→3分→4分→5分。某人如果赞成什么事则记为4分，不赞成则记为2分，依此类推。从中可以计算出每人的得分以及群体总分是多少，以此可以判断某人对某事所持的态度。因此，利克特量表也被称为“累加量表”。习题2答案1.什么是观察值OBS？什么是变量及变量值？答：一份问卷或一个被访对象就是一个观察值。一份问卷中的每一个问题都是变量。每一个变量所对应的数据(如sex=1或sex=2)就叫做变量值VALUE。2.有哪几种变量类型？答：有2种变量类型。变量值是用阿拉伯数字表示时，该变量被称为“数值型”变量(或数字型变量)。变量值若用字母(或字母与数字的混合型)表示时，该变量则称作“字符串型”变量；此时，该变量名的后面必须附加一个美元符号“$”。同一个变量必须赋于同一类型的数据(变量值)。习题3答案1.变量值的栏目位置(栏位)有哪几种？答：自由格式和固定格式两种。2.如何定义“一行多个观察值数据的挖掘方法？答：用@符号定义。比如：INPUTEDCocu1sal1@@；3.SAS用什么命令调用外部数据文件？答：用INFILE命令调用外部数据文件。比如：INFILE’Older.Dat’；(调用当前目录中的Older.Dat数据文件)4.SAS用什么命令定义变量标签？变量标签处于程序的第几行？答：用LABEL命令定义变量标签。变量标签必须处于程序的DATA行后面。比如：DATAolder；LABELID1=’地区名称’CASEID=’观察值编号’EDC=’老年人的文化程度’ocu1=’退休前的职业’；INFILE’older.DAT’；5.SAS如何创造新变量？答：创建一个新变量，它等于老变量(在INPUT中已定义的变量)之间的数学运算。可使用的数学运算符及其书写方法见表A.1。表A.1SAS的数学运算符及其写法运算符功能及其公式SAS程序中通用写法＋相加：Z=X＋YZ=X＋Y－相减：Z=X－YZ=X－Y*相乘：Z=X*YZ=X*Y/相除：Z=X/YZ=X/Y**乘方：Z=X**2Z=X*X例：Z=X＋Y；6.SAS如何进行数据重新编码？答：举个年龄的例子，年龄可分为：①20岁以下，②20～40岁，③40～60岁，④60岁以上等年龄组,重新编码的命令如下：PROCFORMAT；VALUEageFLOW－20=’1’20－40=’2’40－60=’3’60－High=’4’；FORMATageageF.；习题4答案1.熟练掌握“在Work工作区中直接输入数据”的技巧。(答案略)2.请比较ASSIST视窗与“分析”(Analysis)对话框在统计中的用法。(答案略)3.为什么说用2.2节和4.4节介绍的数据输入法是最佳的方法？答：对于样本量只有几十个OBS的数据，在Work工作区中直接输入数据目前是SAS系统的一种简易的数据输入法。而图2.1这种数据输入法也叫命令编程法，是最切实可行又多快好省的数据输入法。习题5答案1.总体与样本有何本质区别？答：总体(population)是样本测量值的集合。对于感兴趣的整个组中，每个成员都对应一个这样的值。具体说来是某省的人口(总体)或工业产值(总体)中的某个指标测量值的集合，而不是那些人或物的集合。样本(sample)虽然也是一些值的集合，但不代表整个感兴趣的组。比如，一个样本可以是某省中某县的人口的集合或某县工业产值的集合。2.参数与统计量有何本质区别？答：由于总体与样本的不同，由此派生出参数与统计量的差别。(1)参数：参数(parameters)是总体的测量值，用希腊字母表示。(2)统计量：统计量(statistics)则是样本的测量值，用一般的英文字母表示见第5章表5.1。3.在SAS统计分析软件中，均值、标准偏差、方差这三种测量值是什么含义？答：(1)均值：用以描述数据(变量值)分布的中心位置。定距以上的数据计算均值才有意义。比如，对于一个总体(某省)的人口，其平均值称为总体均值(populationgmean)，记为μ。对于某样本(某县)的人口，其平均人口则称为样本均值(sampleaverage)，记为-X。总体均值和样本均值的计算公式是相同的。但是其他测量值不一定相同。此外，还有方差、标准偏差等概念。(2)标准偏差：也称为标准差。表示某人的身高或收入等测量值偏离均值多少。比如甲班语文成绩的标准偏差为20，乙班语文成绩的标准偏差为30，那么，乙班语文成绩比甲班的语文成绩变化(波动)大。(3)方差：标准偏差的平方则是方差。方差表示数据内部的变异性。4.什么是正态分布？它有什么特征？答：统计学上，一般都是假设被统计的样本是来自正态分布(Normaldistribution)的总体。正态分布是关于总体的一种理论分布，是有严格的数学定义的。从正态分布的总体中抽取的样本一般是服从正态分布的。正态分布的重要特征有：(1)均值：均值是观察值的平均值(Meanvalue)。定距(Interval)以上的变量值的均值才有意义。(2)众数：众数是最经常发生的频数。众数是对定类变量(Nominal)而言的。比如某班有男生25名、女生15名，那么，该班男生的人数是众数。(3)中位数：中位数是对次序(Ordinal)变量值而言的。中位数是比取值的一半大、同时又比取值的一半小的值。或者说，中位数的一半落在均值之上，同时，另一半则落在均值之下。中位数的取值方法有两种:·单数情况下的观察值的中位数;·双数情况下的观察值的中位数。(4)正态分布的均值、众数、中位数重叠：将正态分布的图形沿着中心位置对半折叠时，均值、众数、中位数三者重叠在一起。5.经验规则有哪些？答：如果数据来自服从正态分布的总体，可用下面的经验规则很快地概括出我们的数据。经验规则有：·68%的观察值是落在离均值一个标准偏差(1σ)的范围内。·95%的观察值是落在离均值两个标准偏差(2σ)的范围内。·99%的观察值是落在离均值三个标准偏差(3σ)的范围内。6.检验数据正态性的主要统计量有哪些？答：正态性检验的重要统计量是取决于概率P值(参阅第5章图5.2中Pr＜W后面的值)。Pr＜W：这是概率值，此值在0～1之间，表示对于正态性的可拒绝程度。当此值小于给定的5%(α值)时，说明数据不是来自正态分布的总体。比如概率值为0.05，由于不小于α值0.05，所以没有理由拒绝H0；说明该样本数据服从正态分布。如果样本规模太小(一般不少于200个OBS)，则要观察附加的统计量(比如条形图、正态概率图、茎叶图、框图或偏度、峰度)。在附加的统计量中茎叶图和正态概率图比较直观；但在只有几十个观察值的情

社会统计分析与SAS应用习题及答案及程序数据

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

基于Flexsim的自动化立体仓库系统规划与仿真研究

电信运营商在中国农村信息化建设中的机遇与运营策略

建筑工程地面

重谋划强落实民心工程聚民心1

选矿设备

下花园京御山水项目施工策划-

上市公司收购管理办法（征求意见稿）

企业财务总监班—企业财务管理制度及内控制度的建设

第2章财务目标、代理关系与财务原则

波士顿-国家开发银行战略实施方案

相关文档

相关搜索

社会统计分析与SAS应用习题及答案及程序数据

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

基于Flexsim的自动化立体仓库系统规划与仿真研究

电信运营商在中国农村信息化建设中的机遇与运营策略

建筑工程地面

重谋划 强落实 民心工程聚民心1

选矿设备

下花园京御山水项目施工策划-

上市公司收购管理办法（征求意见稿）

企业财务总监班—企业财务管理制度及内控制度的建设

第2章财务目标、代理关系与财务原则

波士顿-国家开发银行战略实施方案

相关文档

相关搜索

重谋划强落实民心工程聚民心1