您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 定性数据分析第二章课后答案
第二章课后作业【第1题】解:由题可知消费者对糖果颜色的偏好情况(即糖果颜色的概率分布),调查者取500块糖果作为研究对象,则以消费者对糖果颜色的偏好作为依据,500块糖果的颜色分布如下表1.1所示:表1.1理论上糖果的各颜色数橙色黄色红色棕色绿色蓝色150100100505050由题知r=6,n=500,我们假设这些数据与消费者对糖果颜色的偏好分布是相符,所以我们进行以下假设:原假设::0H类iA所占的比例为)6,...,1(0ippii其中iA为对应的糖果颜色,)6,...,1(0ipi已知,1610iip则2检验的计算过程如下表所示:颜色类别in0inp020)(iiinpnpn1A1721503.22672A1241005.76003A851002.25004A41501.62005A36503.92006A42501.2800合计5005000567.182在这里6r。检验的p值等于自由度为5的2变量大于等于18.0567的概率。在Excel中输入“)5,0567.18(chidist”,得出对应的p值为05.00028762.0p,故拒绝原假设,即这些数据与消费者对糖果颜色的偏好分布不相符。【第2题】解:由题可知,r=3,n=200,假设顾客对这三种肉食的喜好程度相同,即顾客选择这三种肉食的概率是相同的。所以我们可以进行以下假设:原假设)3,2,1(31:0ipHi则2检验的计算过程如下表所示:肉食种类ininpiiinpnpn2)(猪肉8566.675.03958牛肉4166.679.88374羊肉7466.670.80589合计20020072921.152在这里3r。检验的p值等于自由度为2的2变量大于等于15.72921的概率。在Excel中输入“)2,72921.15(chidist”,得出对应的p值为05.00003841.0p,故拒绝原假设,即认为顾客对这三种肉食的喜好程度是不相同的。【第3题】解:由题可知,r=10,n=800,假设学生对这些课程的选择没有倾向性,即选各门课的人数的比例相同,则十门课程每门课程被选择的概率都相等。所以我们可以进行以下假设:原假设)10,...,2,1(1.0:0ipHi则2检验的计算过程如下表所示:类别(课程)in0inp020)(iiinpnpn174800.4500292801.8000383800.1125479800.0125580800.0000673800.6125777800.1125875800.3125976800.20001091801.5125合计800800125.52在这里10r。检验的p值等于自由度为9的2变量大于等于5.125的概率。在Excel中输入“)9,125.5(chidist”,得出对应的p值为05.0823278349.0p,故接受原假设,即学生对这些课程的选择没有倾向性,各门课选课人数的频率为0.1。【第4题】解:(1)由题可知,r=3,n=5606,假设1997年8月中国股民投资状况的调查数据和比较流行的说法是相符合。所以我们可以进行以下假设:原假设::0H类iA所占的比例为)3,2,1(0ippii其中)3,2,1(iAi为股票投资中对应的赢、持平和亏,)3,2,1(0ipi已知,1310iip则2检验的计算过程如下表所示:股票投资状况in0inp020)(iiinpnpn1A1697560.62303.612132A17801121.2387.100823A21293924.2821.24842合计5606560696137.35112在这里3r。检验的p值等于自由度为2的2变量大于等于3511.96137的概率。在Excel中输入“)2,72921.15(chidist”,得出对应的p值为05.00p,故拒绝原假设,即认为1997年8月中国股民投资状况的调查数据和比较流行的说法是不相符合的。(2)解:由题知股票投资中,赢包括盈利10%及以上、盈利10%以下,符合条件的股民共有151+122=273人;持平可以指基本持平,符合条件的股民共有240人;亏包括亏损不足10%和亏损10%及以上,符合条件的股民共有517+240=757人。由题可知,r=3,n=1270,假设2003年2月上海青年报上的调查数据和比较流行的说法是相符合。所以我们可以进行以下假设:原假设::0H类iA所占的比例为)3,2,1(0ippii其中)3,2,1(iAi为股票投资中对应的赢、持平和亏,)3,2,1(0ipi已知,1310iip则2检验的计算过程如下表所示:股票投资状况in0inp020)(iiinpnpn1A273127167.842522A2402540.771653A75788919.59955合计1270127021372.1882在这里3r。检验的p值等于自由度为2的2变量大于等于188.21372的概率。在Excel中输入“)2,21372.188(chidist”,得出对应的p值为05.00p,故拒绝原假设,即认为2003年2月上海青年报上的调查数据和比较流行的说法是不相符合的。【第5题】解:由题意,我们将“开红花”、“开白花”和“开粉红色花”分别记为321,,AAA,并记iA所占的比例为)3,2,1(ipi,本题所要检验的原假设为:pqpqpH2,p,p:322210其中1qp,这些ip都依赖一个未知参数p。在原假设0H成立时的似然函数为13210860362242)1()2()()()(pppqqppL则对L(p)取对数得)1ln(132ln108)(lnpppL从而有对数似然方程01132108)(lnppppL即pp132)1(108。据此求得p的极大似然估计45.0ˆp,从而得到ip的极大似然估计3,2,1),ˆ(ˆipppii。它们分别为0.2025、0.3025和0.495。由此得各类的期望频数的估计值3,2,1,ˆipni。它们分别为24.3、36.3、132.20和59.4。所以2统计量的值为0.012244.59)4.5960(3.36)3.3636(3.24)3.2424(2222这里r=3,m=1,r-m-1=1。检验的p值等于自由度为1的2变量。利用Excel可以算出p值05.0911893.0)1,01224.0(chidistp,故接受原假设,即我们认为以上数据在0.05的水平下与遗传学理论是相符的。【第6题】解:由题意,我们可以得到以下信息:①遗传因子的分布律为:(其中p+q+r=1)遗传因子ABO概率pqr②血型的分布律为:血型OABAB概率2rprp22qrq22pq2将“O”血型、“A”血型、“B”血型和“AB”血型这四类血型分别记为41A......,,A,并记iA所占的比例为)4,......,1(ipi,本题所要检验的原假设为:pqpqrqpprprH2,2,2p,p:42322210这些ip都依赖两个未知参数qp,。在原假设0H成立时的似然函数为5813213243643674858132243623742)2()22()22()1()2()2()2()(),(pqpqqqppqppqqrqprprqpL则对L(p,q)求对数得pqpqqqppqpqpL2ln58)22ln(132ln132)22ln(436ln436)1ln(748),(ln对),(lnqpL求偏导数得058221321322287201748ln058222640224364361748lnqpqqqpqpqLppqqppqppL利用Mathematica软件求解(程序编码及运行结果见附录)解得p和q的极大似然估计为100.0ˆ89,2.0ˆqp,从而得ip的极大似然估计4,....,1),ˆ,ˆ(ˆiqpppii。它们分别为0.37332、0.43668、0.13220和0.05780。由此得各类的期望频数的估计值1,....,4i,ˆipn。它们分别为373.32、436.68、132.20和57.80。所以2统计量的值为003292.080.57)80.5758(20.132)20.132132(68.436)68.436436(32.373)32.373374(22222这里r=4,m=2,r-m-1=1。检验的p值等于自由度为1的2变量。有Excel可以算出p值为05.0954245.0)1,003292.0(chidistp,故接受0H,我们认为以上数据与遗传学理论是相符的。附录①程序代码:NSolve[{(-748)/(1-p-q)+436/p+(-436)/(2-p-2*q)+0+(-264)/(2-q-2*p)+58/p==0,(-748)/(1-p-q)+0+(-872)/(2-p-2*q)+132/q+(-132)/(2-q-2*p)+58/q==0},{p,q}]//MatrixForm②利用Mathematica软件运行结果:Out[21]//MatrixForm0.0999891q0.288632p0.473295q0.722065p1.50996q0.209806p0.0900929q1.56083p注:在上述结果中由于p+q=1-r1,所以软件运行的结果中只有第四个解满足条件,即p和q的极大似然估计为100.0ˆ89,2.0ˆqp。【第7题】解:由题知,在豌豆实验中,子系从父系(或母系)接受显性因子“黄色”和“青色”的概率分别为p和1-p,而子系从父系(或母系)接受显性因子“圆”和“有角”的概率分别为q和1-q。我们将豌豆实验中得到的“黄而圆的”、“青而圆的”、“黄而有角的”和“青而有角的”这四类豌豆分别记为1A,2A,3A,4A,则这四类豌豆的分布律如下表所示:豌豆类型1A2A3A4A概率)2)(2(qppq2)1)(2(pqq2)1)(2(qpp22)1()1(qp将豌豆类型iA所占的比例记为)4,......,1(ipi,则本题所要检验的原假设为:224232210)1()1(,)1)(2()1)(2(p),2)(2(p:qppqppppqqqppqH这些ip都依赖两个未知参数qp,。在原假设0H成立时的似然函数为266280423416423416322210121082315)1()1()2()2(])1()1[(])1)(2([])1)(2([)]2)(2([),(qpqpqpqpqpppqqqppqqpL则对L(p,q)求对数得)1ln(266)1ln(280)2ln(423)2ln(416ln423ln416),(lnqpqpqpqpL对),(lnqpL求偏导数得012662423423ln012802416416lnqqqqLppppL即得出下列方程:08322224111208462224111222qqpp解得p和q的极大似然估计为498.0ˆ511,.0ˆqp,从而得ip的极大似然估计4,....,1),ˆ,ˆ(ˆiqpppii。它们分别为0.56923、0.17898、0.19157和0.06023.由此得各类的期望频数的估计值1,....,4i,ˆipn。它们分别为316.489、99.511、106.511和33.489。所以2统计量的值为082564.1489.33)489.3332(511.106)511.10610
本文标题:定性数据分析第二章课后答案
链接地址:https://www.777doc.com/doc-4476258 .html