您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 中国海洋大学考研期末2007学年《计算机系统结构》参考答案及评分标准(A卷)
《计算机系统结构》参考答案及评分标准(A卷)一、1)该机器在无Cache缺失(理想情况)时的CPI为:idealCPI143%221%212%224%1.57(3分)2)由于是RISC处理机,所以只有LOAD和STORE指令才可能有数据缺失。因此,该机器在有Cache缺失时的CPI为:realidealCPICPI205%2010%(21%12%)3.23(4分)加速比为:idealidealprealrealICCPICPI3.23S2.06ICCPICPI1.57(3分)二、1)中断优先级为:D1>D2>D3>D4(1分)中断屏蔽码如下(“0”表示该中断源被屏蔽,“1”表示该中断源开放):D1D2D3D4D10111D20010D30000D40110(3分)2)中断过程示意图如下图所示:【评分标准】画图正确给4分,画错或少画,酌情扣1~4分。处理机开始响应各中断源的中断服务请求时刻依次为:0μs(D1)、1μs(D2)、6μs(D3)、23μs(D4)(1分)处理机为各中断源完成中断服务的时刻依次为:17μs(D3)、23μs(D2)、34μs(D4)、44μs(D1)(1分)t用户程序中断服务程序D111D2D3D4D1,D2D3,D4三、F=A1+A2+A3+A4+A5+A6+A7+A8+A9+A10【评分标准】画图正确给4分,画错或少画,酌情扣1~4分。t17Tkt36t49T09n4kkn9TP10.59()T1750nsMFLOPS(2分)1736t17t36TTSk0p(2分)0kT36t9EkT417t17(2分)四、1)禁止向量F={1,3,6},初始冲突向量为:(100101)状态转换图如图所示:【评分标准】画图正确给4分,画错或少画,酌情扣1~4分。2)由状态转换图可知,为了避免流水线的冲突,可供选择的调度方案有:(2,5)、(4)、(2,2,5)、(4,5)、(4,4,5)、(5)。所以最小启动循环为(2,2,5),最小平均启动距离为3。(3分)3)按照最小启动循环连续输入20个任务,需65拍才能完成。因此,实际吞吐率为:20TP15.38()6520nsMFLOPS(3分)⑨⑧⑥⑦⑤③④②①S1S2S3S412112233344455567676712345678888999955241001011001111011111011012554五、由题意可知,指令可以分成如下3个编队:①LVV1,Rx;MULTSVV2,F0,V1②LVV2,Ry;ADDVV4,V2,V3;③SVRy,V4;chimeT=3,startT(12712612)49,取loopT=15,因此,总的执行时间为:nloopstartchimennT(TT)nT=643nMVL64(4分)m6nnnf2n400Rlimlim200()nT1064+3n64MFLOPS总的浮点运算次数(2分)1/21/21/22n4001R100n264+3n64解得:1/2n13(2分)假设标量工作方式下建立循环的开销为10,则:vvvn64+3n(1049)n64解得:vn2(2分)六、1)N=8时的多级混洗交换网络如下:【评分标准】画图正确给5分,画错或少画,酌情扣1~5分。2)若使用该网络实现蝶式置换,最少需要通过两次。(1分)第1次:所有开关均工作于直连状态,实现0→0、2→2、5→5、7→7的连接。(2分)第2次:开关E、F、G、H工作于直连状态,开关A、B、C、D、I、J、K、L工作于交换状态,用以实现1→4、4→1、3→6、6→3的连接,(2分)入端ABCDEFGHIJKL0123456701234567出端七、1))214(352364T0拍(2分)2)①8个PE上并行做乘法和加法,形成部分和结果需)28(4254拍②0→1、2→3、4→5、6→7并行传送数据需1拍(注:0→1表示PE0→PE1,下同)③1、3、5、7上并行做加法需2拍④1→3、5→7并行传送数据需2拍⑤3、7上并行做加法需2拍⑥3→7传送数据需4拍⑦7上做加法,得到最后结果需2拍因此,总共需:28+1+2+2+2+4+2=41(拍)(4分)3)①8个PE上并行做4个乘法和3个加法需)22(3244拍②0→1、2→3并行传送数据需1拍③1、3上并行做加法需2拍④1→3传送数据需1拍⑤3上做加法需2拍⑥此刻,4~7号PE已完成了第5个乘法和第4个加法的计算。3→7、4→5、6→7并行传送数据需1拍⑦5、7上并行做加法需2拍⑧7上做3号PE和自身结果的加法需2拍(在此过程期间,同时完成了5→7的数据传送,只需1拍)⑨7上做5号PE和自身结果的加法,得到最终结果需2拍因此,总共需:22+1+2+1+2+1+2+2+2=35(拍)(4分)八、)KM(2C)K(Rmax)KM(K2C)K(RmaxTi2i2iiiii式中:T表示总执行时间;Ki表示第i台处理机上分配的任务数。1)因为R200M1004050C522,所以应采用集中分配方案,将100个子任务全部分配到一台处理机上执行,总执行时间为:TRM20010020000()拍【评分标准】解答正确给4分,答错或少答酌情扣1~4分。2)因为R60M1006050C122,所以应采用平均分配方案,6台处理机依次各分配17、17、17、17、17、15个子任务,总执行时间为:22222iiiC1TRmax(K)(MK)6017(10051715)5185(22拍)【评分标准】解答正确给4分,答错或少答酌情扣1~4分。3)并行计算时,由于存在通信开销,给系统带来了额外的执行时间。R/C比值是衡量任务粒度的尺度,粗粒度(R/CM/2)情况下,宜采用并行计算,平均分配任务;细粒度(R/CM/2)情况下,宜采用串行计算,集中分配任务。(2分)
本文标题:中国海洋大学考研期末2007学年《计算机系统结构》参考答案及评分标准(A卷)
链接地址:https://www.777doc.com/doc-2768501 .html