您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 计算机系统结构复习题
Question4Asingle-issueprocessorusestomasulo’salgorithminitsfloating-pointunit,whichhasoneadderandonemultiplier,eachwithitsownsetofreservationstation,thereisonlyoneCDB,andbroadcastonthisCDBtakesanentirecycle.theprocessorisexecutingthefollowingsequenceofinstructionand,foreachinstruction,weshowthecycleinwhichtheinstructionisfetched,decoded,issued,beginstoexecute,andwritesresult.单发射处理器在其浮点单元中使用托马斯算法,其具有一个加法器和一个乘法器,每个具有其自己的一组保留站,只有一个CDB,并且在该CDB上广播需要整个周期。处理器正在执行以下指令序列,并且对于每个指令,我们示出指令被取出,解码,发出,开始执行和写入结果的周期。instructionfetchdecodeissueexecuteWriteresultI1MULR1,R2,R212348I2ADDR1,R1,R2234910I3MULR2,R2,R3345813I4ADDR3,R1,R14561112I5MULR1,R1,R15671216I6ADDR2,R3,R46711????I7ADDR1,R5,??781317181、whatisthelatencyofthemultiplier?42、Isthemultiplierpipelined?N3、Howmanyreservationstationaretherefortheadder?24、InwhichcycledoesI6begintoexecute?135、Whichregisterdoes??RepresentinI7R16、IftheprioryforusingCDBdependsonthetypeofinstruction,betweenADDandMULthepriorityforusingtheCDBgoesto___?ADDQuestion8(书本92页).Loop:LDR1,0(R2);loadR1fromaddress0+R2DADDIR1,R1,#1;R1=R1+1SDR1,0,(R2);storeR1ataddress0+R2DADDIR2,R2,#4;R2=R2+4DSUBR4,R3,R2;R4=R3-R2BNEZR4,Loop;branchtoLoopifR4!=0AssumethattheinitialvalueofR3isR2+396.答案:(1)依题意可得,指令序列执行的流水线时空图如下:1234567891011121314151617181920211IFIDEXMEWB2IFIDEXMEWB3IFIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFIDEXMEWB1IFIFIDEXME时钟周期为:17*98+18=1684(2)依题意可得,指令序列执行的流水线时空图如下:1234567891011121314151IFIDEXMEWB2IFIDSEXMEWB3IFSIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFIDEXMEWB7IFMissMissIFIDEXMEWB时钟周期为:10*98+11=991(3)依题意可得,指令序列执行的流水线时空图如下:12345678910111IFIDEXMEWB2IFIDEXMEWB3IFIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFIDEXMEWB1IFIDEXMEWB时钟周期为:6*98+10=598Question99a)Whatistheeffectiveaccesstimeofacachememorysysteminwhichthereisa2-waysetassociativecache,havingthefollowingparameters:Parameter:Value:numberofsets1024setslinesize16wordscacheaccesstime15ns/linemainmemoryaccesstime70ns/wordmainmemoryaddressspacesize256Mwordscachehitrate95%Labelthefieldsofthememoryaddressbelowusedtoaccessthecacheandindicatethesizeofeachfield(innumberofbits).Assumethatmemoryisword-addressed.Tag:_14_bitsIndex:_10_bitsOffset:_4_bits9b)Whatistheeffectiveaccesstimeofacachememorysysteminwhichthereisadirectmappedlevel1(L1)cacheandafullyassociativelevel2(L2)cache,havingthefollowingparameters:Parameter:Value:L1numberofsets128setsL1linesize4wordsL1cacheaccesstime10ns/lineL2linesize8wordsL2cacheaccesstime20ns/linemainmemoryaccesstime70ns/wordmainmemorysize256MwordsL1cachehitrate95%L2cachehitrate89%LabelthefieldsofthememoryaddressbelowusedtoaccesstheL1cacheandindicatethesizeofeachfield(innumberofbits).Assumethatmemoryisword-addressed.Tag:_19_bitsIndex:_7_bitsOffset:_2_bitsLabelthefieldsofthememoryaddressbelowusedtoaccesstheL2cacheandindicatethesizeofeachfield(innumberofbits).Assumethatmemoryisword-addressed.Tag:_25_bitsIndex:_0_bitsOffset:_3_bitsQuestion11一个简单的共享内存cache-coherent机有四个处理器,没有\虚拟到物理\的翻译和16位(物理)地址。每个处理器有一个L1数据缓存,没有L2高速缓存。每个L1缓存是有四个64字节的块(每个缓存的大小是256字节)的直接変换,他们使用MESI一致性协议来保持一致的。每个缓存的初始状态(十六进制符号标记所示):如果按顺序执行下面的内存访问,将会发生什么?特别是,指定每个其他的缓存发生在由于总线广播、数据从哪里来(如果在缓存中没有准备好),和新状态块的请求者的缓存。P0写一个字到地址00fcP1读一个字到地址0f8cP2读一个字到地址0f8cP3写一个字到地址0444答案:Question13P0P1P2P3statetagstatetagstatetagstatetagI0FS0FS01S01M01E02M03E04I0FI0FE0FI0FM00E02S04I06P0P1P2P3statetagstatetagstatetagstatetagIOFSOFSOFSOFM01E02M03M04IOFIOFEOFIOFM00E02S04I06答案:A:P0B0(S,120,00,20)B:P0B0(M,120,00,80)P1B0(I,120,00,20)C:P2B0(M,120,00,80)P0B0(I,120,00,80)P1B0(I,120,00,80)D:P1B2(S,110,00,30)P2B2(S,110,00,30)E:P0B1(M,108,00,48)P1B1(I,108,,0,08)P2B1(I,108,00,08)F:P0B2(M,130,00,78)1.处理器中某功能部件占总应用程序执行时间的比例为40%,先将该功能部件改进(加速10倍),则整个应用程序的加速比为多少?(D)A.1.4B.2.5C.2.18D.1.562.在计算机系统设计中,比较好的方法是:(D)A.从上向下设计B.从下向上设计C.从两头向中间设计D.从中间开始向上、向下设计3.对系统程序员不透明的是:(D)A.Cache存储器B.系列机各档不同的数据通路宽度C.指令缓冲寄存器D.虚拟存储器4.系列机软件应做到:(B)A.向前兼容,并向上兼容B.向后兼容,力争向上兼容C.向前兼容,并向下兼容D.向后兼容,力争向下兼容5.属计算机系统结构考虑的应是(C)。A.主存采用CMOS还是TTLB.主存采用多体交叉还是单体C.主存容量和编址方式D.主存频宽的确定6.最能确保提高虚拟存储器访问主存的命中率的改进途径是(D)。A.增大辅存容量B.采用FIFO替换算法并增大页面C.改用LRU替换算法并增大页面D.改用LRU替换算法并增大页面数7.静态流水线是指(C)。A.只有一种功能的流水线B.功能不能改变的流水线C.同时只能完成一种功能的多功能流水线D.可同时执行多种功能的流水线8.假设用软件方法在A计算机上实现B计算机的指令系统,则B称为(C)。A.仿真机B.宿主机C.虚拟机D.目标机9.计算机中优化使用的操作码编码方法是(D)。A.哈夫曼编码B.ASCII码C.BCD码D.扩展操作码10.在采用基准测试程序来测试评价机器的性能时,下列方法按照评价准确性递增的顺序排列是(B)。(1).实际的应用程序方法(2).核心程序方法(3).玩具基准测试程序(小测试程序)(4).综合基准测试程序A:(1)(2)(3)(4)B:(2)(3)(4)(1)C:(3)(4)(1)(2)D:(4)(3)(2)(1)11.10.在系统结构设计中,提高软件功能实现的比例会(C)。A、提高解题速度B、减少需要的存贮容量C、提高系统的灵活性D、提高系统的性能价格比12.CPI是量化计算机性能的一个重要指标,关于CPI说法正确的是(C)A.CPI由计算机的结构决定B.CPI由运行在计算机系统上的应用程序决定C.CPI由计算机的结构和应用程序共同决定D.CPI由计算机的时钟周期决定13.以下不属于计算机性能公式的变量是(D)A.ICB.时钟周期C.CPID.MIPS14.未曾实现的商业计算机结构类型是(C)A.SISDB.SIMDC.MISDD.MIMD15.关于近10年CPU从单核转向多核处理器的解释正确的是(D)A.指令级并行技术已经发展到极限B.CPU的工作电压很难再下降C.提高时钟频率会带来CPU的散热极限问题D.上述理由全部正确16.图像处理器GPU属于哪种结构(B)A.SISDB.SIMDC.MISDD.MIMD17.以下不属于Flynn体系结构类型的是(C)A.SISDB.SIMDC.SIMTD.MISD18.CPI是量化计算机性能的一个重要指标,关于CPI说法正确的是(B)A.CPI由计算机的结构决定B.CPI由运行在计算机系统上的应用程序决定C.CPI由计算机的结构和应用程序共同决定D.CPI由计存储器系统决定分析:CPI=TC/IC19.与存储器-存储器结构指令集结构相比,寄存器-寄存器结构(D).A.CPI大B.完成同一个算法需要的指令数更少C.指令的功能更复杂D.固定长度的指令编码方式20.计算机系统的执行时间的通用公式为:CPUtime=y×时钟周期×CPI,此处y是(B)A.程序执行的周期数B.被执
本文标题:计算机系统结构复习题
链接地址:https://www.777doc.com/doc-4910824 .html