您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 计算机系统结构第二版张晨曦考前资料大题大全看完必过
1.将计算机系统中某一功能的处理速度加快15倍,但该功能的处理时间仅占整个系统运行时间的40%,则采用此方法改进后,能使整个系统的性能提高多少?注意:计算的是系统的加速比。用的是系统改进前的时间/系统改进后的时间。引入两个概念:可改进比例:Fe部件加速比:Se公式是推倒出来的。解:由题意知:Se=15,Fe=40%=0.4根据Amdahl定律可知:Sn=6.15.14.04.0-11eee-11)()(SFF采用此方法改进后,能使整个系统的性能提高原来的1.6倍2.假设FP指令的比例为25%,其中,FPSQR占全部指令的比例为2%,FP操作的CPI为4,FPSQR操作的CPI为20,其他指令的平均CPI为1.33。现有两种改进方案,第一种是把PFSQR操作的CPI减至2,第二种是把所有FP操作的CPI减至2,试比较两种方案对系统性能的提高程度。(求得是系统的平均时钟周期CPI)注意几个公式:执行程序所需的时钟周期数:平均时钟周期*指令条数时钟周期时间时钟周期时间期数执行程序所需的时钟周时间ICCPICPU这个公式改进任何一个参数都可以提高CPU性能,但是这些参数往往是互相关联的,很难做到能单独的改进某一个参数指标而不影响其他的两个指标。所以用到了CPU时钟周期数。)(时钟周期数in1iCPUICCPIi时钟周期时间)(时间in1iCPUICCPIin1iiin1ii)CPI(CPIICICICICCPIICi时钟周期数解:没有改进之前,每条指令的平均时钟周期CPI为:2%)7533.1(%)254()CPI(CPIn1iiiICIC(1)采用第一种方案:所有FP操作的CPI由CPIfp=4减至CPIfp’=2,则整个系统的平均时钟周期为:CPI1=CPI-(CPIfp-CPIfp’)x25%=2-(4-2)x25%=1.5(2)采用第二种方案:将FPSQR操作的CPI由20减至2,则整个系统的指令的平均时钟周期数为:CPI2=CPI-(CPIfpsqr-CPIfpsqr’)x2%=2-(20-2)x2%=1.64综上:从降低整个系统的指令平均时钟周期程度来看,第二种方案优于第一种方案。课后题:3.将计算机系统中某一功能的处理速度加快20倍,但该功能的处理时间仅占整个系统运行时间的40%,则采用该方法改进后,能使整个系统的性能提高多少?4.假设浮点数指令(FP)的比例为30%,其中浮点数平方根的指令(FPSQR)占全部指令的4%,FP操作的CPI为5,FPSQR操作的CPI为,其他指令的平均CPI为1.25。现在有两种改进方案。第一种是把FPSQR操作的CPU减至3。第二种改进方案是把所有FP操作的CPI减至3。试比较两种方案对系统性能的提高。第二章大题1.流水线的性能指标吞吐率:TP(ThroughPut):是指单位时间内流水线所完成的任务数量或输出结果的数量t1max1-nt1-ntknntTnTPK)(任务数执行一段所用的时间段数)(个任务所用的时间处理完任务数以上是在各段执行时间都相等的情况下的吞吐率。各段时间不相等时,流水线的最大吞吐量和实际吞吐率都有时间最长的段决定,这个段就成了这个流水线的瓶颈。这是瓶颈段一直处于忙碌状态,而其他各段在许多时间内都是空闲的硬件使用率低)()()(,,,2,1tmax1max,,,2,1tmax1-ntink1ittTP消除瓶颈段的方法:(1)细分瓶颈段把瓶颈段细分成三个子流水功能段,从而使流水线各段的处理时间都相等。串行执行。(2)重复设置瓶颈段根据前面段的多少设置一样多的瓶颈段,然后达到并行执行的效果,当然也要增加硬件设施。2.流水线的加速比是指使用顺序处理一批任务所用的时间与流水线使用流水处理方式处理同一批任务所用的时间之比1-nknkt1-nktnkks)(流水处理所用的时间顺序执行所用的时间TTS3.流水线的效率即流水线设备的利用率。它是指流水线中设备实际使用时间与整个运行时间的比值每个段的效率:1-nknt1-nktne)(11...321nknkTtknkkeeeeEk个段总的时空区面积区面积个任务实际占用的时空knE例3.1要在图3.3所示的静态流水线上计算41iii)(BA,流水线的输出可以直接返回输入端或者暂存于相应的流水线寄存器中,试计算其吞吐率、加速比、和效率。解:首先选择合适的流水线工作算法。对于本题的算法如下:(1)先计算加法a=A1+B1b=A2+B2c=A3+B3d=A4+B4(2)再计算乘法e=axbf=cxd(3)最后计算结果g=exf画出时空图(1)由图可知:它在18个t的时间中,给出了7个结果,所以吞吐率为:tTP187(2)如果不用流水线,由于一次求和需6t,一次求积需4t,则产生上述7个结果共需要(4x6+3x4)t=36t所以加速比为21836ttS(3)该流水线的效率可以由阴影区的面积和8个段总时空区的面积的比值求得25.01884364E例3.2有一条动态多功能流水线由5段组成,如图所示。加法用1.3.4.5段,乘法用1.2.5段。且第四段的时间为2t,其余各段时间为t,流水线的输出可以直接返回输入端或者暂存于相应的流水线寄存器中。若在该流水线计算41iiiBA)(,试计算其吞吐率、加速比、和效率。解:首先应该选择适合流水线工作的算法。对于本题算法如下:先计算:11aBA22bBA33cBA44dBA再计算:baedcf最后计算:feg画出时空图如下图所示:(1)由图所示,它在16个t的时间中给出了7个结果,所以吞吐率为:t167TP(2)如果不使用流水线,由于求一次积需3t,一次求和需5t,则产生上述7个结果共需要(4x3+3X5)t=27t。所以加速比为:69.11627ttS(3)该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得:338.01655334E3.一指令流水线如下所示(1)求连续输入10条指令,该流水线的实际吞吐率和效率;(2)该流水线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少?解:(1)2200(ns)2009200)10050(50t)1n(tTmaxm1iipipeline)(ns2201TnTP1pipeline45.45%1154400TPmtTPEm1ii(2)瓶颈在3、4段。入1234出50ns50ns100ns200ns变成八级流水线(细分)850(ns)509850t1)(ntTmaxm1iipipeline)(ns851TnTP1pipeline58.82%17108400TPmtiTPEm1i重复设置部件)(ns851TnTP1pipeline58.82%1710885010400E3.14有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第3段的时间为2△t,其余各段的时间均为△t,而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中。现要在该流水线上计算,画出其时空图,并计算其吞吐率、加速比和效率。123-13-24-14-24-34-4123_13_24_14_4入出50ns50ns50ns50ns50ns50ns123_13_24_14_24_34_411112222333344445555666677778899101089108910850ns时间段)(41iiiBA解:首先,应选择适合于流水线工作的算法。对于本题,应先计算A1+B1、A2+B2、A3+B3和A4+B4;再计算(A1+B1)×(A2+B2)和(A3+B3)×(A4+B4);然后求总的结果。其次,画出完成该计算的时空图,如图所示,图中阴影部分表示该段在工作。由图可见,它在18个△t时间中,给出了7个结果。所以吞吐率为:tTP817如果不用流水线,由于一次求积需3△t,一次求和需5△t,则产生上述7个结果共需(4×5+3×3)△t=29△t。所以加速比为:该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得:3.16在MIPS流水线上运行如下代码序列:LOOP:LWR1,0(R2)DADDIUR1,R1,#1SWR1,0(R2)DADDIUR2,R2,#4DSUBR4,R3,R2BNEZR4,LOOP12345乘法加法△t△t2△t△t△t时间段12345012345678910111213141516输入A1B1A2B2A3B3A4B4ABCDABCDA×BA×BC×DA×B×C×DA=A1+B1B=A2+B2C=A3+B3D=A4+B4C×D171861.18192ttS223.01853354E其中:R3的初值是R2+396。假设:在整个代码序列的运行过程中,所有的存储器访问都是命中的,并且在一个时钟周期中对同一个寄存器的读操作和写操作可以通过寄存器文件“定向”。问:(1)在没有任何其它定向(或旁路)硬件的支持下,请画出该指令序列执行的流水线时空图。假设采用排空流水线的策略处理分支指令,且所有的存储器访问都命中Cache,那么执行上述循环需要多少个时钟周期?(2)假设该流水线有正常的定向路径,请画出该指令序列执行的流水线时空图。假设采用预测分支失败的策略处理分支指令,且所有的存储器访问都命中Cache,那么执行上述循环需要多少个时钟周期?(3)假设该流水线有正常的定向路径和一个单周期延迟分支,请对该循环中的指令进行调度,你可以重新组织指令的顺序,也可以修改指令的操作数,但是注意不能增加指令的条数。请画出该指令序列执行的流水线时空图,并计算执行上述循环所需要的时钟周期数。解:寄存器读写可以定向,无其他旁路硬件支持。排空流水线。指令12345678910111213141516171819202122LWIFIDEXMWBDADDIUIFSSIDEXMWBSWIFSSIDEXMWBDADDIUIFIDEXMWBDSUBIFSSIDEXMWBBNEZIFSSIDEXMWBLWIFSSIFIDEXMWB第i次迭代(i=0..98)开始周期:1+(i×17)总的时钟周期数:(98×17)+18=1684有正常定向路径,预测分支失败。指令12345678910111131415LWIFIDEXMWBDADDIUIFIDSEXMWBSWIFSIDEXMWBDADDIUIFIDEXMWBDSUBIFIDEXMWBBNEZIFIDEXMWBLWIFmissmissIFIDEXMWB第i次迭代(i=0..98)开始周期:1+(i×10)总的时钟周期数:(98×10)+11=991有正常定向路径。单周期延迟分支。LOOP:LWR1,0(R2)DADDIUR2,R2,#4DADDIUR1,R1,#1DSUBR4,R3,R2BNEZR4,LOOPSWR1,-4(R2)第i次迭代(i=0..98)开始周期:1+(i×6)总的时钟周期数:(98×6)+10=598指令1234567891011LWIFIDEXMWBDADDIUIFIDEXMWBDADDIUIFIDEXMWBDSUBIFIDEXMWBBNEZIFIDEXMWBSWIFIDEXMWBLWIFIDEXMWB2.13在一台单流水线多操作部件的处理机上执行下面的程序,每条指令的取指令、指令译码需要一个时钟周期,MOVE、ADD和MUL操作分别需要2个、3个和4个时钟周期,每个操作都在第一个时钟周期从通用寄存器中读操作数,在最后一个时钟周期把运算结果写到通用寄存器中。k:MOVER1,R0;R1←(R0)k+1:
本文标题:计算机系统结构第二版张晨曦考前资料大题大全看完必过
链接地址:https://www.777doc.com/doc-5901658 .html