您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文档 > 华中科技大学计算机系统结构复习题
AdvancedComputerArchitecture高级计算机系统结构(复习题)-考试时间:1月20号下午根据曹强老师的写的,不知道会不会有错误,祝大家好成绩——by刘梦博By刘梦博Amdahl’sLawenhancedenhancednewoldoverallSpeedupFractionFraction1ExTimeExTimeSpeedup1enhancedenhancedenhancedoldnewSpeedupFractionFractionExTimeExTime12enhancedenhancednewSpeedupFraction1Bestyoucouldeverhopetodo:enhancedmaximumFraction-11SpeedupBy刘梦博例题选讲(1)考虑下面3个处理器(X,Y和Z),都在一定硅面积(16A)上制造。假设单个线程的性能随着其使用面积的平方根增长。在上述3种处理器运行某一程序,这个程序串行的比例是S,而(1-S)为完全可并行的,完全使用Z中一个小核完成该程序的时间为T。ProcessorX1largecoreofarea16AProcessorY4mediumcoresofarea4AProcessorZ16smallcoresofareaA分别计算3个处理器完成程序的时间。(1)X:面积是Z小核的16倍,则程序执行时间为1/4;(2)Y:单个核面积是Z小核的4倍,则串行部分需要S*T/2,4个核并行部分执行时间为((1-S)*T/2)/4,总时间为3S*T/8+T/8(3)Z:S*T+(1-S)*T/16=15S*T/16+T/163By刘梦博例题选讲(2)某处理器能够使用DVFS技术来降低处理器的能耗,如果电压降低15%,则相应的频率也下降15%。请问使用DVFS之后,对于动态能耗和动态功率的影响?解Energydynamic=Capacitiveload×Voltage2Powerdynamic=1/2×capacitiveload×Voltage2×Frequencyswitched处理器的晶体管数量不变,则动态能耗之比为:72.085.0)85.0(22VoltageEnergynew动态功率为:动态能量为原来的72%,动态公路车为原来的61%472.085.022VoltageEnergyold61.085.072.0switchedFrequencyswitchedFrequencyPowerPoweroldnewBy刘梦博例题选讲(3)ComponenttypeProductPerformancePowerProcessorSunNiagara8-core1.2GHz72-79WpeakIntelPentium42GHz48.9-66WDRAMKingstonX64C3AD21GB184-pin3.7WKingstonD2N31GB240-pin2.3WHarddriverDiamondMax165400rpm7.0Wread/seek.2.9WidleDiamondMax97200rpm7.9Wread/seek.4.0WidleDiamondMax97200rpm7.9Wread/seek.4.0Widle5假设每个部件处于最大负载,电源功率效率为80%,2GB240针内存,7200RPM硬盘。计算IntelP4服务器实际功率是多少?使用该服务器使用7200RPM(DM9)硬盘,硬盘60%的时间空闲,磁盘的实际功率是多少?如果DM9存取数据的时间为DM16的75%,如果两个盘的能耗相同,则DM9的空闲时间比例是多少?By刘梦博解:(1)0.8x=66+2*2.3+7.9则x=0.99W(2)0.6*4+0.4*7.9=5.56W(3)W_DM9=0.75*W_DM16W_DM9=1–I_DM9W_DM16=1–I_DM16W_DM9*7.9+I_DM9*4=W_DM9*7.9+I_DM9*4=W_DM16*7+I_DM16*2.9So:I_DM9=29.8%6By刘梦博CPU的性能公式CPI是衡量CPU执行指令效率的重要指标。让我们先考虑一个标准测速程序的全部执行时间Te和其中所有第i种指令的累计时间Ti,易知其中:另一方面,我们又可以写,CYCLECPIICTeCYCLECPIICTiii,fCYCLE1niiICIC1nnn比较上面第一式与最后一式,可以得到CPI与CPIi的关系或者写为它表明CPI为所有CPIi的加权平均值7CYCLECPIICCYCLECPIICTnininiiiiii111e)(TniiiCPIICCPIIC1)(,)(1niiiCPIICICCPICycleSecondsnInstructioCyclesogramnsInstructioogramSecondstimeCPUPrPrBy刘梦博例题选讲(4)A计算机指令系统中含有一条特殊的多媒体处理指令,如果不使用这条指令,A计算机的MIPS为400,但执行该指令时,其执行时间是其他指令的4倍;B计算机MIPS为600,没有这条指令,但可以用其他10条指令构成子程序来代替这条指令。有10000行某段程序在A计算机上顺序执行时,这条多媒体指令出现的比例是20%。假设两台计算机除那条多媒体指令外,所有指令和指令的执行周期数都相同。问:哪台计算机先完成同样的计算任务?(需要通过计算结果比较)。答案:A计算机的指令条数为10000条,8000条以MIPS为400的速度执行,2000条以MIPS为100的速度执行。B计算机的指令条数为度执行,2000条以MIPS为100的速度执行。B计算机的指令条数为8000+2000*l0=28000条,以MIPS为800的速度执行。A计算机执行时间=8000/(400*10^6)+2000/(100*10^6)=20us+20us=40usB计算机执行时间=28000/(600*10^6)=280/6=46.6us所以,A计算机先完成86^10*MIPS指令数执行时间By刘梦博例题选讲(5)CPU性能问题:CPU的动态功率为:某8核MCPUx能够动态启动和关闭工作的核,假设某一程序80%部分可以并行执行,不考虑L1,L2$对于计算过程和功耗的影响,CPl在两种情况下都不变;在单核运行时,程序执行的时间为T0,P0为运行功率。下面有两个调度方案,请分别计算该程序运行在两种情况下的实际功unitsiiiidynfAVCkP2。下面有两个调度方案,请分别计算该程序运行在两种情况下的实际功耗。(1)只使用一个核,其它核关闭,CPU电压不变,电压增加10%,主频增加25%;(2)使用全部8个核,CPU电压增加10%,主频不变。9By刘梦博解答T0为程序原来执行的时间,P0为单核执行不改变时的功率,其执行程序的总能耗为W0=T0*P0(1)T1=T0/(1+0.25)=0.8*T0P1=(1+10%)2*(1+25%)*P0=1.5125*P0W1=T1*P1=1.21W0(2)T2=(20%+80%/8)*T0=30%T0(2)T2=(20%+80%/8)*T0=30%T0P2=(1+10%)2*8*P0=9.68*P0W2=T2*P2=2.904W010By刘梦博副本可靠性模型(6)S:站点可用性e.g.,99%L:连接可用性e.g.,95%S0S1S4L1L0L3L4L5L6L8L9FimirrorUserA=SL+(1–SL)SLPrimarysitecanbereachedPrimarysiteMirrorsitecanbereached11S2S3L1L23L7L8FihomeDataunavailabilityreducedfrom5.95%to0.35%Availabilityimprovedfrom94%to99.65%Duplicatedavailability=2SL–(SL)2Unavailability=1–2SL+(SL)2=(1–SL)2=0.35%PrimarysiteinaccessibleBy刘梦博例题选讲(7)在下面Tomasulo结构上执行指令,分别计算每条指令写结果阶段的时间(时钟周期数),并画出相应的时空图。(注:写不下了图在下页)Latency12LDF634+R21LDF245+R31MULTDF0F2F410SUBDF8F6F22DIVDF10F0F640ADDDF6F8F22By刘梦博TomasuloOrganizationFromMemFPRegistersFPOpQueueLoadBuffersStoreBuffersLoad1Load2Load3Load4Load5Load6FPaddersFPaddersAdd1Add2Add3FPmultipliersFPmultipliersMult1Mult2ReservationStationsCommonDataBus(CDB)ToMemBuffers13By刘梦博TomasuloExampleInstructionstatus:ExecWriteInstructionjkIssueCompResultBusyAddressLDF634+R2Load1NoLDF245+R3Load2NoMULTDF0F2F4Load3NoSUBDF8F6F2DIVDF10F0F6ADDDF6F8F2ReservationStations:S1S2RSRSTimeNameBusyOpVjVkQjQkTimeNameBusyOpVjVkQjQkAdd1NoAdd2NoAdd3NoMult1NoMult2NoRegisterresultstatus:ClockF0F2F4F6F8F10F12...F300FU14By刘梦博TomasuloExampleCycle1Instructionstatus:ExecWriteInstructionjkIssueCompResultBusyAddressLDF634+R21Load1Yes34+R2LDF245+R3Load2NoMULTDF0F2F4Load3NoSUBDF8F6F2DIVDF10F0F6ADDDF6F8F2ReservationStations:S1S2RSRSTimeNameBusyOpVjVkQjQkTimeNameBusyOpVjVkQjQkAdd1NoAdd2NoAdd3NoMult1NoMult2NoRegisterresultstatus:ClockF0F2F4F6F8F10F12...F301FULoad115By刘梦博TomasuloExampleCycle2Instructionstatus:ExecWriteInstructionjkIssueCompResultBusyAddressLDF634+R21Load1Yes34+R2LDF245+R32Load2Yes45+R3MULTDF0F2F4Load3NoSUBDF8F6F2DIVDF10F0F6ADDDF6F8F2ReservationStations:S1S2RSRSBusyOpVjVkQjQkTimeNameBusyOpVjVkQjQkAdd1NoAdd2NoAdd3NoMult1NoMult2NoRegisterresultstatus:ClockF0F2F4F6F8F10F12...F302FULoad2Load1Note:Unlike6600,canhavemultipleloadsoutstanding16By刘梦博TomasuloExampleCycle3Instructionstatus:ExecWriteInstructionjkIssueCompResultBusyAddre
本文标题:华中科技大学计算机系统结构复习题
链接地址:https://www.777doc.com/doc-7360343 .html