您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > AMD统一渲染GPU架构 历程回顾与评测
AMD统一渲染GPU架构历程回顾与评测前言:NVIDIA公司历经长时间酝酿的Fermi架构高端产品GTX480/GTX470发布已经结束,经历了长达一个月的忙碌,我们已经了解到了这款产品的各项特性,众多用户和开发者组成显卡圈最近也趋于平淡。如果别人问到我,了解NVIDIA和AMD两家产品的性能后,你该做些什么?我想我该回忆两家公司这些年来在统一渲染架构方面成果,更重要的是思考它们所采用的不同发展模式最终带来的结果。今天通过这篇分析和评测文章,我希望能够回顾AMD在统一渲染架构时代的发展历程,换而言之也就是分析从RadeonHD2000到RadeonHD5000系列AMD的GPU芯片设计思路,以及这种思路带给用户最终的使用体验。这是一条由最初的失败,逐渐看到转机,并最后走出自己特色走向成功的路径。如果你能耐心读完整篇文章,相信一定会有所收获。同时感谢迪兰恒进友情送测的“收藏级别”显卡帮助我们完成这次跨越时空的评测过程。●7年前的狂热和选择2007年6月3日是AMD发布其第一款桌面级统一渲染架构GPU的时间,这款产品被命名为RadeonHD2900XT,它代表了全新的R600架构。从名称能够看出它代表了AMD最顶级GPU产品,而它的对手正是NVIDIA公司之前发布GeForce8800GTX。我们按照一款GPU芯片的设计周期推测,RadeonHD2900XT所代表的R600架构,大约是在2003年开始设计的。而此后流传出的信息也印证了这个猜想,R600架构的设计思路提出,正是始于2003年,此后的故事就从这个时候开始。2002年微软发布了DirectX9.0,在这一代图形API中,PS单元的渲染精度已达到浮点精度,传统的硬件T&L单元被取消。全新的VertexShader(顶点着色引擎)编程将比以前复杂得多。DirectX9.0的先进特性使得它早就了无数经典的PC游戏,GPU也从这个时候开始走上飞速发展的道路。面对微软发布的全新API,两家厂商的反应是不同的。此时NVIDIA沉浸于GeForce4Ti带来的全盛,这是一款在DirectX8.0为NVIDIA公司带来无数好评的GPU产品,同时它当之无愧地代表了图形业界的最高性能。NVIDIA为了追求完美,选择稍作等待来支持更成熟的DirectX9.0,在NDIDIA心中所谓“成熟”的ShaderModel是一个较为特殊的版本,它实际上是由VS2.0和PS3.0组成的。Radeon9700与竞争对手规格对比而ATI并没有选择“成熟”的ShaderModel,依靠和微软紧密的合作,ATI发布Radeon9700时,选择了VS2.0/PS2.0,并且发布速度惊人。直至5个月后,NVIDIA公司才发布了研发代号NV30的GeForceFX,同时这款产品在功耗和特性方面并不占优。Radeon9700成为了ATI最成功的一代显卡,无论高中低端,R300架构造就的ATI显卡在竞争中都取得明显的优势。R300应该是当时正式上市的最复杂的图形处理器,由0.15µm工艺制造的大约1亿700万个晶体管组成,相对于竞争对手的GPU,它的规模明显放大了很多。R300芯片微架构ATI在这时尝到了甜头,R300的成功让它认为设计一款大型GPU产品,然后通过灵活地组合其功能单元开发出针对中低端市场的小型GPU产品,是非常容易获得利润的,同时保证了自己在高端领域的形象。这种思路直接影响了R600的开发,尽管当时没有明确提出R600这个名称,但是ATI还是信心满满地开始规划未来的美好前景。R300的成功,还为ATI赢得了另一份荣誉,那就是微软的信任。同为2003年,ATI和微软宣布了一份开发协议——由ATI来为当时的下一代主机XBOX开发业界尖端的图形单元Xenos。这打破了先前微软和NVIDIA的合作关系,意味着XBOX下一代主机的图形部分将更换一位新的合伙人。到了2005年,微软透露360将使用由ATI设计的专用图形单元,它工作在500MHz的时脉上,拥有48条统一着色器和10M嵌入式内存。第一款统一渲染架构GPU——Xenos处理器Xenos是微软与ATI的合作结晶,于2005年发布在XBOX360游戏主机中。这款GPU最大的特色是采用了统一着色器单元架构,顶点、像素着色器程序都在同样的单元上执行,由线程调度器作动态的资源分配,还引入了顶点纹理拾取(VTF单元)等ATI同期R5XX产品所不具备的特性。濮元恺所写过的技术分析类文章索引(持续更新)NVIDIA/ATI命运转折GPU十年发展回顾改变翻天覆地最全Fermi架构解读显卡只能玩游戏?10年GPU通用计算回顾通用计算对决四代N卡激战CUDA-Z从裸奔到全身武装CPU功能集成之路探秘AMD统一渲染架构历程回顾与评测浅析DirectX11技术带给图形业界的改变摩尔定律全靠它CPU光刻技术分析我就喜欢N饭永不投诚语录别浪费你的电脑分布式计算在中国从Folding@home项目看GPU通用计算发展Computex独家泄密解析AMD下代GPU●R520和R580对NVIDIA的影响此后为了应对NVIDIA迅速推出的Geforce7800GTX,ATI发布了RadeonX1000系列产品,开发代号为R520。基于R520的X1800XT是全球首批采用0.09微米制程的显示核心。采用新工艺的好处是不言而喻的,除了使显卡的核心频率能达到前所未有的高度之外也降低了芯片的生产成本。不过R520仍然不是RadeonX1000系列的最终形态,2006年1月24日,距离RadeonX1800发布4个月还不到的时间,ATI正式发布新一代的高端产品——RadeonX1900系列。作为06年推出的新高端产品,RADEONX1900不仅拥有高时钟频率的特点,而且还在架构上作了大刀阔斧的改进,性能获得显著提升。在玩家眼中最为出色的3:1黄金架构正是在R580时代诞生。代号R580的RADEONX1900系列的每条传统的像素管线拥有3个像素渲染单元传统的管线概念(Pipeline)中,像素渲染单元(PixelShader)跟Pipeline数目相同,NVIDIA的G70图形就是这样一个概念;但是ATI在全新的R580图形芯片中,稍微修正了像素渲染单元跟Pipeline的关系。RadeonX1900需要重点强调的地方在于,R580图形芯片拥有16条传统的像素管线(PixelPipeline),但是却拥有48个像素渲染单元和16个纹理单元,算术处理能力是以前旗舰级GPU的3倍,在晶体管数量只增加20%的情况下,渲染能力理论上增加了200%。RadeonX1900让ATI重夺性能王座。ATI从R520到R580让人意想不到的变化无疑激怒了NVIDIA,NVIDIA习惯把持性能王座,它肯定不想王位被ATI夺去。在ATI内部,CarrellKillerbrew(ATi工程院院士、RV770首席架构师)正在下一个赌注,他打赌NV会低估R580,NV会像评估R480一样评估R580。他打赌NVIDIA会被R580弄得大吃一惊然后弄出一颗比G70大得多的芯片。NVIDIA不想丢掉性能王座,所以G80会是一个怪兽。NVIDIA果然做出了惊人的选择,不但快速将GPU的着色器Shader结构从SIMD迁移到MIMD领域,同时将MIMD结构的流处理器数目提升到128个。代号G80的GeForce8800GTX相对于上一代产品,几乎经过了重新设计,各方面的改进都非常大。G80微架构示意图G80架构使用了多指令流多数据流MIMD结构标量流处理器,一共128个流处理器替代了原来分立的VertexShader和PixelShader,拥有当时最强的性能,当然G80拥有6.81亿个晶体管,是G71的2.5倍之多,显存方面384Bit显存位宽也充分保证了数据吞吐能力。在性能上GeForce8800GTX显卡把3D图形处理器的性能又引领到一个前所未有的高度,这给对手承重的打击,ATI竟在半年之内拿不出一款足以抗衡G80核心的产品。NVIDIA凭借G80的革命性架构毫无悬念的夺取了3D性能的制高点。G80架构奠定了NVIDIA此后长时间的产品线发展规划,直至今天在市场上热卖的GT240等中端产品,都基于G80架构衍生而来。同时G80架构在图形处理方面的执行效率出色,也成为NVIDIA自己至今难以逾越的标杆。G80架构的所有流处理器,会被GigaThread线程处理器根据工作负荷,自动分配执行顶点着色器、几何着色器、像素着色器指令,线程调度是硬件执行完全自动化的,加上采用的是标量架构,不管是DX7、DX8、DX9、DX10还是OpenGL,G80的统一着色器都会达到100%的运作效率。这是MIMD架构区别与传统SIMD架构最明显的地方,也是NVIDIA和ATI在走进统一渲染时代所使用的不同策略。●R600与G80的不均衡对抗代号G80的GeForce8800GTX相对于上一代产品,几乎经过了重新设计,各方面的改进都非常大。而R600家族的体系架构在一定程度上可以看作是延续自Xenos。但是ATI在2006年7月24被AMD收购以及它之前的研发精力不足,直接影响了R600家族产品的开发受到很大影响。最后导致没有统一架构设计经验的NVIDIA在2006年11月8日成功发布了G80核心的GeForce8800GTX显卡,巨大的技术革新和性能提升,获得了用户的一致认同。至今耳熟能详的G80架构GeForce8800GTX显卡G80架构使用了多指令流多数据流MIMD结构标量流处理器,一共128个流处理器替代了原来分立的VertexShader和PixelShader,拥有当时最强的性能,当然G80拥有6.81亿个晶体管,是G71的2.5倍之多,显存方面384Bit显存位宽也充分保证了数据吞吐能力。在性能上GeForce8800GTX显卡把3D图形处理器的性能又引领到一个前所未有的高度,这给对手承重的打击,ATI竟在半年之内拿不出一款足以抗衡G80核心的产品。NVIDIA凭借G80的革命性架构毫无悬念的夺取了3D性能的制高点。直到2007年6月3日,AIT终结了长达7个月的等待时间,RadeonHD2000家族终于发布。业内第一片DX10GPU的头衔被G80抢了去,不过ATI这次也没有完全被NVIDIA牵着鼻子走。除了对DX10和统一着色架构的支持外,R600还加入了一些特有的功能。例如,独立于几何着色器(GeometryShader)的专用曲面细分单元(tessellation),加入属于DirectX10.1范畴的可编程AA功能等。R600架构在最后的设计阶段,已经发现了明显的问题,那就是SIMD结构的流处理器在使用了VLIW之后,过分依赖指令系统和编译器的效率。如果说流处理器数量足够多,则可以在宏观上抑制这种性能下降,但是R600但是只有320个流处理器。80nm工艺制造的RadeonHD2900XT显卡并且受制于台积电的80纳米高速版(80HS)工艺,加之R600集成了大约7亿枚晶体管这个不小的数量,R600最后的工作频率在一味追求GFLOPS浮点吞吐量的前提下达到了740MHz,并且为512Bit显存通道配备多达16颗显存……以上各种因素影响最终让R600架构的高端代表产品RadeonHD2900XT的整张显卡提升到高达225W。随着各大媒体对于RadeonHD2900XT评测的结束,我们看到了一个让人吃惊的事实。基于R600架构的RadeonHD2900XT产品没能够战胜NVIDIA的GeForce8800GTX,甚至在有些领域大幅度落后于对手。这导致RadeonHD2900XT的定位只能针对NVIDAI的8800GTS640MB显卡,售价自然也只能和对手的次高级显卡持平甚至略低。现在回忆当时的场景,你甚至无法想象ATI设计出一款全新架构的GPU,又因为巨额亏损惨遭收购,最终这款GPU的性能还是无法对手的高端产品向抗衡。在R600设计完成并走上市场后,整个AMD的GPU设计团队非常沮丧。●RV670开始改进绝境求生R60
本文标题:AMD统一渲染GPU架构 历程回顾与评测
链接地址:https://www.777doc.com/doc-6218899 .html