您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 显卡发展史__燕山大学郭培赞
目录1工作原理2基本结构5性能指标3接口和相关技术4体系架构6显卡分类及市场调查工作原理显卡处理图像数据的过程1、CPU→显卡CPU将有关作图的指令和数据通过总线传送给显卡。对于现代显卡,由于需要传送大量的图像数据,因而显卡接口在不断改进,从最早的ISA接口到PCI、过去式的AGP接口,以及正在流行的PCI-Express接口,其数据吞吐能力不断增强。2、显卡内部图像处理GPU根据CPU的要求,完成图像处理过程,并将最终图像数据保存在显存中。3、最终图像输出对于普通显卡,RAMDAC即DigitalAnalogConverter(随机读写存储数—模转换器)从显存中读取图像数据,转换成模拟信号传送给显示器。对于具有数字输出接口的显卡,则直接将数据传递给数字显示器。返回目录基本结构每一块显示卡基本上都是由“显示主芯片GPU”,“显示缓存”(简称显存),“BIOS”,数字模拟转换器(RAMDAC),“显卡的接口”以及卡上的电容、电阻等组成。多功能显卡还配备了视频输出以及输入,供特殊需要。DVI,VGA.随著技术的发展,目前大多数显卡都将RAMDAC集成到了主芯片了。理论上,如果电脑配有两块具有双头输出功能且提供PCI-E接口的显卡,则它能够支持四台监视器。CRT需要接受模拟信号,LCD接受的则是数字信号返回目录基本结构DisplayPort支持的宽带高达10.8GB/s,即使HDMI1.3也有一定差距。色深完全支持到了30及36位,已经到了肉眼无法识别的程度了。DisplayPort最大的特色是接口分为内置和外置两种。外置接口外型上很像USB接口,用于链接外部现实设备,而内置接口用于计算机内部空间有限的地方,比如笔记本和刀板显卡此外,DisplayPort还加入了DPCP版权保护系统,它采用了现代的128位AES加密技术。三星宣布了全球首款DisplayPort接口桌面液晶显示器,这款显示器应该说相当的“恐怖”,光屏幕足有30寸。返回目录HDMI接口(英文:HighDefinitionMultimediaInterface,HDMI)是一种专用型数字化接口,其可同时传送音频和视频信号。同时无需在信号传送前进行数/模或者模/数转换。HDMI可搭配宽带数字内容保护(HDCP),以防止具有著作权的影音内容遭到未经授权的复制。基本结构返回目录API接口OpenGLOpenGL是OpenGraphicsLibrary的缩写,是一套三维图形处理库,也是该领域的工业标准。SGI(SiliconGraphics)硅图(工作站生产商)在1992年7月发布1.0版,后成为工业标准,由成立于1992年的独立财团OpenGLArchitectureReviewBoard(ARB)控制。SGI等ARB成员以投票方式产生标准,并制成规范文档(Specification)公布,各软硬件厂商据此开发自己系统上的实现。只有通过了ARB规范全部测试的实现才能称为OpenGL。2011年8月9日在温哥华举行的SIGGRAPH2011大会上Khronos发布了新的OpenGL4.2标准细节返回目录API接口返回目录DirectXDirectX并不是一个单纯的图形API,它包含有DirectGraphics(Direct3D+DirectDraw)、DirectInput、DirectPlay、DirectSound、DirectShow、DirectSetup、DirectMediaObjects等多个组件,它提供了一整套的多媒体接口方案。最新版本为DirectX11。API接口DirectX7.0:最大的特色就是支持T&L,中文名称是“坐标转换和光源”。让显卡分担了部分CPU需要进行的工作。返回目录Geforce256——代号NV10于1999年8月发布。这是图形芯片领域开天辟地的产品,也是第一款提出GPU概念的产品。DX8返回目录DirectX8.0:引发了一场显卡革命,它首次引入了“像素渲染”概念,同时具备像素渲染引擎(PixelShader)与顶点渲染引擎(VertexShader),反映在特效上就是动态光影效果。同硬件T&L仅仅实现的固定光影转换相比,VS和PS单元的灵活性更大,它使GPU真正成为了可编程的处理器。此时DirectX的权威地位终于建成。DX8顶点生成:位置、颜色、标准向量等顶点处理:确定3D图形的形状及位置关系,建立起3D图形的骨架。光栅化计算:点和线通过一定的算法转换到相应的像素点。把一个矢量图形转换为一系列像素点的过程就称为光栅化。相应的片元集合也就随之产生。顶点着色单元像素渲染单元纹理贴图单元VertexShader顶点着色器PixelShader像素渲染器返回目录Texturemappingunit纹理贴图单元纹理帖图:完成对多边形表面的帖图。像素处理:(在对每个像素进行光栅化处理期间)GPU完成对像素的计算和处理,从而确定每个像素的最终属性。在这个阶段PixelShader(像素着色器)从显存中读取纹理数据对片元上色并渲染。最终输出:由ROP(光栅化引擎)完成所有像素到帧缓冲区的输出,经过D/A转换输出到显示器之后,我们就可以看到绘制完成的图像。对于快节奏的游戏,电脑每秒钟必须执行此过程约60次。返回目录DX10DirectX10.0:引入了统一渲染架构Unified-Shader,,也就是说现在每条渲染管线都由流处理器和纹理贴图单元组成,其中流处理器身兼顶点着色、像素着色和几何着色三职。ShaderModel4.0另一个重大变化就是在VS和PS之间引入了一个新的可编程图形层----几何渲染器(GeometryShader)。原来的VertexShader和PixelShader只是对逐个顶点或像素进行处理,而新的GeometryShader可以批量进行几何处理,而调配哪几组Shader单元负责处理什么数据或者进行什么样子类型的计算,则由一个被称为smallsetsofinstructions(SSI)的部分来控制。返回目录DX10返回目录图形流水线中可编程单元的行为由Shader单元定义,并可以由高级的Shading语言(例如NV的Cg,OpenGL的GLSL,Microsoft的HLSL)编写。Shader源码被译为字节码,然后在运行时由驱动程序将其转化为基于特定GPU的二进制程序,具备可移植性好等优势。API接口返回目录DirectX11:引入最大新技术特征无疑是硬件Tessellation曲面细分,另外多线程渲染、ComputeShaders也是DirectX11中重要环节,引入ShaderModel5.0。劳拉姐姐前世今生五、PCI-E显卡时代性能指标1.显示芯片(制造工艺、核心频率、SP单元、渲染管线)2.显存(显存类型、显存容量、显存带宽(显存等效工作频率×显存位宽÷8)、显存速度、显存颗粒、最高分辩率、显存时钟周期、显存封装模式)3.技术支持(ROPs数量*核心频率=像素填充率、纹理填充率、3DAPI、RAMDAC频率)4.显卡PCB板:PCB层数、显卡接口、输出接口、散热装置)返回目录性能指标显卡性能的一个很好的整体衡量标准是它的帧速。影响帧速的因素包括:每秒生成的三角形数或顶点数:说明了显卡能以多快的速度生成线框图像。像素填充速率:这项指标说明了GPU一秒钟内能处理多少个像素,从而也就说明了显卡能以多快的速度对图像进行光栅化处理。像素填充率=显卡的显示核心频率X像素渲染管线数量。纹理填充率=核心频率X像素渲染管线数量X每管线纹理贴图单元数量。开发代号:显示芯片制造商可以利用一个基本开发代号在通过控制渲染管线数量、流处理器单元数量、显存类型、显存位宽、核心和显存频率、所支持的技术特性等方面来衍生出一系列的显示芯片显存位宽是显存在一个时钟周期内所能传送数据的位数,位数越大则相同频率下所能传输的数据量越大。SDRAM在一个时钟周期内只传输一次数据,它是在时钟的上升期进行数据传输;而DDR内存则是一个时钟周期内传输两次数据显存速度一般以ns(纳秒)为单位。常见的显存速度有1.2ns、1.0ns、0.8ns、0.4ns等。显存的理论工作频率计算公式是:等效工作频率(Hz)=n/(显存速度)(n因显存类型不同而不同,如果是GDDR3显存则n=2;GDDR5显存则n=4)习惯上称呼的DDR频率是其等效频率返回目录体系架构GeForceGTX580是Fermi架构二代升级版本的GF110核心。其中G代表GPU,F代表Fermi架构。包括主接口(HostInterface)、GigaThread引擎、四组图形处理器集群(GPC)、六个64位GDDR5显存控制器、六个ROP分区、768KB二级缓存。每组SM内又包含32个流处理器(CUDA核心)32个流处理器构成一组SM(StreamingMultiprocessor)返回目录体系架构光栅引擎以流水线的方式执行边缘/三角形设定(Edge/TriangleSetup)、光栅化(Rasterization)、Z轴压缩(Z-Culling)等操作,每个时钟循环周期处理8个像素。GF100有四个光栅引擎,每组GPC分配一个,整个核心每周期可处理32个像素。RasterEngine是用于修正,而ROPs则是传统的运算.多形体引擎则要负责顶点拾取(VertexFetch)、细分曲面(Tessellation)、视口转换(ViewportTransform)、属性设定(AttributeSetup)、流输出(StreamOutput)等五个方面的处理工作,DX11中最大的变化之一细分曲面单元(Tessellator)就在这里。返回目录体系架构返回目录NVIDIA的线程粒度被称作Warp,一个Warp是32线程;而AMD的线程粒度称作wavefront,粒度是64线程。每个CUDACore是一个统一的处理器核心,执行顶点,像素,几何和kernel函数。一个统一的768KB二级缓存架构负责线程加载、存储和纹理操作。每组SM里四个纹理单元,共享使用12KB一级纹理缓存,并和整个芯片共享768KB二级缓存。每个纹理单元每周期可计算一个纹理寻址、拾取四个纹理采样,并支持DX11新的压缩纹理格式。CUDA(ComputeUnifiedDeviceArchitecture,统一计算架构)是NVIDIA公司对于GPGPU(GeneralPurposeGPU),即通用计算图形处理器的正式名称。通过这个技术,用户首次可以利用GPU作为C-编译器的开发环境。CUDA架构可以兼容OpenCL或者自家的C-编译器。无论是CUDAC-语言或是OpenCL,指令最终都会被驱动程序转换成PTX代码,交由显示核心计算。要将GPGPU普及化,还要看微软能否在Windows操作系统中,提供相关的编程接口。DirectCompute是微软的通用计算API。CUDA体系结构的组成来说,包含了三个部分:开发库、运行期环境和驱动。体系架构返回目录第一个问题:为什么需要GPU?CPU除了处理游戏的AI,情节等方面的数据外,对于有些图像方面也是由它完成的。当微软每次发布新的DirectX时,并不是每款GPU都能支持DirectX新的特性,所以有些图像方面的任务还得由CPU来完成。还有有些特性比如重力特性以前是由CPU来完成,现在有些GPU也能支持了,这些任务就由GPU来完成了。第二个问题:GPU能否替代CPU?GPU相当于专用于图像处理的CPU,正因为它专,所以它强,在处理图像时它的工作效率远高于CPU,但是CPU是通用的数据处理器,在处理数值计算时是它的强项,它能完成的任务是GPU无法代替的,所以不能用GPU来代替CPU。体系架构返回目录SIMD是SingleInstructionMultipleData的缩写,翻译过来的意思为单指令多数据流。其执行方法是让一个控制器对多个处理器进行控制,将一个指令下发到每个被控制的处理器上对不同数据进行相同的操作。这一技术在CPU以及GPU上都得到了应用,而其中GPU领域应用更为广泛(特指ATI
本文标题:显卡发展史__燕山大学郭培赞
链接地址:https://www.777doc.com/doc-540299 .html