梁祝之蝴蝶单飞去年11月8日nVIDIA发布了G80显卡即8800GTX/GTS,一个崭新的显卡时代到来了。首先我们一起来看一下GF8给我们带来的新的渲染架构:统一渲染架构。
相对于DirectX 9来说,最新的DirectX 10最大的改进在于提出了统一渲染架构,即Unified Shader。传统的显卡GPU一直采用分离式架构,顶点处理和像素处理分别由Vertex Shader和Pixel Shader来完成,于是,当GPU核心设计完成时,PS和VS的数量便确定下来了。但是不同的游戏对于两者处理量需求是不同的,这种固定比例的PS VS设计显然不够灵活,为了解决这个问题,DirectX10规范中提出了了统一渲染架构。不论是顶点数据还是像素数据,他们在计算上都有很多共同点,例如通常情况下,他们都是4D矢量,而且在ALU中的计算都是没有分别的浮点运算。这些为统一渲染的实现提供了可能。在统一渲染架构中,PS单元和VS单元都被通用的US单元所取代,nVidia的实现中称其为streaming processer,即流处理器,这种US单元既可以处理顶点数据,又可以处理像素数据,因而GPU可以根据实际处理需求进行灵活的分配,这样便有效避免了传统分离式架构中VS和PS工作量不均的情况。统一渲染架构使用US(通常为SP)单元取代了传统的固定数目的VS和PS单元,US既可以完成顶点操作,又可以完成像素操作,因而可以根据游戏需要灵活分配,从而提高了资源利用率。
G80 GPU中安排了16组共128个统一标量着色器,被叫做stream processors,后面我们将其简称为SP。每个SP都包含有一个全功能的1D ALU。该ALU可以在一周期内完成乘加操作(MADD)。也许有人已经注意到了,在前面传统GPU中VS和PS的ALU都是4D的,但在这里,每个SP中的ALU都是1D标量ALU。没错,这就是很多资料中提及的MIMD(多指令多数据)架构,G80走的是彻底的标量化路线,将ALU拆分为了最基本的1D 标量ALU,并实现了128个1D标量SP,于是,传统GPU中一个周期完成的4D矢量操作,在这种标量SP中需4个周期才能完成,或者说,1个4D操作需要4个SP并行处理完成。G80将操作彻底标量化,内置128个1D标量SP,每个SP中有一个1D ALU,每周期处理一个1D操作,对于4D矢量操作,则将其拆分为4个1D标量操作,并且nVidia采用了shader频率与核心频率异步的方式来提高性能。Geforce8800GTX虽然核心频率只有575MHZ,但shader频率却高达1375MHZ,即SP工作频率为核心频率的两倍以上,而R600则相对保守地采用了shader和核心同步的方式,在RadeonHD2900XT中,两者均为740MHZ。这样一来,G80的shader频率几乎是R600的两倍,于是就相当于同频率下G80的SP数加倍达到256个,与R600的320个接近了很多。在处理乘加(MADD)指令的时候,740MHZ的R600的理论峰值浮点运算速度为:740MHZ*64*5*2=473.6GFLOPS 而shader频率为1350MHZ的G80的浮点运算速度为:1350MHZ*128*1*2=345.6GFLOPS,两者的差距并不像SP规模差距那么大。
V8803GX73是G80的高端,而V8803GS63的参数则相对较低,完全公版设计的V8803GX73和V8803GS63显卡的具体技术上面已经说过了,比比不同吧!
G80的性能是Geforce 8系列中最强大的,128条和99条统一渲染单元,分别拥有768M和640M的高速显存,位宽分别是384B和320B的强力配置,唯一让人汗颜的就是它们的高价!
80nm的Georce 8系卡由于核心频率相当高导致温度普遍偏高,而G84和G80差的性能太多,于是65nm的G92呼之欲出了!
G92核心使用了65nm工艺,因此功耗、发热相比G80有了很大的改观,再加上显存接口是256Bit,因此PCB复杂程度、供电成本都会同步降低,性能和价格方面,则会给大家带来意想不到的惊喜!
G92版8800GT核心与8800GTS相比只是屏蔽了16个流处理器,最终规格是112个流处理器,核心频率为600MHz,显存位宽也回归256Bit,显卡配备了1.0纳秒的GDDR3显存,容量为512M,显存频率1800MHz;新显卡核心规格提升,高性价比产品也诞生了,这款高端新品零售价只要1999元。此次NVIDIA的产品命名比较奇怪,虽然核心代号已经从G80升级到G92,但产品型号还是保持8800系列不变,并没有像上代产品那样从7800进化到7900。原因可能是显存位宽由384Bit/320Bit下降到256Bit所致,此次NVIDIA的目的是为广大用户带来高性价比的中高端显卡,而并非新的旗舰产品,毕竟8800GTX/8800Ultra至今还是无人能敌!256Bit显存规格,而G92核心同G80一样安装了金属保护盖,以防止核心被压坏。映泰V8803GT52的推出显示了映泰显卡生产达到了新的高度
在新一代中端显卡中,最早发布也是最受关注的莫过于nVidia的G84---Geforce8600系列。G84是G80核心的高度精简版本,SP数量从G80的128个锐减为32个,显存位宽也降为1/3--128bit。而VR8603TS21和VR8603GT21的区别主要就在于显存速度不同,核心方面的区别则可以通过超频来摆平!
总结:8600GT性能上取代7600GT的目标凭借着高效的统一渲染架构使得其显然轻松击败上代高端,流畅运行DX10游戏更是不在话下,归根到底,nVidia对G84 的定位造就了Geforce8600的经典,因此,就目前的情况来看,选用8600系列显然相当的划算,映泰这两款86显卡,特别是VR8603TS21超新星版,核心超频能力极强,曾创造了86GTS的超频世界纪录,一般都可以轻松达到或者接近1G核心。
88系列和86GT系列在售价上一般价格还是比较高的,好的86GT显卡售价一般都要千元左右,对于整机在4000元左右的主流的游戏用户来说,这个价格还是偏高了,显卡价格只能配到600~700元,映泰在这个价位段也提供了两片不错的游戏显卡,一个是8600GT核心的V8602GT51和一个8500GT核心的V8503GT21。
映泰V8602GT51的8600GT显卡采用了先进成熟的80nm工艺制程,核心频率为标准的540MHz,内建32个流处理器,与8600GTS的数量一样,而比85GT要多了一倍,流处理器频率运行在1188MHz。8600GT具备比原G7x系列更先进的特性,统一渲染引擎,支持DirectX10和SM4.0特效,并且具有同时开启HDR+AA高画质功能。最大分辨率可达25601600,支持22寸以及更大的液晶显示器也不在线M超大容量,内存频率为667MHZ。尽管这款显卡不属于超频的超新星系列,散热风扇也毫不含糊,采用GF7系列超新星超频显卡专用的大龙爪风扇,散热能力和低噪音效果非常理想。
D3超值版V8503GT21采用映泰专有的G86设计,比普通8500GT公版有所加强。显示芯片采用G86-300核心的GF8500GT,基于DirectX10规范下的统一渲染架构,内建16个流处理单元,渲染效率远远高于传统的渲染管线架构。显卡支持最新的Shader Model 4.0特效,并且具有第二代PureVideo HD高清视频技术,能够对H.264 1080P高清视频实现完美硬解码播放。核心频率设定为450MHz。显存采用256M DDR3高速显存,显存频率为1400MHz,响应时间为1.4纳秒,。风扇则采用酷睿CPU专用散热设计,散热效果比普通风扇要低几度.这款映泰8系特色超频卡专用的散热器,与酷睿CPU专用散热设计一样,拥有40多片分叉放射分布的战刀散热鳍片,借助静音风扇吹出的风量,形成的螺旋的风道正对显存、供电电路,快速排走芯片和显存的热量,达到整卡快速高效的散热效果。输出接口方面,映泰V8503GT21提供了主流的VGA/DVI/Video-out三接口,非常齐全,满足各种视频输出要求。
V8502GT51和V8402GL26均采用了全新的支持Direct X10的16条统一shader渲染单元,分离式的渲染架构,可以让定位低端的85GT和84GS轻松拥有GF7系列所不具备的高效能,V8502GT51和V8402GL26完全支持DX10并拥有与G80相同的渲染技术,差别只不过是削减了流处理器的个数,V8502GT51具有的一组流处理单元就是16个流处理器。另外在流处理单元中,还包括了L1一级缓存和像素地址设定单元。其性能在Geforce 7600GS之上。而V8402GL16则通过TC技术,轻松让你享用DX10技术的同时还可共享512M显存,在VISTA下更可支持768M显存。
简单的为映泰8系显卡做了个小总结,我们认为即将上市的G92核心的映泰V8803GT52的性价比应该是高端显卡里面最值得选择的,而中端超频显卡则挑选VR8603TS21或者VR8603GT21,搭在映泰超新星软件在超频后的性能责令其性能更上一层楼,低端入门最好选用大显存的V8502GT51,性价比着实令人心动。
|