◆大幅度增强GT200的浮点运算能力:
众所周知,浮点运算能力与显卡的运行速度成正比。在G80时代,核心总共拥有128个流处理器,平均分配在8个TPC当中,另外,NVIDIA为了弥补在流处理器数量上的不足,还将Shader频率首次与显卡核心频率(主要指纹理单元以及ROP单元频率)实现了异步,让Shader频率高出核心频率两倍左右,因此大大的提升了显卡的浮点运算能力。当年G80的浮点运算能力达到了1350MHzx128(个流处理器)x1(每个流处理器同时能够进行1个1D ALU处理)x2=345.6GFLOPS。
而在GTX 280当中,我们同样可以根据上面的公式来计算出它的浮点运算能力:1296MHz x 240 x 1 x 2 =622.08GFLOPS,几乎达到了G80显卡的一倍左右。可以说,在大幅度增加了SP单元的同时,显卡的浮点运算能力也有了非常显著的提升。这也是为何NVIDIA会在GT200核心产品上提出并行处理架构的一个原因,具体细节我们会在第三章中为大家介绍。
『GT200与G80详细规格对比』
◆纹理填充率的增加:
NVIDIA在大幅度增强浮点运算能力的同时,也不忘继续对纹理填充率的增加,当然,相对于SP单元来说,纹理填充单元提升并不是那么明显。在GT200当中,每个TPC中依然只保留了8个纹理填充单元,不过由于TPC数量的增加,因此在纹理填充单元数量上也由G80当时的64个提升到了目前的80个。因此从纹理填充率上来看,GT200的纹理填充率确实要高于G80时代的产品。
◆加大浮点和纹理运算能力的比值:
事实上,NVIDIA与ATI的产品当中,一直都存在着一个原本被称为“像素填充率与纹理填充率的比值”。只不过由于统一架构的诞生,因此原有的像素着色器单元(Pixel Shader,简称PS单元)被统一规划成为了Shader单元,能够处理PS、VS以及GS多种运算。
在G80核心架构当中,由于每一组TPC当中都包含有16个SP以及8个TF单元,因此我们如果从理论数值上看,在G80时代的像素填充率与纹理填充率的比值已经达到了2:1,当然,这只是理论数值,在实际应用当中应该会比这个比值小一些。
因此,我们如果从理论数值上看,那么这一代NVIDIA的像素填充率与纹理填充率的比值似乎已经达到了3:1。当然,这仅仅在于理论树枝上,而在实际应用当中,很少会出现所有的统一Shader单元都在进行像素渲染工作。