|
载入中...
◆核心架构:沿用R600的统一架构
统一架构设计是DX10的最重大改进之一,统一架构的关键就是它整合了功能类似的VS和PS运算单元,另外还加入了几何shader单元,也就是将VS、PS、GS单元进行了整合,每个流处理单元都可以进行VS、PS、GS的运算,而根据游戏的负载调整每个单元的工作内容。通过一个专门执行单元的运算,全新的R6xx会计算游戏画面的Shader数据类型,从而灵活的调配Shader单元进行不同的数据类型运算,达成资源的合理利用,有效的提高GPU的运算效率。R670会计算游戏画面的Shader数据类型,从而灵活的调配Shader单元进行不同的数据类型运算,达成资源的合理利用,有效的提高GPU的运算效率。
R670的核心架构主要分为指令处理器、装备引擎、超线程分派处理器、流计算单元、纹理单元和缓存、内存读取/写入缓存和流输出缓冲、着色输出、渲染器后端几大部分。
◆RV670核心架构解析:

『R600核心逻辑架构图』
RV670的核心架构与R600完全相同,依然保留了320个流处理单元,并且搭配16个纹理渲染单元以及16个渲染器后端,同时还拥有可编程的向前器单元。另外在对显存的优化上,内存控制器能够更高效率的利用显存带宽。RV670与R600产品不同之处在于,RV670将显存的位宽缩减为了256bit,外加512bit环状总线。不过在性能表现上,根据ATI的信息则显示RV670虽然外部总线缩减到了256bit,但是由于保留了512bit的环状总线,因此性能表现上与Radeon HD 2900相当。
◆流处理单元工作原理:

RV670集成了高达320个流处理单元,因为采用了DX10统一架构设计,这些单元可以处理包括顶点数据、shader像素渲染、几何单元处理等各种数据流。RV670的每个流处理单元都包含5路超标量体系结构着色处理器,单时钟周期可以最多处理5个标量乘加指令,其中一路着色处理器负责处理超越指令(比如Sin、Cos、Log、Exp等等)。我们看下图就可以明白,5个黄色的长方形就是5路着色处理器,“胖胖”的那个就是可以处理超越指令的着色处理器。另外,流处理单元可以达成32-bit浮点精度,支持整数和逐位操作,而下图中紫色的长方形“分支执行单元”则负责进行流控制和条件运算。在这一代显卡上,ATI和其竞争对手似乎走到了同一个路线上,都采用了“超标量体系结构”的着色处理器,只不过ATI依然是SIMD单元的设计。
◆第二代环形总线技术介绍:

环形总线架构可以在现有内存技术下达成更多内存带宽,在R600中,第2代环形总线的外部显存位宽接口已经提升到了512bit,其实就是指显卡的位宽到了512bit,而在RV670当中则缩减到了256bit,不过我们并不能通过ATI官方给出的架构图上看出与R600之间有什么区别。并且根据ATI官方给出的数据来看,虽然在RV670上缩减了一半的显存位宽,不过RV670性能表现上依然与R600不相上下。
|