Barcelona架构解析: AMD的反击(3)

文章出处:AnandTech  作者:HighDiy  发布时间:2007-03-19
内容概要

关键词:Barcelona AMD

导言:AMD即将推出的基于Barcelona架构的四核心CPU,是否值得期待?能否帮助AMD扭转与Intel竞争中的不利局面?

Barcelona架构:SSE128

  Barcelona中的一项重要改进是被AMD称为“SSE128”的技术,在K8架构中,处理器可以并行处理两个SSE指令,但是SSE执行单元一般只有64位带宽。对于128位的SSE操作,K8处理器需要将其作为两个64位指令对待。也就是说,当一个128位 SSE指令被取出后,首先需要将其解码为两个micro-ops,因此一个单指令还占用了额外的解码端口,降低了执行效率。

  而Barcelona加宽了执行单元从64位到128位,所有128位的SSE操作不再需要进行解码分解为两个64位操作,并且浮点调度器也可以支持这种128位 SSE操作,提高了执行效率。

  提高SSE指令执行单元带宽的同时,也会带来一些新的变化,也可以说是新的瓶颈:指令存取带宽。为了将并行处理器过程中解码数量最大化, Barcelona开始支持32字节每时钟周期的指令存取,而先前K8架构只支持16字节。32字节的指令存取带宽不仅对处理器SSE代码有帮助,同时对于整数指令也有效果。

AMD CPU架构比较
CPU架构 K8 Barcelona
SSE执行宽度 64位 128位
指令预取带宽 16位/循环 32位/循环
数据缓存带宽 2 x 64位 2 x 128位
L2/北桥带宽 64位/循环 128位/循环
FP Scheduler Depth 36 Dedicated x 64-bit ops 36 Dedicated x 128-bit ops

  现在获得了存取和解码更多的指令,而要保证效率,还需要获得更多的数据送往执行核心,因此AMD还加宽了L1数据缓存和SSE寄存器之间的带宽。

  AMD在SSE128方面的改进非常类似Intel Yonah到Merom的变化。在Conroe/Merom之前,Yonah在浮点SSE方面的表现并不如K8,我们之前曾经对比过同频下Yonah和 K8处理器这方面的性能,在一般应用、3D渲染和游戏等测试中,Yonah基本可以和K8打平,但在视频编码方面,K8性能更好。不过在Core 2处理器发布后,AMD K8则不再有这方面的优势。


  共8页: 上一页 [1] [2] 3 [4] [5] [6] [7] [8] 下一页   
 

当前位置:主页>>CPU>>CPU分析>> Barcelona架构解析: AMD的反击(3)