Intel Core vs. AMD K8:CPU架构分析(6)

文章出处:anandtech.com  作者:HighDiy  发布时间:2006-05-10
内容概要

关键词:Intel Core AMD K8 CPU 架构

导言:Intel全力推出的Core架构CPU在技术上有哪些突出特点?与AMD 大获成功的K8架构相比,优势体现在哪里?

Core vs. K8 : 乱序执行引擎

  为了使读者更加清晰的了解AMD K8 CPU与 Intel Core 架构的区别,我们使用相同的风格制作了下面的图表。

Core vs. K8 : Core架构执行流程
Core vs. K8 : Core架构执行流程

Core vs. K8 : K8架构执行流程
Core vs. K8 : K8架构执行流程

  从图上可以看到Core 架构与K8 CPU的明显区别。Core 架构拥有更大的乱序缓冲区:96 entry,再考虑到它的宏指令融合技术,其实际容量比 K8 CPU的72 entry要大的多。而最初的 P6 架构只有40 entry,在Banias、Dothan 及 Yonah CPU中增加到了80 entry,而现在的 Core 架构进一步增加到了96 entry。为了看起来清晰、直观,我们制作了下面的表格来比较这几代CPU的重要特性。

CPU架构特性
CPU架构特性

  Core 架构采用集中式保留站(central reservation station),而 K8 CPU采用分布式调度器(distributed scheduler)。集中式保留站的优势是拥有更高的利用率,而分布式调度器能容纳更多的表项。NetBurst 架构也采用分布式调度器。

  使用集中式保留站也是把 Core 架构称作“P8 架构”的理由之一,这是相对古老的 P6 架构的第二项巨大的提升。它利用保留站并调度与分配执行单元来执行微指令。执行结束后,执行结果被存储到乱序缓冲区内。这样的设计方式无疑是继承自Yonah、Dothan 甚至 P6 架构。

  最大的区别并不能立即从图表上看出来。Intel 先前的CPU需要2个时钟周期才能完成一次分支预测操作,而 Core 架构只需要1个时钟周期。而 AMD 的 K8 CPU也只需要1个时钟周期就可以完成一次分支预测操作。

  另外一处令人惊讶的地方是 Core 架构的 SSE 多媒体指令执行性能。Core 架构拥有3组非常强大的128-bit的 SSE 执行单元,其中2组是对称的。拥有如此强大的SSE执行资源,Core 架构在执行128-bit SSE2/SSE3指令时将远远超过 K8 CPU。

  在 K8 CPU上,1条128-bit的 SSE 指令会被解码成2条64-bit的指令,因为 K8 CPU的 SSE 执行单元只能执行64-bit的指令。所以说,从这个角度看,Core 架构的SSE处理能力至少是 K8 CPU的2倍。如果是对64-bit的浮点进行操作,Core 架构每个时钟周期可以处理4个双精度浮点数的计算,而 K8 CPU可以处理3个。

  就整数执行单元来说,Core 架构比 Pentium 4 CPU和 Dothan CPU也有很大的提高,而与 K8 CPU处于同样的水准——如果只考虑执行单元的数量的话,Core 架构与 K8 CPU都拥有3组ALU。如果也考虑 AGU 的话,K8 CPU拥有3组,甚至比 Core 架构的2组要更有优势。这可能会使 K8 CPU在一些不太常见的整数计算中有优势,比如解密运算。不过,Core 架构拥有的更深、更灵活的乱序缓冲区和更大、更快速的二级缓存可以在绝大多数整数运算中消除 K8 CPU这个小小的优势。


  共9页: 上一页 [1] [2] [3] [4] [5] 6 [7] [8] [9] 下一页   
 

当前位置:主页>>CPU>>CPU分析>> Intel Core vs. AMD K8:CPU架构分析(6)