×
嵌入式 > 嵌入式开发 > 详情

AMD新Bulldozer推土机架构解析汇总

发布时间:2020-05-21 发布时间:
|
第1页:Bulldozer采用集群化微架构

      AMD首款Bulldozer(推土机)处理器将会在2011年上市,Bulldozer是面向服务器和桌面的CPU,独立于之前的K8和K10架构,是一款全新开发的架构,采用32nm SOI工艺制作。今天我们对Bulldozer的架构信息进行了整理汇总,接下来就让我们来一一了解Bulldozer的方方面面。


Bulldozer具备众多创新设计

      首先AMD Bulldozer采用集群化的微架构,Bulldozer集群化的微架构就是CPU内核的集群化;具体来说是融合了两个CPU内核,两个内核共享浮点运算单元和命令解码器等资源。


Bulldozer融合两个CPU内核

      AMD将融合了两个内核的Bulldozer架构称之为“Bulldozer Module”,基本单位是两线程并列的组件。由于Bulldozer聚合了多个单元,所以可以很方便实现更多核心架构扩展。例如,要是4核Bulldozer CPU的话,可以装载2个Bulldozer Module,减少完全重新设计核心的麻烦。


多个Bulldozer模块堆叠实现性能成倍提升

      Bulldozer的集群化微架构可以在一个组件内同时实现2个线程。这种在一个CPU内实现双线程的技术看上和Intel的Hyper-Threading有些类似,其实是有很大不同的。

      Intel的Hyper-Threading(超线程)可以使操作系统或者应用软件的多个线程,同时运行于一个超线程处理器上,其内部的两个逻辑处理器共享一组处理器执行单元。而AMD CPU的两个线程使用各自的单元,但两个线程是共享命令解码器和浮点运算等资源的。因为是整数运算,所有线程之间没有冲突,因此吞吐量有所提高。

      负责Bulldozer开发的AMD首席技术官Chuck Moore曾在2005年的AMD分析日上提到了集群化架构的优点,只是增加50%的CPU内核资源,吞吐量提升80%。根据这个说明,和Hyper-Threading一样的SMT资源和性能也有一些提升。

      Moore在“2009 Financial Analyst Day”分析日上再次提到这种架构可以提高吞吐量达80%。同时,AMD也把这种集群化架构申请了多项专利(United States Patent Application 20090006814、20090024836等)。

第2页:AMD Bulldozer微架构解析

      下图是Bulldozer的具体结构,可以看到一个Bulldozer有2个整数运算的内核,每个内核有4个整数运算通道。4个通道内,2个ALU和AGU为一组,而现在AMD的架构是3个ALU和AGU为一组,最大能实现3个x86整数运算命令。如果是4个ALU和AGU一组的话,那么一个整数运算内核要比现有CPU内核大,如果是2个ALU和AGU一组的话,大约是现有内核的2/3。


Bulldozer架构

      Bulldozer模块的指令获取和解码,每个周期可处理4条指令,而计算指令与在寄存器操作的x86指令会被分成8个内部微操作指令(uOPs),整数运算管道中ALU和AGU则两两成对,正好吻合。

      在浮点运算单元方面,则准备了两个整合的128bit SIMD单元,这将兼容英特尔的256bit AVX指令集,AVX将在这两个128bit SIMD单元中执行。AMD已经确定改变了原有在Bulldozer上的SSE5计划,将支持英特尔的256bit的SIMD指令集AVX。而对于浮点运算单元来说,每个时钟循环中都可以在两个处理器核心之间单独或共享使用。


Bulldozer的具体结构

      与代号为Llano的APU产品一样,Bulldozer(推土机)将支持先进功耗管理功能以及数码测温功能,很显然在TDP设计允许的情况下以及多个核心处于待机状态下时,Bulldozer(推土机)处理器将可以实现频率的大幅提升。

     明年无论是AMD还是Intel将会引来处理器微架构的升级,新一轮较量已经开始,让我们拭目以待吧。


『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
MSP430单片机硬件知识-复位