×
嵌入式 > 技术百科 > 详情

小编推荐:兼顾处理器效能与功耗 大小核架构突起

发布时间:2024-07-01 发布时间:
|

近年行动领域出现重大变革,智慧型手机已成为消费者联网生活的主要工具,然而,这其中涉及各种高效能运算任务如高速网页浏览、导航与游戏,以及语音通话、社群网路和电子邮件服务等效能需求较低的后台任务。

与此同时,平板装置也正重新定义运算平台,这些创新设计转变均为消费者打造与内容互动的全新方式,将原本只限于网路共享装置(TetheredDevice)的功能导入行动领域,创造出真正的智慧型新世代运算。大小核big.LITTLE晶片设计架构将快速崛起。ARM与全球IC设计业者正积极合作推广big.LITTLE技术,预期今年下半年将有大量基于此架构的行动处理器问世;其透过将各种运算任务分配到最合适的核心做处理,藉此发挥最佳效能与节能效果,有助打造下世代行动装置。

兼顾晶片效能与功耗 big.LITTLE架构崛起

对于未来任何一种处理器,处理速度都将受限于散热问题而无法大幅跃进。任何装置一旦达到热障(Thermal Barrier)就会开始融化,如果是行动电话,便会使装置温度上升造成使用者不适。除物理层面的散热问题外,能源效率也会变得相当差,若调校处理器实作使其速度加快,则所需耗能便会倍数增长,而为增加最后这一丁点的效能,后续导热设计的成本真的很高。

在过去,处理器核心面积倍增代表速度倍增,但是现在面积倍增,速度却只增加几个百分点,因此复杂度并不代表有效率,这就是单一核心系统有所限制的原因之一。如果无法加快单一核心速度,就必须增加独立核心的数量,这也有助于每个核心去应对其被分配到的任务需求,有鉴于此,安谋国际(ARM)遂于2012年提出big.LITTLE处理器架构(图1)。

图1 big.LITTLE系统结构示意图

big.LITTLE主要目的在于解决IC设计业界眼前最大挑战,也就是同时提升晶片效能、并延长装置续航力,以延伸消费者的行动体验。该技术之所以能达成上述目标,系结合一个大(big)的高效能处理器核心与一个小(LITTLE)的低功耗处理器核心,然后根据效能需求,以无缝连接方式选择合适的处理器。更重要的是,这种动态分配任务的动作,对于上层应用软体或中介软体在处理器上的执行丝毫没有任何影响。


因应任务需求 处理器核心无缝切换

big.LITTLE系统结构就快取记忆体一致性(Cache Coherency)的维护而言,无论是同一处理器丛集中的快取记忆体,或是跨不同处理器丛集的快取记忆体,皆保持快取记忆体资料的一致性。这种跨丛集的一致性来自ARM CoreLink快取同调汇流架构(CCI-400,也能提供ARM Mali-T604之类的绘图处理器(GPU)系统等元件的I/O一致性)。

切换模式是让不同处理器类型在切换时能进行软体内容的撷取与回覆。以CPU切换来说,丛集中每个CPU在另一个丛集中都有对应的CPU,而软体内容则以CPU为单位,随机在不同的丛集间切换;如果丛集中没有正在运转的CPU,便可关闭整个丛集及相关的L2快取。

同时,此模式也是动态电压频率调整(DVFS)等能源/效能管理技术的延伸。切换动作类似DVFS操作点的转换,由于处理器上DVFS曲线的操作点,会随负载变化不同而来回变动,当既有的处理器(或丛集)已达到最高操作点,而软体堆叠仍需更高效能,处理器切换动作就会发生,改由另一个处理器执行工作,这个处理器的操作点也会随着负载变化不同而来回变动(图2)。当效能需求不再,可换回之前的处理器(或丛集)。

图2 big.LITTLE切换模式DVFS曲线图

显而易见,一致性是达到加速切换所需时间的关键所在,因为它能让已经储存在离埠处理器(Outbound Processor)的状态,在入埠处理器(Inbound Processor)上窥探与回覆,而不必透过主记忆体的存取。

此外,由于离埠处理器的L2有快取一致性的功能,当任务切换时,可以透过窥探资料值的方式,改善入埠处理器的快取暖机时间,此时L2快取记忆体仍然可以维持供电状态;不过,因为离埠处理器的L2快取无法提供新资料的快取配置,最后还是必须清除并关闭电源以节省耗电(图3)。

图3 big.LITTLE运算任务切换流程图


由于LITTLE处理器丛集中,每个处理器都将对应一个big丛集的处理器,因此CPU乃成对配置(Cortex-A15及Cortex-A7处理器上都有CPU0,Cortex-A15及Cortex-A7处理器上都有CPU1,以此类推),不论何时每个配对中只有一个处理器可运转;而系统则会主动侦测各处理器负载,在高负载时将内容执行移到大核心(图4)。当负载从离埠核心移到入埠核心,便会关闭其中一个核心,这种模式让big与LITTLE核心组合能随时运转。

图4 big.LITTLE切换模式DVFS示意图

布局下世代big.LITTLE ARM加速推出新核心

随着big.LITTLE技术演进,ARM近期更发布两款具有big.LITTLE处理性能的新型CPU核心--Cortex-A57及Cortex-A53处理器。Cortex-A57是经过效能优化的big核心,每时脉周期的效能较Cortex-A15增加25%,频率效能与能源效率也都高于Cortex-A15处理器。Cortex-A53则为LITTLE核心,每时脉周期效能增加40%,能源效率则等同于Cortex-A7。

这些新核心在架构上都完全相同,并支援ARMv8架构,因此能导入进阶版的NEON技术与浮点功能、加密加速并支援64位元。除AMBA4 ACE之外,两种核心也都支援新世代快取一致汇流架构,且跟现有ARMv7架构的CPU核心一样,能在AArch32模式下执行既有程式码。支援64位元及额外一般用途暂存器的应用方式洗炼而有效率,且能耗增加不多。

未来,big.LITTLE设计将为行动装置系统功耗及效能控制点的极度宽动态(Wide Dynamic Range)带来全新的可能性,这是单一类型处理器核心所无法达到的。目前市面上装置的工作量往往混杂程度高低不同需求的执行绪,这种宽动态便可为其提供完美的执行环境,提供一个在新世代行动平台下,提升装置运算效能并延长续航力的大好机会。


『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
芯片产能不足影响向三星供货.高通将优先保证高端 SoC 生产