×
单片机 > 单片机程序设计 > 详情

arm单片机的内核结构

发布时间:2022-07-04 发布时间:
|

ARM芯片的核心,即CPU内核(ARM720T)由一个ARMTTDMI 32位RISC处理器、一个单一的高速缓冲8KB Cache和一个存储空间管理单元(MMU)所构成。8KB的高速缓冲有一个四路相连寄存器,并被组织成52线四字(4×52×4字节)。高速缓冲直接与ARMTTDMI相连,因而高速缓冲来自CPU的虚拟地址。当所需的虚拟地址不在高速缓冲中时,由MMU将虚拟地址转换为物理地址。一个64项的转换旁路缓冲器(TLB)用来加速地址转换过程,并减少页表读取所需的总线传送。通过转换高速缓冲中未存储的地址,MMU就能够节约功率。通过内部数据总线和扩展并行总线,ARM可以和存储器(SRAM/Flash/Nand-Flash等)、用户接口(LCD控制器/键盘/GPIO等)、串行口(UARTs/红外IrDA等)相连。


一个ARM720T内核基本由以下四部分组成:


(1)ARMTTDMI CPU核。该CPU核支持Thumb指令集、核调试、增强的乘法器、JTAG以及嵌入式ICE。它的时钟频率可编程为18MHz、36MHz、49MHz、74MHz。


(2)存储空间管理单元(MMU)与ARM710核兼容,并增加了对Windows CE的支持。该存储空间管理单元提供了地址转换和一个有64项的转换旁路缓冲器。


(3)8KB单一指令和数据高速缓冲存储器以及一个四路相联高速缓冲存储器控制器。


(4)写缓冲器Write Buffer。


ARM内核


ARM7 系列


ARM7TDMI是ARM7系列中使用最广泛的,它是从最早实现32位地址空间编程模式的ARM6内核发展而来的,并增加了64位乘法指令,支持片上调试、16位Thumb指令集和EmbeddedICE观察点硬件。ARM7TDMI属于ARM v4体系结构,采用冯诺伊曼结构,3级流水处理,平均0.9DMIPs/Mhz性能。不过ARM7TDMI没有MMU(Memory Management Unit)和Cache,所以仅支持那些不需要MMU和Cahce的小型实时操作系统,如VxWorks、uC/OS-II和uLinux等RTOS。其他的ARM7系列内核还有ARM720T和ARM7E-S等。


ARM9 系列


ARM9TDMI相比ARM7TDMI,将流水级数提高到5级从而增加了处理器的时钟频率,并使用指令和数据存储器分开的哈佛结构以改善CPI和提高处理器性能,平均可达1.1DMIPs/Mhz,但是ARM9TDMI仍属于ARM v4T体系结构。在ARM9TDMI基础上又有ARM920T、ARM940T和ARM922T,其中ARM940T增加了MPU(Memory Protect Unit)和Cache;ARM920T和ARM922T加入了MMU、Cache和ETM9(方便进行CPU实时trace),从而更好的支持象Linux和WinCE这样的多线程、多任务操作系统。


ARM9E 系列


ARM9E系列属于ARM v5TE,在ARM9TDMI的基础上增加了DSP扩展指令,是可综合内核,主要有ARM968E-S、ARM966E-S、ARM946E-S和ARM926EJ-S(v5TEJ指令体系,增加了Java指令扩展),其中ARM926EJ-S是最具代表性的。通过DSP和Java的指令扩展,可获得70%的DSP处理能力和8x的Java处理性能提升。另外分开的指令和数据Cache结构进一步提升了软件性能;指令和数据TCM(Tightly Couple Memory:紧耦合存储器)接口支持零等待访问存储器;双AMBA AHB总线接口等。ARM926EJ-S可达250Mhz以上的处理速度,很好地支持Symbian OS、Linux、Windows CE和Palm OS等主流操作系统。


ARM11 系列


ARM11系列主要有ARM1136、ARM1156、ARM1176和ARM11 MP-Core等,它们都是v6体系结构,相比v5系列增加了SIMD多媒体指令,获得1.75x多媒体处理能力的提升。另外,除了ARM1136外,其他的处理器都支持AMBA3.0-AXI总线。ARM11系列内核最高的处理速度可达500Mhz以上(其中90nm工艺下,ARM1176可达到750Mhz)以及600DMIPS的性能,请参考和图3相关描述。


基于ARMv6架构的ARM11系列处理器是根据下一代的消费类电子、无线设备、网络应用和汽车电子产品等需求而制定的。其的媒体处理能力和低功耗特点使它特别适合于无线和消费类电子产品;其高数据吞吐量和高性能的结合非常适合网络处理应用;另外,在实时性能和浮点处理等方面ARM11可以满足汽车电子应用的需求。


ARM Cotex 系列


Cortex系列是ARM公司目前最新内核系列,属于v7架构,主要有Cortex-A8、Cortex-R4、Cortex-M3和


Cortex-M1等处理器,其中A8是面向高性能的应用处理器,最高可达1Ghz的处理速度,更好的支持多媒体及其他高性能要求,最高可达2000DMIPS;R4主要面向嵌入式实时应用领域(Real-Time),7级流水结构,相对于上代ARM1156内核,R4在性能、功耗和面积(PPA:Performance,Power and Area)取得更好的平衡,>1.5DMIPS/Mhz和高于400Mhz的处理速度。而M3主要是面向低成本和高性能的MCU应用领域,相比ARM7TDMI,M3面积更小,功耗更低,性能更高。Cortex-M3处理器的核心是基于哈佛架构的3级流水线内核,该内核集成了分支预测,单周期乘法,硬件除法等众多功能强大的特性,使其在Dhrystone benchmark上具有出色的表现(1.25 DMIPS/MHz)。根据Dhrystone benchmark的测评结果,采用新的Thumb.-2指令集架构的Cortex-M3处理器,与执行Thumb指令的ARM7TDMI-S.处理器相比,每兆赫的效率提高了70%,与执行ARM指令的ARM7TDMI-S处理器相比,效率提高了35%。



『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
qemu+chroot构建arm aarch64虚拟机