×
嵌入式 > 技术百科 > 详情

释放嵌入式控制器中的CPU资源

发布时间:2020-06-16 发布时间:
|
本文介绍了一种采用PLD和数据通路(datapath)来解放微控制器系统中CPU任务的方案。在大多数微控制器结构中,智能的CPU身边总会环绕着一系列不可编程的外设。外设的功能有限,通常它们只负责数据形式的转换。例如,I2C外设只是实现串行和并行数据格式之间的转换,而ADC则实现模拟到数字信号的转换。CPU因此不得不完成所有的数据处理工作,实际上它还能做些更有用的事情。此外,管理外设将会导致CPU固件异常复杂,并可能需要一个快速高效的CPU在实时的时序限制下执行这些固件。这又会导致更多的潜在程序漏洞,从而需要使用更复杂和昂贵的调试设备等。
 
但是如果外设具备足够的复杂度、灵活度与智能,是否能有效地减轻CPU的许多任务呢?复杂的设计可以通过结构重建,变为一组分布在CPU和外设中间的简单设计。CPU将可以执行更少的任务,或进行更少的中断处理,从而使程序漏洞更容易被发现和修正。整体设计将使系统具有更好的稳定性,并且便于复用部分设计。CPU处理任务减少就可以运行在较低的速度,从而降低功耗,或者这些额外可用带宽可用来实现市场部规划的下一代产品。然而,外设设计仍需具成本效益,否则整个微控制器可能变得太贵。本文将展示如何把智能、灵活、低成本、可定制的数字外围设备设计到微控制器并配置,以帮助实现稳定的分布式系统设计。
 
智能逻辑选择—PLD还是数据通路?
 
通常有两种方法构建一个智能的可配置外设。首先是使用PLD。如图1所示,PLD有一个驱动若干宏单元的积和(sum of products)逻辑门阵列。“T”和“C”符号表示每一个乘积项都能产生一个真值或补数(反向)输出,这样无论是正、负逻辑都可以支持。
 
图1:一个PLD实例(包括12个输出项、8个乘积项、4个宏单元)。
 
图1显示了一个简单的PLD例子。PLD可以有成百上千的宏单元,每个宏单元最高由16个乘积项驱动。乘积项里的与门和或门可以互联形成高度灵活的定制逻辑功能。宏单元是典型的时钟架构,它们的输出可以反馈到乘积项阵列,因此允许创建状态机。
 
大规模PLD可以用来形成复杂的逻辑功能,甚至是完全的CPU,因此PLD当然可以用来实现智能数字外设。然而,很多门可能只是实现诸如计数器或加法器等简单的逻辑功能,但对于更复杂功能的实现,基于PLD的方案就会变得很贵。从某种程度上说,使用真正的CPU会更合理。
 
CPU的一个非常简单的形式是基于算术逻辑单元(ALU)的数据通路,也称为纳米处理器(nano-processor)。数据通路只是实现几个常用函数,但会比使用PLD实现的效率更高。图2:显示了一个基于ALU的简单的数据通路。典型的ALU可以进行各种操作,通常是8位操作:向上计数(递增)、向下计数(递减)、加、减、逻辑与、逻辑或、逻辑异或,左位移、右位移。这里有两个8位累加器,它们能够为ALU输出充当输入数据寄存器或存储器。一个输入时钟信号沿产生一次操作。函数选择寄存器用来控制:
 
图2:基于ALU的数据通路。
 
* 产生什么操作。
 
* 该操作的源寄存器。
 
* 输出的目的寄存器。
 
根据数据通路的具体设计,其可能会做一系列复杂操作,如表1显示。
 
 
表1:数据通路函数的实现举例。
这个函数选择模块实际上可以是一个小容量的SRAM,预加载所需的函数选择位,SRAM的地址线可以用来选择运行哪个操作。最后,多数据通路可以用进位和移位信号链在一起,以便可以进行多字节操作数。
 
由于数据通路只有少数特定功能函数,很容易优化设计,因此其创建成本较低。然而,对于实现复杂的逻辑,数据通路远远没有PLD那么灵活。那么,对于创建智能、灵活、低成本的数字外设来说,哪一种方法是更好的呢?是PLD还是数据通路?答案是,将两者相结合。下面是一个实例,来看看是如何实现的。
 
通用数字模块
 
同时使用PLD和数据通路的系统实例是赛普拉斯半导体的PSoC3和PSoC5芯片。每个系统包含最高24个通用数字逻辑子系统,称为通用数字模块(UDB),其结构如图3所示。一个UDB包含两个图1所示的PLD,一个数据通路以及状态机和控制寄存器。有两个链路路径,一个用于PLD,一个用于数据通路。由一个路由通道来连接各UDB子块之间以及UDB之间的信号。PLD配置、数据通路和路由通过写入UDB配置寄存器来实现。
 
 
UDB的PLD设计在图1中进行了描述。如图4,UDB数据通路类似于图2所示的基本的数据通路,但是它更精密复杂,因为拥有更多寄存器和更多的功能。
 
图4:UDB数据通路框图。
 
* 8位ALU可以实现所有的七个基本函数—递增、递减、加、减、与、或以及异或,并且它有单独的位移和位掩码模块来进行ALU结果后处理(8位ALU传输功能只需通过ALU传送一个值到位移和位掩码模块)。位移模块可以做左位移、右位移、半字节交换和传输。掩码模块可以和单独的掩码寄存器里的内容逐位相与(图中未显示)。[page]
 
* 操作可以使用两个累加器(A0,A1)和两个数据寄存器(D0,D1)来完成。两个FIFO寄存器(F0、F1)可用来在数据通路和CPU之间传输数据。FIFO深度可达4字节。这一结构可以使多任务处理变得简单;在不同的时间,独立操作可以在寄存器子集完成。例如,A0、D0、F0可以用于一个任务,而A1、D1、F1则可用于不同的任务。
 
* 广泛的状态条件(例如:比较、零检测、所有个体检测、溢出检测)可以应用到累加器,数据寄存器,以及路由到器件其它地方。
 
灵活的路由
 
虽然UDB在PLD和数据通路两个子系统都有很多特色,但广泛的数字路由让它们如虎添翼。信号可以在PLD和数据通路之间路由,遍及整个UDB和器件的其它地方,形成了复杂的数字系统互连(DSI)结构。
 
实例
 
本例中,用一个UDB数据通路来创建一个带重载(reload)功能的8位数字计数器。为了实现这点,连接一个状态条件回到控制存贮SRAM地址线,如图5所示。
 
图5:用UDB数据通路创建带重载功能的计数器。
 
在这个设计中,A0是计数寄存器,D0是重载寄存器。需要两个函数,一个用来递减计数,一个从周期寄存器重载计数器;这些函数在控制储存RAM里预载了。
 
逻辑如下:当A0不为0时,状态输出将会变低,在地址0会执行递减操作。当A0为0时,状态输出将为高,在地址1会执行重载操作。
 
所有操作都发生在时钟输入的上升沿,可以记录时钟沿数量。时钟输入可以来自各种时钟源。状态输出可以通过DSI路由,包括到DMA和中断请求输入。使用数据通路链和掩码模块,该计数器的大小可以是任何位数,不受限于8的倍数。
 
图5所示为减法计数器。它可以很容易的转换成加法计数器,可以通过使用不同的状态输出(A0= =D0)和控制存储SRAM里的不同函数:A0=A0+1和A0=A0A0。异或任何值的结果永远为0。
 
通过使用PLD这个简单的设计可以创造更复杂的应用。以一个红绿灯控制器为例,红绿灯控制器周期由绿、黄、红三种状态构成,因此需要一个状态机。每个状态变化到下一个状态之前会持续一定时间,所以必需有一个计数器。为了简单起见,假设“绿灯”时间和“红灯”是相同,但“黄灯”时间不同。
 
只需要使用3个数据通路寄存器(假设为8位计数值)就可以实现这个时序结构。A0为计数寄存器,D0为“绿”和“红”状态保持计数器重载值,D1为“黄”状态保持计数器重载值。模块框图如图6显示。
 
图6:采用UDB PLD和数据通路构建的红绿灯控制器框图
 
要保存在控制存储RAM里的操作是:
 
A0 = A0 - 1 // 计数
 
A0 = D0 // 重载“绿”或“红”
 
// 计数值
 
A0 = D1 //重载“黄”值
 
状态机在PLD里实现。数据通路条件输出反馈到PLD,以表明需要改变状态了。PLD也有这样的逻辑,根据当前的状态和从数据通路反馈的信号,控制执行哪个数据通路操作和哪个灯要点亮。
 
超越基础
 
红绿灯控制器是一种简单的应用类型,通常使用CPU编程。然而,我们已经看到,除了初始化代码,这个功能可以完全和CPU没关系而可以由智能的可配置外设完成。这个功能可以很容易地扩展以支持附加需求,例如转换信号、行人行走信号、车辆检测传感器、流量/紧急事件转发器。
 
CPU需要做什么
 
通过使用PLD和数据通路的有效组合,可以创建智能的、灵活的、低成本的外设,以减轻CPU的负担。然而,如果这么多的功能都由外设处理了,那还留着CPU做什么呢?在许多情况下,CPU不需要做很多事,在某些情况下系统初始化后,CPU就可以关掉了。不过,更实用的方案是使用CPU做CPU能做得最好的事情,例如:
 
* 复杂的计算
 
* 字符串和文本处理
 
* 数据库管理
 
* 通信管理
 
* 系统管理
 
例如,在我们的红绿灯应用中,CPU可以用于以下几个方面:
 
* 检测车辆闯红灯
 
* 使用相机拍摄牌照
 
* 从照片上提取车牌文字信息
 
* 从国家数据库中查阅车主信息,以及向车主发送罚单
 
通过由智能外设完成很多任务,CPU可以轻松地去做更有价值的任务。



『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
Semtech的LoRa技术携手Chipsafer将牧场连接至云端