DSP和MCU的区别和联系-Shenzhen RiT Electronics limited

一、区别

两则的分流造成的主要原因是数字信号处理的简便性，考虑一个数字信号处理的实例，比如有限冲击响应滤波器（FIR）。用数学语言来说，FIR滤波器是做一系列的点积。取一个输入量和一个序数向量，在系数和输入样本的滑动窗口间作乘法，然后将所有的乘积加起来，形成一个输出样本。

类似的运算在数字信号处理过程中大量的重复发生，使得为此设计的器件必须提供专门的支持，促进了DSP器件与通用处理器（GPP）的分流：

1. 对密集乘法的支持

2. 存储器结构

此外，DSP处理器几乎都不具备数据的高速缓存。这是因为DSP的典型数据是数据流。也就是说，DSP处理器对每个数据样本做计算后，就丢弃，几乎不再重复使用。

3. 零开销循环
DSP算法的一个共同的特点，即大多数处理时间都花在执行较小的循环上，也就容易理解，为什么大多数的DSP都有专门的硬件，用于零开销循环。所谓的零开销循环是指处理器在执行循环时，不用花时间去检查循环计数器的值，条件转移到循环大额顶部，将循环计数器减1.

与此相反，GPP的循环使用软件来实现。某些高性能的GPP使用转移预报硬件，几乎达到与硬件支持零开销循环同样地效果。

二、联系

按照传统方式，嵌入式应用中的数字信号处理器（dsp）相对于主微控制器起到从属的作用。在这些应用中，MCU用作系统控制器，而大量的数据处理留给DSP。例如，在音频或视频处理器应用中有可能需要人机界面管理，或则是整个系统的控制。

为完成这些任务，有几种系统设计方案选择。
第一种方案是将DSP和MCU芯片组合在印制电路板上。这种方案成本高并且占用面积大，但是可适当地调整每个芯片的尺寸以最大限度的满足系统需要。

第二种方案是将DSP功能合并到一个MCU中。这种方案只适合于直接的信号处理应用。MCU的时钟频率和计算体系结构根本上不太适合大量的数字处理。有些ＭＣＵ试图通过增加一个乘法和累加器（ＭＡＣ）（ｄｓｐ的一个特点）来补偿上述不足。但是这种方案任然缺乏高级应用所需要的基本的“由上至下”的体系结构设计。

第三种方案是一种将ｄｓｐ和ｍｃｕ组合在单个封装内的多芯片模块（ｍｃｍ）．这种方案的局限性是，设计工程师必须按“５０／５０”的时间比例分配给控制和DSP功能；例如，一旦DSP超出时间，MCU不能完成计算任务。像第一种方案选择一样，当DSP和MCU内核独立存在的时候，需要两套开发工具。

已经出现第四种方案它是将MCU的功能合并到一个DSP中。这类方案的一个例子是美国模拟器件公司（Anolog Device Inc.,简称ADI）的Blackfin 处理器系列。这些新型处理器具有统一的经过优化的体系结构，不仅适于数据计算，而且也适于有关的控制任务。通过平衡执行控制任务与复杂计算的要求，这种方案可以根据系统实时处理的需要，完成100%的控制或者100%的计算任务。完成所有这一切任务不需要在DSP模式和MCU模式之间的模式转换。

DSPMCU
首先让我们回顾一下DSP和MCU的典型功能。DSP主要是在一单个时钟周期内尽可能完成多个MAC（乘法和累加）操作。为了这一点，指令的操作代码通常是可变的超长的指令字（VLIW）。DSP也适于工作在紧密、高效的环路中。另外，为了达到性能指标通常需要编写优化的汇编代码。由于DSP的算法程序一般装在小容量、短等待时间的内置存储器中，所以代码密度通常不是大问题。像DSP主要用于完成计算一样，MCU主要用于完成控制功能。同样地，典型的MCU应用包括许多条件操作，在程序流程中频繁地跳转。通常使用C或者C＋＋语言编写程序。代码密度极为重要，并且根据编译代码的长度来评估算法。存储器系统是基于高速缓存从而允许该系统设计工程师用较长等待时间从较大的存储器中调用较大程序。利用基于高速缓存系统，程序员不需要考虑如何以及何时将指令输入到内核去执行。

统一的DSP和MCU兼备两者的优点。它的指令集由16 bit，32 bit和64 bit操作码组成，但是由于最常用的指令采用16 bit编码，所以编译代码密度大小与那些流行的MCU相同。另外，它包括一个存储器保护功能以及指令高速缓存和数据高速缓存，作为整个存储器管理单元（MMU）的一部分。此外，容易提供一套完整的C/C＋＋开发工具，提供可选汇编语言或者全部汇编语言适合算法优化的编程。

RTOS
系统控制的一个重要方面是任务管理。实时操作系统（RTOS）逐渐地用于控制复杂系统中多种正在进行的和同时发生的任务。通过提供对任务调度与管理的支持，RTOS简化了编程模式，这通常是由MCU控制的，由于普通的DSP不具备支持RTOS需要的所有功能以便有效地控制。

然而，统一的DSP和MCU促进了RTOS几个重要功能的发展。第一个是限制访问功能以保护或者保留存储单元。第二个是配备单独的堆栈和帧指针以减少操作系统（OS）请求以及中断和异常处理所需的等待时间。第三个是具备单独的用户操作模式和管理员操作模式。过去，DSP按照等效于管理员操作模式工作，从而允许在任何时间完全访问所有的系统资源。然而MCU提供类似的在用户操作模式，它允许在OS的顶层运行应用软件。现在，在一个统一的体系结构下提供两种操作模式，因为增强的DSP系统能够限制用户应用软件仅通过OS访问系统资源。

MCU的一个优点是包含使用灵活和种类齐全的外围设备。作为通用的嵌入式控制器，它们通常具备可编程输入输出（I/O）标志、定时器、串行接口和日益增加越来越复杂的标准接口。MCU外围设备的主要作用是嵌入式控制，而不是大量计算。例如，一个实时时钟信号可以唤醒一只温度传感器用以采集环境温度并且将一个延迟的信息通过I/O引脚反馈到MCU。然后，一个定时器的脉冲宽度调制（PWM）输出相应地能够增加或者减小风扇电机的转速。像MCU一样，统一的DSP和MCU具备一套系统控制外围设备（例如，实时时钟、多功能定时器、监视定时器、双向标志位引脚）。然而，它还包括一些高速接口（例如，PCI、异步或者同步存储器控制器、USB、并行视频接口）以便通过这些接口，与许多DMA通道配合快速搬移数据，从而有助于有效利用高速DSP内核的信号处理能力。

功耗控制一直是嵌入式控制器的一项功能。但是，当系统要求DSP具有优良的性能时，对其电源的选择就不太理想。如果将独立的MCU和DSP芯片应用于电源敏感的场合，通常必须为每个芯片提供一个单独的开关稳压器，因为这两个器件的内核电压经常不一致。这会导致降低电源变换效率和增加设计器件的引脚数目，最终增加布线的复杂程度和解决方案的成本。此外，当MCU和DSP的内核集成到一个芯片上时，电源解决方案本质上不是最佳的，因为它必须满足2个完全独立并具有不同负载特性处理器的需求。将这种情况与统一的DSP和MCU相比较，它包含一个集成动态电源管理（DPM）控制器。由于它是只有一个处理器的体系结构，所以该控制器能够完全适合给定应用的需求。它提供几种固有的电源模式以支持多种系统性能等级。另外，对于未使用的时钟和L2存储器可选择性地禁止。该PLL的频率可在一个宽范围（通常1倍～31倍）进行调节，以满足在DSP和MCU内部多层次的处理需求。最后能够调节电压（外部或者通过一个集成的开关控制器）以提供指数式的节省功耗。由于系统成本、开发容易、器件采购和升级能力的原因，设计工程师正趋向采用一种单芯片解决方案用于嵌入式信号处理解决方案。这种单芯片解决方案必须能够同样好地完成DSP和MCU的功能，所以有必要提出一种统一的处理器体系结构。面对MCU的挑战，比较简单的解决方案是将MCU的功能合并到一个高性能的DSP内核，而不是与此相反。当今一个统一的DSP和MCU平台（由BlackfinDSP系列产品说明）已经投放市场，它将在MCU和DSP目前应用领域提供许多应用。

引用https://mbb.eet-china.com/tech/t11/33207.html