这些小活动你都参加了吗?快来围观一下吧!>>
电子产品世界 » 论坛首页 » 嵌入式开发 » FPGA » [经验分享] 做DSP开发最应当懂的34个问题

共2条 1/1 1 跳转至

[经验分享] 做DSP开发最应当懂的34个问题

助工
2015-01-28 14:55:31     打赏
做DSP开发最应当懂的34个问题

一.什么是DSP?(缺省)
二.DSP的C语言同主机C语言的主要区别?
1)DSP的C语言是标准的ANSI 
C,它不包括同外设联系的扩展部分,如屏幕绘图等。但在CCS中,为了方便调试,可以将数据通过prinf命令虚拟输出到主机的屏幕上。 
2)DSP的C语言的编译过程为,C编译为ASM,再由ASM编译为OBJ。因此C和ASM的对应关系非常明确,非常便于人工优化。 
3)DSP的代码需要绝对定位;主机的C的代码有操作系统定位。 
4)DSP的C的效率较高,非常适合于嵌入系统。 
三.DSP发展动态
1.TMS320C2000 
TMS320C2000系列包括C24x和C28x系列。C24x系列建议使用LF24xx系列替代C24x系列,LF24xx系列的价格比C24x便宜,性能高于C24x,而且LF24xxA具有加密功能。 
C28x系列主要用于大存储设备管理,高性能的控制场合。 
2.TMS320C3x 
TMS320C3x系列包括C3x和VC33,主要推荐使用VC33。C3x系列是TI浮点DSP的基础,不可能停产,但价格不会进一步下调。 
3.TMS320C5x TMS320C5x系列已不推荐使用,建议使用C24x或C5000系列替代。 
4.TMS320C5000 TMS320C5000系列包括C54x和C55x系列。 
其中VC54xx还不断有新的器件出现,如:TMS320VC5471(DSP+ARM7)。 
C55x系列是TI的第三代DSP,功耗为VC54xx的1/6,性能为VC54xx的5倍,是一个正在发展的系列。 
C5000系列是目前TI DSP的主流DSP,它涵盖了从低档到中高档的应用领域,目前也是用户最多的系列。 
5.TMS320C6000 TMS320C6000系列包括C62xx、C67xx和C64xx。此系列是TI的高档DSP系列。 
其中C62xx系列是定点的DSP,系列芯片种类较丰富,是主要的应用系列。 
C67xx系列是浮点的DSP,用于需要高速浮点处理的领域。 C64xx系列是新发展,性能是C62xx的10倍。 
6.OMAP系列 
是TI专门用于多媒体领域的芯片,它是C55+ARM9,性能卓越,非常适合于手持设备、Internet终端等多媒体应用。
四.5V/3.3V如何混接?
TI 
DSP的发展同集成电路的发展一样,新的DSP都是3.3V的,但目前还有许多外围电路是5V的,因此在DSP系统中,经常有5V和3.3V的DSP混接问题。在这些系统中,应注意: 
1)DSP输出给5V的电路(如D/A),无需加任何缓冲电路,可以直接连接。 
2)DSP输入5V的信号(如A/D),由于输入信号的电压>4V,超过了DSP的电源电压,DSP的外部信号没有保护电路,需要加缓冲,如74LVC245等,将5V信号变换成3.3V的信号。 
3)仿真器的JTAG口的信号也必须为3.3V,否则有可能损坏DSP。 
五.为什么要片内RAM大的DSP效率高?
目前DSP发展的片内存储器RAM越来越大,要设计高效的DSP系统,就应该选择片内RAM较大的DSP。片内RAM同片外存储器相比,有以下优点: 
1)片内RAM的速度较快,可以保证DSP无等待运行。 
2)对于C2000/C3x/C5000系列,部分片内存储器可以在一个指令周期内访问两次,使得指令可以更加高效。 
3)片内RAM运行稳定,不受外部的干扰影响,也不会干扰外部。 
4)DSP片内多总线,在访问片内RAM时,不会影响其它总线的访问,效率较高。
六.为什么DSP从5V发展成3.3V?
超大规模集成电路的发展从1um,发展到目前的0.1um,芯片的电源电压也随之降低,功耗也随之降低。DSP也同样从5V发展到目前的3.3V,核心电压发展到1V。目前主流的DSP的外围均已发展为3.3V,5V的DSP的价格和功耗都价格,以逐渐被3.3V的DSP取代。 
字串1

七如何选择DSP的电源芯片?
TMS320LF24xx:TPS7333QD,5V变3.3V,最大500mA。 
TMS320VC33: TPS73HD318PWP,5V变3.3V和1.8V,最大750mA。 
TMS320VC54xx:TPS73HD318PWP,5V变3.3V和1.8V,最大750mA; 
TPS73HD301PWP,5V变3.3V和可调,最大750mA。 
TMS320VC55xx:TPS73HD301PWP,5V变3.3V和可调,最大750mA。 
TMS320C6000: PT6931,TPS56000,最大3A。 
八.软件等待的如何使用?
DSP的指令周期较快,访问慢速存储器或外设时需加入等待。等待分硬件等待和软件等待,每一个系列的等待不完全相同。 
1)对于C2000系列: 硬件等待信号为READY,高电平时不等待。 
软件等待由WSGR寄存器决定,可以加入最多7个等待。其中程序存储器和数据存储器及I/O可以分别设置。 
2)对于C3x系列: 硬件等待信号为/RDY,低电平是不等待。 
软件等待由总线控制寄存器中的SWW和WTCNY决定,可以加入最多7个等待,但等待是不分段的,除了片内之外全空间有效。 
3)对于C5000系列: 硬件等待信号为READY,高电平时不等待。 
软件等待由SWWCR和SWWSR寄存器决定,可以加入最多14个等待。其中程序存储器、控制程序存储器和数据存储器及I/O可以分别设置。 
4)对于C6000系列(只限于非同步存储器或外设): 硬件等待信号为ARDY,高电平时不等待。 
软件等待由外部存储器接口控制寄存器决定,总线访问外部存储器或设备的时序可以设置,可以方便的同异步的存储器或外设接口。 
九.中断向量为什么要重定位?
为了方便DSP存储器的配置,一般DSP的中断向量可以重新定位,即可以通过设置寄存器放在存储器空间的任何地方。 
注意:C2000的中断向量不能重定位。 
十.DSP的最高主频能从芯片型号中获得吗?
TI的DSP最高主频可以从芯片的型号中获得,但每一个系列不一定相同。 
1)TMS320C2000系列: 
TMS320F206-最高主频20MHz。 
TMS320C203/C206-最高主频40MHz。 
TMS320F24x-最高主频20MHz。 
TMS320LF24xx-最高主频30MHz。 
TMS320LF24xxA-最高主频40MHz。 
TMS320LF28xx-最高主频150MHz。 
2)TMS320C3x系列: 
TMS320C30:最高主频25MHz。 
TMS320C31PQL80:最高主频40MHz。 
TMS320C32PCM60:最高主频30MHz。 
TMS320VC33PGE150:最高主频75MHz。 
3)TMS320C5000系列: 
TMS320VC54xx:最高主频160MHz。 
TMS320VC55xx:最高主频300MHz。 
4)TMS320C6000系列: 
TMS320C62xx:最高主频300MHz。 
TMS320C67xx:最高主频230MHz。 

TMS320C64xx:最高主频720MHz。

十一.DSP可以降频使用吗?
可以,DSP的主频均有一定的工作范围,因此DSP均可以降频使用。 字串5 
十二.如何选择外部时钟?
DSP的内部指令周期较高,外部晶振的主频不够,因此DSP大多数片内均有PLL。但每个系列不尽相同。 
1)TMS320C2000系列: 
TMS320C20x:PLL可以÷2,×1,×2和×4,因此外部时钟可以为5MHz-40MHz。 
TMS320F240:PLL可以÷2,×1,×1.5,×2,×2.5,×3,×4,×4.5,×5和×9,因此外部时钟可以为2.22MHz-40MHz。 
TMS320F241/C242/F243:PLL可以×4,因此外部时钟为5MHz。 
TMS320LF24xx:PLL可以由RC调节,因此外部时钟为4MHz-20MHz。 
TMS320LF24xxA:PLL可以由RC调节,因此外部时钟为4MHz-20MHz。 
2)TMS320C3x系列: 
TMS320C3x:没有PLL,因此外部主频为工作频率的2倍。 
TMS320VC33:PLL可以÷2,×1,×5,因此外部主频可以为12MHz-100MHz。 
3)TMS320C5000系列: 
TMS320VC54xx:PLL可以÷4,÷2,×1-32,因此外部主频可以为0.625MHz-50MHz。
TMS320VC55xx:PLL可以÷4,÷2,×1-32,因此外部主频可以为6.25MHz-300MHz。
4)TMS320C6000系列: 
TMS320C62xx:PLL可以×1,×4,×6,×7,×8,×9,×10和×11,因此外部主频可以为11.8MHz-300MHz。 
TMS320C67xx:PLL可以×1和×4,因此外部主频可以为12.5MHz-230MHz。 
TMS320C64xx:PLL可以×1,×6和×12,因此外部主频可以为30MHz-720MHz
十三.如何选择DSP的外部存储器?
DSP的速度较快,为了保证DSP的运行速度,外部存储器需要具有一定的速度,否则DSP访问外部存储器时需要加入等待周期。 
1)对于C2000系列: C2000系列只能同异步的存储器直接相接。 
C2000系列的DSP目前的最高速度为150MHz。建议可以用的存储器有: 
CY7C199-15:32K×8,15ns,5V; 
CY7C1021-12:64K×16,15ns,5V; CY7C1021V33-12:64K×16,15ns,3.3V。 
2)对于C3x系列: C3x系列只能同异步的存储器直接相接。 
C3x系列的DSP的最高速度,5V的为40MHz,3.3V的为75MHz,为保证DSP无等待运行,分别需要外部存储器的速度<25ns和<12ns。建议可以用的存储器有:
ROM: AM29F400-70:256K×16,70ns,5V,加入一个等待; 
AM29LV400-55(SST39VF400):256K×16,55ns,3.3V,加入两个等待(目前没有更快的Flash)。 
SRAM: CY7C199-15:32K×8,15ns,5V; 
CY7C1021-15:64K×16,15ns,5V; 
CY7C1009-15:128K×8,15ns,5V; 字串4 
CY7C1049-15:512K×8,15ns,5V; 
CY7C1021V33-15:64K×16,15ns,3.3V; 
CY7C1009V33-15:128K×8,15ns,3.3V; 
CY7C1041V33-15:256k×16,15ns,3.3V。 
3)对于C54x系列: C54x系列只能同异步的存储器直接相接。 
C54x系列的DSP的速度为100MHz或160MHz,为保证DSP无等待运行,需要外部存储器的速度<10ns或<6ns。建议可以用的存储器有: 
ROM: 
AM29LV400-55(SST39VF400):256K×16,55ns,3.3V,加入5或9个等待(目前没有更快的Flash)。 
SRAM: CY7C1021V33-12:64K×16,12ns,3.3V,加入一个等待; 
CY7C1009V33-12:128K×8,12ns,3.3V,加入一个等待。 
4)对于C55x和C6000系列: 
TI的DSP中只有C55x和C6000可以同同步的存储器相连,同步存储器可以保证系统的数据交换效率更高。 
ROM: AM29LV400-55(SST39VF400):256K×16,55ns,3.3V。 
SDRAM: HY57V651620BTC-10S:64M,10ns。 
SBSRAM: CY7C1329-133AC,64k×32; 
CY7C1339-133AC,128k×32。 
FIFO:CY7C42x5V-10ASC,32k/64k×18。 
十四.DSP芯片有多大的驱动能力?
DSP的驱动能力较强,可以不加驱动,连接8个以上标准TTL门。 
十五.调试TMS320C2000系列的常见问题?
1)单步可以运行,连续运行时总回0地址: Watchdog没有关,连续运行复位DSP回到0地址。 
2)OUT文件不能load到片内flash中: Flash不是RAM,不能用简单的写指令写入,需要专门的程序写入。CCS和C 
Source Debugger中的load命令,不能对flash写入。 OUT文件只能load到片内RAM,或片外RAM中。 
3)在flash中如何加入断点: 
在flash中可以用单步调试,也可以用硬件断点的方法在flash中加入断点,软件断点是不能加在ROM中的。硬件断点,设置存储器的地址,当访问该地址时产生中断。 
4)中断向量: 
C2000的中断向量不可重定位,因此中断向量必须放在0地址开始的flash内。在调试系统时,代码放在RAM中,中断向量也必须放在flash内。 

十六.调试TMS320C3x系列的常见问题?
1)TMS320C32的存储器配置: 
TMS320C32的程序存储器可以配置为16位或32位;数据存储器可以配置为8位、16位或32位。 
2)TMS320VC33的PLL控制: TMS320VC33的PLL控制端只能接1.8V,不能接3.3V或5V。 
十七.如何调试多片DSP?
对于有MPSD仿真口的DSP(TMS320C30/C31/C32),不能用一套仿真器同时调试,每次只能调试其中的一个DSP; 
对于有JTAG仿真口的DSP,可以将JTAG串接在一起,用一套仿真器同时调试多个DSP,每个DSP可以用不同的名字,在不同的窗口中调试。 
注意:如果在JTAG和DSP间加入驱动,一定要用快速的门电路,不能使用如LS的慢速门电路。 
十八.在DSP系统中为什么要使用CPLD?
DSP的速度较快,要求译码的速度也必须较快。利用小规模逻辑器件译码的方式,已不能满足DSP系统的要求。 
同时,DSP系统中也经常需要外部快速部件的配合,这些部件往往是专门的电路,有可编程器件实现。 
CPLD的时序严格,速度较快,可编程性好,非常适合于实现译码和专门电路。 
十九.DSP系统构成的常用芯片有哪些?
1)电源: TPS73HD3xx,TPS7333,TPS56100,PT64xx... 
2)Flash: AM29F400,AM29LV400,SST39VF400... 
3)SRAM: CY7C1021,CY7C1009,CY7C1049... 
4)FIF CY7C425,CY7C42x5... 
5)Dual port: CY7C136,CY7C133,CY7C1342... 
6)SBSRAM: CY7C1329,CY7C1339... 
7)SDRAM: HY57V651620BTC... 
8)CPLD: CY37000系列,CY38000系列,CY39000系列... 
9)PCI: PCI2040,CY7C09449... 
10)USB: AN21xx,CY7C68xxx... 
11)Codec:TLV320AIC23,TLV320AIC10... 
12)A/D,D/A:ADS7805,TLV2543... 

二十.什么是boot loader?
DSP的速度尽快,EPROM或flash的速度较慢,而DSP片内的RAM很快,片外的RAM也较快。为了使DSP充分发挥它的能力,必须将程序代码放在RAM中运行。为了方便的将代码从ROM中搬到RAM中,在不带flash的DSP中,TI在出厂时固化了一段程序,在上电后完成从ROM或外设将代码搬到用户指定的RAM中。此段程序称为"boot 
loader"。 
二十一.TMS320C3x如何boot?
在MC/MP管脚为高时,C3x进入boot状态。C3x的boot 
loader在reset时,判断外部中断管脚的电平。根据中断配置决定boot的方式为存储器加载还是串口加载,其中ROM的地址可以为三个中的一个,ROM可以为8位。 

二十二.Boot有问题如何解决?
1)仔细检查boot的控制字是否正确。 
2)仔细检查外部管脚设置是否正确。 
3)仔细检查hex文件是否转换正确。 
4)用仿真器跟踪boot过程,分析错误原因。 
二十三.DSP为什么要初始化?
DSP在RESET后,许多的寄存器的初值一般同用户的要求不一致,例如:等待寄存器,SP,中断定位寄存器等,需要通过初始化程序设置为用户要求的数值。 
初始化程序的主要作用: 1)设置寄存器初值。 2)建立中断向量表。 3)外围部件初始化。 
二十四.DSP有哪些数学库及其它应用软件? 
TI公司为了方便客户开发DSP,在它的网站上提供了许多程序的示例和应用程序,如MATH库,FFT,FIR/IIR等,可以在TI的网页免费下载。

二十五.如何获得DSP专用算法?
TI有许多的Third 
Party可以通过DSP上的多种算法软件。可以通过TI的网页搜索你所需的算法,找到通过算法的公司,同相应的公司联系。注意这些算法都是要付费的。
二十六.eXpressDSP是什么?
eXpressDSP是一种实时DSP软件技术,它是一种DSP编程的标准,利用它可以加快你开发DSP软件的速度。 
以往DSP软件的开发没有任何标准,不同的人写的程序一般无法连接在一起。DSP软件的调试工具也非常不方便。使得DSP软件的开发往往滞后于硬件的开发。 
eXpressDSP集成了CCS(Code Composer Studio)开发平台,DSP 
BIOS实时软件平台,DSP算法标准和第三方支持四部分。利用该技术,可以使你的软件调试,软件进程管理,软件的互通及算法的获得,都便的容易。这样就可以加快你的软件开发进程。 
1)CCS是eXpressDSP的基础,因此你必须首先拥有CCS软件。 
2)DSP BIOS是eXpressDSP的基本平台,你必须学会所有DSP BIOS。 
3)DSP算法标准可以保证你的程序可以方便的同其它利用eXpressDSP技术的程序连接在一起。同时也保证你的程序的延续性。 

二十七.为什么要用DSP?
3G技术和internate的发展,要求处理器的速度越来越高,体积越来越小,DSP的发展正好能满足这一发展的要求。因为,传统的其它处理器都有不同的缺陷。MCU的速度较慢;CPU体积较大,功耗较高;嵌入CPU的成本较高。 
DSP的发展,使得在许多速度要求较高,算法较复杂的场合,取代MCU或其它处理器,而成本有可能更低。 
二十八.如何选择DSP?
选择DSP可以根据以下几方面决定: 
1)速度: 
DSP速度一般用MIPS或FLOPS表示,即百万次/秒钟。根据您对处理速度的要求选择适合的器件。一般选择处理速度不要过高,速度高的DSP,系统实现也较困难。 
2)精度: 
DSP芯片分为定点、浮点处理器,对于运算精度要求很高的处理,可选择浮点处理器。定点处理器也可完成浮点运算,但精度和速度会有影响。 
3)寻址空间: 
不同系列DSP程序、数据、I/O空间大小不一,与普通MCU不同,DSP在一个指令周期内能完成多个操作,所以DSP的指令效率很高,程序空间一般不会有问题,关键是数据空间是否满足。数据空间的大小可以通过DMA的帮助,借助程序空间扩大。 
4)成本: 一般定点DSP的成本会比浮点DSP的要低,速度也较快。要获得低成本的DSP系统,尽量用定点算法,用定点DSP。 
5)实现方便: 浮点DSP的结构实现DSP系统较容易,不用考虑寻址空间的问题,指令对C语言支持的效率也较高。
6)内部部件:根据应用要求,选择具有特殊部件的DSP。如:C2000适合于电机控制;OMAP适合于多媒体等。 
二十九.DSP同MCU相比的特点?
1)DSP的速度比MCU快,主频较高。 
2)DSP适合于数据处理,数据处理的指令效率较高。 
3)DSP均为16位以上的处理器,不适合于低档的场合。 
4)DSP可以同时处理的事件较多,系统级成本有可能较低。 
5)DSP的灵活性较好,大多数算法都可以软件实现。 
6)DSP的集成度较高,可靠性较好。 
三十.DSP同嵌入CPU相比的特点?
1)DSP是单片机,构成系统简单。 2)DSP的速度快。 3)DSP的成本较低。 4)DSP的性能高,可以处理较多的任务。 
三十一.如何编写C2000片内Flash?
DSP中的Flash的编写方法有三中: 
1.通过仿真器编写:在我们的网页上有相关的软件,在销售仿真器时我们也提供相关软件。其中LF240x的编写可以在CCS中加入一个插件,F24x的编写需要在windows98下的DOS窗中进行。具体步骤见软件中的readme。有几点需要注意: 
a.必须为MC方式; b.F206的工作频率必须为20MHz; 
c.F240需要根据PLL修改C240_CFG.I文件。建议外部时钟为20MHz。 
d.LF240x也需要根据PLL修改文件。 d.如果编写有问题,可以用BFLWx.BAT修复。 
2.提供串口编写:TI的网页上有相关软件。注意只能编写一次,因为编写程序会破坏串口通信程序。 
3.在你的程序中编写:TI的网页上有相关资料。 
三十二.如何编写DSP外部的Flash?
DSP的外部Flash编写方法: 
1.通过编程器编写:将OUT文件通过HEX转换程序转换为编程器可以接受的格式,再由编程器编写。 
2.通过DSP软件编写:您需要根据Flash的说明,编写Flash的编写程序,将应用程序和编写Flash的程序分别load到RAM中,运行编写程序编写。 

三十三.对于C5000,大于48K的程序如何BOOT?
对于C5000,片内的BOOT程序在上电后将数据区的内容,搬移到程序区的RAM中,因此FLASH必须在RESET后放在数据区。由于C5000,数据区的空间有限,一次BOOT的程序不能对于48K。解决的方法如下: 
1.在RESET后,将FLASH译码在数据区,RAM放在程序区,片内BOOT程序将程序BOOT到RAM中。 
2.用户初试化程序发出一个I/O命令(如XF),将FLASH译码到程序区的高地址。开放数据区用于其它的RAM。 
3.用户初试化程序中包括第二次BOOT程序(此程序必须用户自己编写),将FLASH中没有BOOT的其它代码搬移到RAM中。 
4.开始运行用户处理程序。 
三十四.DSP外接存储器的控制方式 
对于一般的存储器具有RD、WR和CS等控制信号,许多DSP(C3x、C5000)都没有控制信号直接连接存储器,一般采用的方式如下: 
1.CS有地址线和PS、DS或STRB译码产生; 
2./RD=/STRB+/R/W; 3./WR=/STRB+R/W.




关键词: 开发     应当     懂的     34个     问题    

助工
2015-01-28 22:27:17     打赏
2楼
DSP这些东西都得上手做

共2条 1/1 1 跳转至

回复

匿名不能发帖!请先 [ 登陆 注册 ]