这些小活动你都参加了吗?快来围观一下吧!>>
电子产品世界 » 论坛首页 » 嵌入式开发 » FPGA » TMS320C5000性能介绍1

共2条 1/1 1 跳转至

TMS320C5000性能介绍1

菜鸟
2007-03-16 04:00:59     打赏
TMS320C5000性能介绍

Lesson 3 Performance Introduction to TMS320C5000

清华大学电子工程系教授 应启珩

TMS320C54x是目前普遍使用的定点DSP芯片。它的特点是功耗很低(在100MIPS时为60mW),可用于数字蜂窝通信、个人通信系统、寻呼机、个人数字助理(PDA)、ATM(异步传输模式)交换机、数字无线通信、调制解调器等领域。图1表示了C54x的发展过程及应用领域。

图1 TMS320C5000性能发展状况及应用领域

TMS320系列的同一代芯片具有相同的CPU结构,但根据市场的不同需要,形成新的存储器与外设的不同组合,产生了多种派生器件。


TMS320C54x关键特性

图2是C54x功能结构图,它的主要性能如下:

图2 TMS320C54x功能结构框图

⒈ CPU

先进的多总线结构:一组程序总线(PAB、PB),三组数据总线(CAB、CB,DAB、DB,EAB、EB)

40位的数学逻辑单元(ALU):包括40位的桶形移位寄存器和两个独立的40位累加器

17 17位并行乘法器和40位专用加法器,单周期完成乘法/累加(MAC)

适于Viterbi运算的比较、选择、存储单元(CSSU)
指数编码器,可在单周期内计算(40位)累加器中数值的指数
两个地址产生器,包括八个辅助寄存器和两个的算术单元

⒉ 存储器

可寻址存储空间达192K字(程序、数据及I/O各64 64bit),C548还可扩展程序存储器(8兆字)

典型C5400芯片存储器

⒊ 片内外设

软件可编程等待状态产生器

可编程的块交换

片内锁相环时钟产生器

禁止外部总线的控制机制

⒋ 指令集

重复单条指令与重复指令块

存储器块移动指令

32位数运算指令

可同时读取2或3个操作数的指令

具有并行保存和并行加载的算术指令

条件保存指令

⒌ 功耗控制

IDLE1、IDLE2和IDLE3指令可控制其进入降功耗模式

可控制是否输出CLKOUT信号

⒍ IEEE标准的1149.1边界扫描逻辑接口


TMS320C54x结构概述

'C54x由中央处理器CPU、存储器和片内外设组成,采用哈佛结构,有独立的程序空间、数据空间和I/O空间。图3是'C54x的内部硬件框图。

对所有的'C54x器件来说,图中下半部所示的中央处理单元(CPU)是通用的。

总线结构

一组程序总线(PAB、PB)和三组数据总线CAB、CB,DAB、DB,EAB、EB)将内部各部件联系起来。

图3 TMS320C54x内部硬件框图

PB- 程序总线,传送程序代码或存在程序空间的数据;

CB、DB、EB- 数据总线,连接CPU、数据地址产生逻辑、程序地址产生逻辑、片内外设及存储器等各部件;

CB和DB- 传送从存储器读出的数据,即“读”操作使用的数据总线;
EB-传送向存储器写入的数据,即"写"操作使用的数据总线;
PAB、CAB、DAB、EAB- 各对应的地址总线;

图4 ALU功能框图

中央处理单元(CPU)

ALU:算术逻辑运算单元

主要由40位ALU和两个40位累加器(ACCA和ACCB)组成,如图4所示。

ALU和两个累加器用来完成40位二进制补码的算术运算,也能完成布尔运算。当状态寄存储器ST1的C16位置1时,可做两个16位ALU,同时完成两个16位运算。

输入:

16位立即数;

来自数据存储器的16

位数;

来自暂存器T的16位

数;

来自数据存储器读出

的两个16位数;

来自数据存储器读出

的一个32位数;

来自累加器(A和B)

的40位数;

图5 桶形移位器功能框图

输出:ALU的40位输出被送往累加器A或B。

图6 乘/加模块功能方框图

桶形移位器:将输入数据左移0~31位或右移0~16位,经常用作数字定标、位提取、扩展算术和溢出保护等操作。 输入40位:来自累加器或经DB、CB的 数据存储器;

输出40位:连到ALU或经EB连到数据存储器;

所移位数由指令中移位字段、ST1的ASM字段或T寄存器指定移位位数决定。

图7 比较、选择与保存单元(CSSU)功能框图

乘/加模块:由乘法器、加法器、输入数据的符号控制逻辑、小数控制逻辑、零检测、舍入、溢出/饱和逻辑和16位暂存寄存器T等组成。乘法器和ALU在一个指令周期内共同完成(17 17补码)乘/加(40位)运算,且可并行地作ALU运算,这些功能可用来做Euclidean距离及LMS滤波等复杂运算。乘/加模块功能方框图如图6所示。

比较、选择与保存单元(CSSU):可以完成累加器的高位字和低位字之间的最大值比较(CMPS指令)。另一功能是利用优化的片内硬件资源完成数据通信、模式识别等领域中经常用到的Viterbi蝶形运算。

图8 指数编码器

指数编码器:用于支持单周期指令EXP的专用硬件,如图8所示。

累加器中数值的指数值,以二进制补码形式(-8~31)存放于暂存器T中;

CPU状态和控制寄存器:

'C54x共有3个16位状态和控制寄存器(PMST、ST0、ST1)它们都是存储器映象寄存器,可以方便地写入数据、或由数据存储器对它们加载。

内部存储器

·'C54x的存储器分为三个可独立选择的空间:程序空间、数据空间和I/O空间;

·'C54x的片内存储器包括ROM和RAM,其中RAM又可分为SARAM和DARAM:SARAM为单寻址寄存储器,DARAM为双寻址寄存储器(一周期内可以访问两次)。

ROM一般配置成程序存储空间,用于存放要执行的指令、系数表等固定操作数。也可以部分地安排到数据存储空间,由PMST的状态位 和DROM决定;RAM 一般安排到数据存储空间,存放执行指令所要用的数据。但也可以安排到程序空间,由PMST的状态位OVLY决定。不同'C54x系列内部存储器配置各不相同。

'C54x的寻址方式

TMS320C54x的指令可能含有1个存储器操作数(指令说明中用Smem表示),也可能有2个存储器操作数(指令说明中用Xmem、Ymem表示),分别称为单存储器操作数和双存储器操作数。单存储器操作数有7种寻址方式,它们是:

立即寻址: 操作数(常数)含在指

令中;

绝对寻址: 指令中含有操作数

的16位地址;

累加器寻址: 操作数地址在累加器

中(A);

直接寻址: 指令中含有操作数

地址的低7 位;

间接寻址: 操作数的地址在辅

助寄存器中,支持倒

位序寻址、循环寻址

等功能;

存储器映像的寄存器寻址:

访问存储器映像寄存器,

又不影响DP或SP;

堆栈寻址: 访问堆栈;

双存储器操作数支持一些特殊指令:

如MAC、FIR等复杂

指令。

'C54x的六级指令流水线

'C54x CPU的指令流水线有六级,每个周期有六条指令在工作,它们处于整个执行过程的不同阶段,如图9所示。

图9 流水线不同工作阶段操作内容

流水线的工作全部为单字指令连续执行时(理想情况)如图10 所示。

图10 流水线正常工作时做业情况




关键词: TMS320C5000     性能     介绍     存储器     功能         

菜鸟
2007-03-29 19:48:00     打赏
2楼

不错


共2条 1/1 1 跳转至

回复

匿名不能发帖!请先 [ 登陆 注册 ]