这些小活动你都参加了吗?快来围观一下吧!>>
电子产品世界 » 论坛首页 » 综合技术 » (DSPTech)高 速 实 时DSP 与 并 行 体 系

共1条 1/1 1 跳转至

(DSPTech)高 速 实 时DSP 与 并 行 体 系

菜鸟
2005-09-12 15:38:53     打赏
---- 当 前, 高 速 实 时 数 字 信 号 处 理(DSP) 技 术 已 经 取 得 了 飞 速 的 发 展; 目 前 单 片DSP 芯 片 的 速 度 已 经 可 以 达 到 每 秒16 亿 次 定 点 运 算(1600MIPs)。 高 速 实 时DSP 芯 片 的 主 要 特 点 就 是 采 用 了 各 种 并 行 处 理 技 术, 包 括 片 内 并 行 和 片 间 并 行 等。 其 中, 主 要 的 并 行DSP 芯 片 包 括 美 国TI 公 司 的 TMS320C8x 和TMS320C6x, 以 及 美 国AD 公 司 的ADSP2106x 及AD1406x 等 等。 ----(1)TMS320C8x: 片 内 并 行,MIMD 体 系 结 构 ---- 在 每 一 片TMS320C80 内 部, 有1 个 浮 点RISC 类 型DSP, 称 为 主 处 理 器(MP); 还 有4 个 定 点DSP, 称 为 并 行 处 理 器(PP)。 每 个DSP 配 有10K-Bytes 片 内 存 储 器(RAM), 因 此 片 内RAM 总 容 量 为50K-Bytes。 主 处 理 器、 并 行 处 理 器 和 片 内RAM 之 间 通 过 交 叉 开 关(Crossbar) 互 连, 并 通 过1 个 专 用 的 传 输 控 制 器(TC ) 控 制 处 理 器 之 间 及C80 与 片 外 器 件 之 间 的 互 连。 在C80 内 部, 还 有1 个 视 频 控 制 器(VC), 可 用 于 视 频 接 口、 时 序 的 控 制; 因 此 这 种 芯 片 特 别 适 用 于 视 频 信 号 的 处 理, 故 称 MVP 芯 片。 ---- 从 并 行 处 理 的 角 度 分 析,TMS320C8x 是 一 个 紧 耦 合 多 指 令 多 数 据 流(MIMD) 的 单 片 多 处 理 器 系 统。 这 一 系 统 的 运 行 速 度 等 效 于 每 秒20 亿 次RISC 类 型 的 操 作。 在 这 个 系 统 中, 一 个 显 著 的 特 点 是 采 用 交 叉 开 关(Crossbar) 代 替 了 传 统 的 总 线 互 连。 ---- 在 总 线 互 连 的 系 统 中, 各 个DSP 之 间 需 要 申 请 总 线, 并 需 要 总 线 仲 裁 机 构 分 配 总 线。 对 于 单 总 线 系 统, 如 果 某 一DSP 占 用 总 线, 则 其 它DSP 需 等 到 该DSP 释 放 总 线 后 才 可 能 获 得 总 线 的 使 用 权, 这 就 限 制 了 总 线 传 输 数 据 的 速 度。 而 交 叉 开 关 结 构 则 可 以 在 同 一 时 刻 将 不 同 的 DSP 与 不 同 的 任 一 存 储 器 连 通, 这 就 大 大 提 高 了 数 据 传 输 的 速 率, 使 多 处 理 器 并 行 处 理 中 数 据 传 输 的 瓶 颈 问 题 得 以 减 轻。 (2)TMS320C6x: 片 内 并 行,VLIW 体 系 结 构: ----TMS320C6x 是90 年 代 中 后 期 美 国TI 公 司 推 出 的 划 时 代 的 超 级DSP 芯 片; 这 种 芯 片 是 定 点、 浮 点 兼 容 的DSP 系 列, 其 中 首 先 推 出 的 是 定 点 系 列TMS320C62x。 ----TMS320C62x 片 内 有8 个 并 行 的 处 理 单 元, 分 为 相 同 的 两 组。DSP 的 体 系 结 构 采 用 甚 长 指 令 字(VLIW) 方 式, 单 指 令 字 长 为32bits,8 个 指 令 组 成 一 个 指 令 包, 总 字 长 为8 ×32bits =2 56bits。 芯 片 内 部 设 置 了 专 门 的 指 令 分 配 模 块, 可 以 将 每 个256bits 的 指 令 包 同 时 分 配 到8 个 处 理 单 元, 并 由8 个 单 元 同 时 运 行。 这 种 芯 片 的 最 高 时 钟 频 率 可 以 达 到200MHz , 这 是 通 过 片 内 的 锁 相 环 路(PLL) 将50MHz 的 输 入 时 钟4 倍 频 获 得 的, 因 此 这 种 芯 片 的 指 令 周 期 为5ns。 当 芯 片 内 部8 个 处 理 单 元 同 时 运 行 时, 其 最 大 处 理 能 力 可 以 达 到 1600MIPs, 即16 亿 次 定 点 运 算/ 秒。( 图6) ---- 从 并 行 处 理 的 角 度 分 析,TMS320C62x 的 主 要 特 点 是 采 用 了VLIW 的 体 系 结 构。 ---- 在VLIW 处 理 机 中, 多 个 功 能 单 元 是 并 发 工 作 的; 所 有 的 功 能 单 元 共 享 使 用 公 用 大 型 寄 存 器 堆。 由 功 能 单 元 同 时 执 行 的 各 种 操 作 是 由VLIW 的 长 指 令 来 同 步 的, 它 把 长 指 令 中 不 同 字 段 的 操 作 码 分 送 给 不 同 的 功 能 单 元; 这 种 代 码 压 缩 是 由 编 译 器 完 成 的, 编 译 器 可 以 利 用 精 心 设 计 过 的 启 发 式 方 法 或 运 行 时 统 计 方 法 来 预 测 转 移 结 果。 在TMS320C62x 中,8 个 功 能 单 元 共 享 使 用32 个32bits 通 用 寄 存 器 堆。 为 保 证 代 码 压 缩、 分 配 的 效 率,TI 公 司 还 推 出 了 世 界 上 第 一 个 汇 编 语 言 级 编 译 器; 这 个 编 译 器 的 编 译 效 果 会 大 大 影 响C62x 的 运 行 效 率。 ----VLIW 处 理 机 的 另 一 个 特 点 是 指 令 获 取、 指 令 分 配、 指 令 执 行、 数 据 存 储 等 阶 段 需 要 进 行 多 级 流 水, 而 且 不 同 指 令 执 行 的 流 水 延 迟 时 间 也 不 相 等( 图7); 因 此 各 种 指 令 的 安 排 要 尽 量 不 破 坏 指 令 流 水 的 执 行, 否 则 处 理 机 运 行 的 效 率 也 会 大 大 降 低。 ----(3)ADSP2106x: 片 间 并 行, 多 种 体 系 结 构 ----ADSP2106x 是 美 国AD 公 司 推 出 的 可 并 行 扩 展 的 超 级 哈 佛 指 令 计 算 机(SHARC)。 这 种 芯 片 片 内 有 四 套 独 立 的 总 线, 可 完 成 双 向 数 据 存 取、 指 令 存 取、 非 指 令 性I/O, 因 此 与 一 般 哈 佛 结 构 计 算 机 相 比 被 称 为SHARC。 ---- 这 种 芯 片 的 主 要 型 号 包 括ADSP21060、ADSP21061、ADSP21062 等, 其 主 要 特 点 是 在 一 个ADSP21020 的 浮 点DSP 核 心 基 础 上 集 成 了 片 内 大 容 量 双 口RAM 和 并 行 处 理 接 口, 因 此 是 一 个 可 并 行 扩 展 的SHARC 结 构。 ----ADSP2106x 的 最 大 特 点 就 是 支 持 多DSP 系 统, 可 以 方 便 地 构 成 各 种 体 系 结 构 的 多DSP 系 统。ADSP2106x 对 多DSP 处 理 的 支 持 包 括6 个 连 接 口(Link Port); 大 容 量 片 内 存 储 器 和DMA 传 输; 统 一 分 配 的 片 内 存 储 器 地 址; 与 宿 主 机 接 口; 分 布 式 总 线 仲 裁 逻 辑 等。 其 中,ADSP21 06x 的 连 接 口 是 其 对 多DSP 处 理 的 主 要 支 持 手 段 之 一; 其6 个 连 接 口 可 实 现6 片DSP 并 行 互 连 而 无 需 附 加 器 件。 ---- 因 此, 采 用 多 片ADSP2106x 可 方 便 地 构 成 多 片 并 行 的 处 理 系 统, 包 括 共 享 存 储 器 并 行 处 理 系 统、 数 据 流 并 行 处 理 系 统、 集 束 并 行 处 理 系 统、 单 指 令 多 数 据 流(SIMD) 并 行 处 理 系 统 等 等。 ---- 这 里,ADSP2106x 并 行 处 理 的 典 型 应 用 是AD14060, 它 是 把4 片ADSP2106x 以 集 束 多 处 理 模 式、 采 用MCM 工 艺 集 成 于 一 个 芯 片 模 块 之 中, 因 此 这 种 芯 片 模 块 的 处 理 能 力 是 单 片ADSP210 6x 的4 倍, 即 峰 值 处 理 能 力480MFLOPs、 持 续 处 理 能 力320MFLOPs。



关键词: DSPTech    

共1条 1/1 1 跳转至

回复

匿名不能发帖!请先 [ 登陆 注册 ]