引言
随着 IP 电话的广泛应用以及 3G 无线手持终端即将大量投产,通过"新型"分组电话网络提供优于普通长话音质的音频性能面临巨大机遇。我们可利用数据网络不受目前电话网络 8 KHZ 采样率(4 KHZ 通频带)限制的功能来实现优于普通长话音质的语音。我们提供低价的 DSP 进行宽带信号压缩,便于其在分组网络上传输,这也是目前上述功能成为现实的原因之一。
本文所讨论的课题就是宽带语音编码器及其实施所面临的挑战。我们将探讨标准化的宽带语音编码器,并讨论当前技术状态以及发展方向。此外,我们还将讨论系统影响以及广泛采用所面临的一些障碍。
宽带语音编码器
目前 IP 语音 (VoIP) 系统使用的大多数语音编码器都经过调整,可通过传统 PSTN 的带宽,因为与传统 PSTN 的互操作性一直是一个关键要求。由于 PSTN 使用 8 KHZ 的采样率,该带宽限制在大约 200-3400 HZ。宽带语音编码器将可用通频带扩展到 50-7000 HZ,针对的是不直接与传统数字 PSTN 进行互操作的应用。这就大大改善了语音交谈的音质,让我们能更清楚地听到通话,并更好地识别讲话者。此外,传输更高质量的音频信号(如音乐)也由此成为可能。
标准组织多年来一直在努力为上述应用定义宽带语音编码器标准。早期宽带编码器的主要用途是电视会议,不过近期工作则集中在 VoIP 与无线应用上。
以下部分将介绍宽带语音编码器的各种不同标准。
宽带语音编码--机遇与实施挑战
G.722 (SB-ADPCM)
ITU G.722 于 1988 年标准化,是第一个用于 16 KHZ 采样率的标准化宽带语音编码算法。该编解码器将 16 KHZ 的频带分为两个子频带,并用 ADPCM 算法在子频带中进行编码。其总延迟约 3 ms,这已经很小,不致造成电信网络中的回声问题。此外,该编解码器传输位误差率仅为 10-3,其性能可以接受。即使遇到最差的网络传输条件,上述要求也可确保性能只是稍稍下降。
G.722 编解码器在 16 kHz 频率上接收 16 位数据(带宽从 50 Hz 至 7 kHz),并将其压缩为 64、56 与 48 Kbit/s。
G.722.1(转换 (Transform) 编码器)
ITU G.722.1 于 20 世纪 90 年代末开发,可实现比 G.722 编解码器更低的比特率以及更大的压缩。目标是以大约一半的比特率实现与 G.722 大致相当的质量。该编解码器由 Picturetel 开发,使用了转换编码的方法。其在 16 KHZ 频率上接收 16 位数据(带宽从 50 Hz 至 7 kHz),并将其压缩为 32 与 24 Kbits/s。目前大多用于电视会议系统。
G.722.2 (AMR-WB)
AMR-WB 是一种最初为 GSM 无线网络定义的宽带编解码器,但最近扩展为包括有线系统。由于其计算强度很大,因此要充分利用多年来显著提高的 DSP 处理能力。AMR-WB 建立在 CELP 语音编码器基础上,音频带宽为 50-7000 HZ,在 6.6 至 23.85 Kbit/s 间提供 9 种语音编码。
AMR-WB 于 2001 年标准化,用于 GSM 与 WCDMA 网络。2002 年底,ITU 决定它还将作为有线应用的宽带标准。它是第一个具有双重应用范围的编解码器。
宽带语音编码--机遇与实施挑战
VMR-WB
VMR-WB 是新型可变速率多模式宽带语音编解码器,专为无线 CDMA 2000标准而设计,目的在于在 50 至 7000 HZ 的频带上进行语音编码,采样率为 16 KHZ。VMR-WB 基于 3GPP AMR-WB (G722.2) 编解码器,在每秒速率12.65 Kbit 上可实现互操作。
VMR-WB 工作模式有四种,具体选择哪种应视网络的流量情况而定。前三种模式专门针对 CDMA 系统,而第四种模式为 AMR-WB 互操作性模式。
VMR-WB 与 AMR-WB 的互操作性允许 GSM/WCDMA 与 CDMA2000 系统无须进行自动解码即可通信,这就不至于增加额外的延迟以及引起语音质量下降。
实施宽带编解码器的系统影响
电话系统设计有两个主要领域会因使用宽带编解码器而受影响:1) 模数输入/输出子系统,2) DSP 中进行的软件处理。
以下给出了 IP 电话的样例结构图,并在该图右下方显示了 DSP 处理器与A/D I/O 子系统之间的关系。
宽带语音编码--机遇与实施挑战
模数输入/输出子系统
A/D I/O 子系统包括扬声器、麦克风与硬件编解码器,对音频信号进行采样并将其数字化,以传输至 DSP。在能够进行宽带语音编码的电话中,重要的是让上述所有组件都支持 50-7000 Hz 的频带,这是宽带语音编码器的要求。
这意味着通常用于标准 PSTN 功能电话中的扬声器与麦克风将不再适用,从面将限制基于其设计的带宽。我们必须用具有宽带功能的扬声器与麦克风来替代它们。
此外,用于传统 PSTN 应用的标准硬件编解码器中的滤波器会带有防混淆滤波器,它将带宽限制在 200-3400 Hz。因此,设计具有宽带功能电话时的另一重要考虑因素就是使用支持 50-7000 Hz 带宽的硬件编解码器,并能以 16 Khz 进行信号采样。
软件
关于具有宽带功能电话软件的主要考虑因素之一是,要求串行输入端口与宽带语音编码器之间的处理组件必须运行于 16 KHz。该要求使单位时间必须处理的数据量翻番,通常也造成处理需求翻番。下页的结构图显示了从左侧 PCM 接口单元开始的受影响的组件。对处理要求影响最大的模块是回声抵消器,它的运行速率必须为传统 IP 电话的两倍,这影响相当大,因为回声抵消器占用大量的计算资源。
第二大受影响领域就是宽带语音编码器本身需要的处理要求。下页的表显示了AMR-WB 编解码器的处理要求相对于原先基于的 G.722 ADPCM 编码器增加了多少。AMR-WB 的 25 MIPS 要求相对于 12 MIPS 范围内的窄带 AMR 编解码器而言也是一个巨大的飞越。
语音处理--DSP 软件
Telogy Software®TMS320C55x™编解码器(宽带)模块
编解码器模块 |
接口 C55xMIPS |
程序存储器 |
C55x 存储器分配 |
临时 (Scratch) | ||
表 数据 Mem/ch | ||||||
G.722 |
Xdias |
5.61 |
1726 |
340 |
164 |
438 |
G.722.1 |
Xdias |
无 |
无 |
无 |
无 |
无 |
AMR-WB |
Xdias |
25.85 |
22436 |
13073 |
2537 |
4435 |
总结
本文介绍了在 VoIP 系统中实施宽带语音编解码器所面临的机遇与挑战。更强大的 DSP 可满足新型声音输入/输出设备的要求以及处理要求,这使用户能够通过宽带音频编码改善音质。
宽带语音编码--机遇与实施挑战
如欲了解更多有关 TI 处理上述挑战的信息,敬请访问网站:www.ti.com/voip
TMS320C55x 是德州仪器的商标。Telogy Software 是德州仪器下属公司 Telogy Networks 的注册商标。所有其它商标均为各自所有者的财产。
2004 德州仪器
重要说明:本文所述的德州仪器及其子公司的产品与服务均按照 TI 的标准销售条款进行销售。建议客户在下订单之前,先获取有关 TI 产品与服务最新和最全面的信息。TI 对应用援助、客户的应用或产品设计、软件性能或专利侵权概不负责。有关其它任何公司的产品或服务信息的发表并不构成 TI 的批准、保证或认可