共2条
1/1 1 跳转至页
D饧际?PM50 利用PM50语音芯片做语音组合播报
问
用PM50 做语音组合设计
电子产品的功能越来越复杂,智能化程度也越来越高,让产品“开口说话”已经是基本的功能。语音功能是一个很好的人机界面,比及指示灯亮、蜂鸣器响、数码 LED 、 LCD 显示要更直观,而且内容多样,不占面板面积,而且与用户的视力状况、注意力状况无关,传播距离远,更重要的是极具人性化,给僵硬的机器设备增添了活力和亲和力。因而在最近的十年,语音产品的设计发展非常迅速。
产品“说话”的用途有很多类,其中最基本的作用有:
安全操作提醒(配电箱说“有电危险,请勿靠近”,紫外线消毒设备说“现在开始紫外消毒,请全部人员离开”);
工作状态提醒(空调说“现在正在制冷换气”,电梯说“电梯故障”,防盗系统说“这里发生警情,请来检查”);
工作流程提醒(医疗仪器说“仪器开始工作。。。红外灯开启。。。请放松。。。开始心率检测。。。”);
人机对话(智能玩具熊说“我是巴迪,你叫什么名字呀”)等。
另一个更能体现语音芯片的重要性和智能性设计的,就是“语音组合”。所谓语音组合,就是用语音芯片把需要的语音元素分成很多段存储起来,然后用微处理控制器将这些语音元素按用户需要的组合起来,听起来就是一句或一系列完整的话。例如“现在温度三十六点五度,体温正常”,这其中的“现在”、“温度”、“三”、“十”、“六”、“点”、“五”、“度”、“体温正常”都是其中的语音元素,每个词就是一个语音段,微处理控制器把它们调出来按顺序播放就成为语音组合出一句完整的话。这样,语音组合设计就能够表达一个动态的意思。
过去的几年里,我们都是采用 ISD 芯片做语音组合设计。先制作用户需要的全部语音元素声音文件,用 ISD 编程拷贝机及其软件,将需要的语音元素分成很多语音段(及声音文件),分段录制在 ISD 芯片中,制成一片音源芯片。然后依每段不同的地址,由单片机去选择、调用,一段播放完毕紧接着再播放一段,形成一个完整的语音组合。
ISD 芯片有两大类:一是 ISD1400 、 2500 系列的电源电压 5V 、 8~10 根地址线的并行接口品种,语音时间 20~120 秒,这种控制稳定可靠,音质较好,就是需要占用单片机资源占用较多( 11~13 根口线);另一类是 ISD4000 系列的电源电压 3V 、 SPI 串行接口品种,这种语音容量较大,可达 2~16 分钟,这种音质较好,控制也较灵活,单片机资源占用少( 4~6 根口线),就是可靠度欠缺,使用时间一长存在丢失语音段的情况。
ISD 芯片做语音合成设计的共同问题是不能实现 ISP 在线编程,即不能在产品电路板上直接对语音芯片进行编程、更换语音段,问题在于首先是美国 ISD 公司没有提供在线编程的开发工具和方法;再者是改变其中一段或几段的语音内容,会影响各段的地址分布,从而需要改变单片机的软件控制。
2003 年底开始,随着 PM50 系列语音芯片的推出,语音合成设计更加简单、灵活、可靠、价廉。
PM50 系列语音芯片有 20 秒、 50 秒、 100 秒、 150 秒、 200 秒等多个系列,电源电压 3~6V 均可,做语音组合用途时只需要占用外部单片机 3 根口线,可以最多分 128 段,直接驱动喇叭均使用。 PM5 系列芯片有 FLASHRAM 和 MASKROM 两个版本,在实验和小批量生产阶段可以使用 FLASHRAM 版本的芯片,可以反复修改其中的语音和分段,直到满意为止。当产品的生产、需求和语音内容完全定型后,就可以大批量投产 MASKROM 版本的芯片,编程软件和电路都无须变化,而价格却能降低几倍以上。 ATVOC-PM50 型编程器做产品开发、编辑和烧录的工具。该编程器采用最新的 USB 电脑接口设计,专为语音组合用途做了完善的设计,使语音组合设计变得非常简单、方便。
下面仅以设计一个播报温度和时间的语音组合设计为例说明 PM50 芯片的使用和设计。
(一)、将语音组合使用的所有语素都列写出来,括号内为段号,后面跟的是读音的内容,如:( 1 )现在、( 2 )温度、( 3 ) 0 、( 4 ) 1 、( 5 ) 2 、( 6 ) 3 、( 7 ) 4 、( 8 ) 5 、( 9 ) 6 、( 10 ) 7 、( 11 ) 8 、( 12 ) 9 、( 13 )十、( 14 )百、( 15 )点、( 16 )负、( 17 )度、( 18 )上升、( 19 )下降、( 20 )嘟、( 21 )分、( 22 )秒、( 23 )音乐铃声 01 、( 24 )音乐铃声 02 。
(二)、录制声音文件,实验时可以自己或找个发音纯正的人对着电脑录音,专业制作时可以委托广播电台、电视台、电影制片厂、专业录音棚去做专业录音。有些声效文件、音乐文件可以从一些电脑的声音音效文件中寻找,增加这些文件会大大增加产品使用的乐趣和产品的档次。将做好的声音文件按上述分段,切分成 24 个文件。
(三)、使用 ATVOC-PM50 编程器,使用其中的串行模式菜单,将需要的这 24 个文件放入菜单,如下图。每段声音文件听取无误后,存成一个文件名(如“标准温度时间合成 01 。 PM5 ”),即可以联机烧写到 PM50S20 芯片中。
http://www.atvoc.com/image/zxj/200409080931150734.jpg
(四)、在 ATVOC-PM50 编程器上就可以对烧好的芯片测试,听取每一段声音效果,听取八段连续播放时合成的效果,如果无误,就可以把该芯片放到产品电路上了。
(五)现在这片制作好的 PM50S20 芯片的各段语音内容和地址见上图中显示,从80H开始,表示第一段语音存放对应地址,依次类推。
设计师可以用此表开始产品的单片机软件设计。下图是一个单片机与 PM50 芯片连接的范例式原理图,它可以实现用手按键,任意调出 PM50 芯片的某一段或某几段播放,有关具体电路功能设计和程序设计内容可参见中青世纪公司的网站 www.atvoc.com 。参考该单片机软件设计,设计师能迅速完成一个语音合成电路的开发设计工作。
http://www.atvoc.com/image/zxj/200409080931150750.jpg
答 1: 不知道购买方不方便 答 2: 购买方便,北京深圳都有北京深圳都有,方便啊:) 答 3: look
用PM50 做语音组合设计
电子产品的功能越来越复杂,智能化程度也越来越高,让产品“开口说话”已经是基本的功能。语音功能是一个很好的人机界面,比及指示灯亮、蜂鸣器响、数码 LED 、 LCD 显示要更直观,而且内容多样,不占面板面积,而且与用户的视力状况、注意力状况无关,传播距离远,更重要的是极具人性化,给僵硬的机器设备增添了活力和亲和力。因而在最近的十年,语音产品的设计发展非常迅速。
产品“说话”的用途有很多类,其中最基本的作用有:
安全操作提醒(配电箱说“有电危险,请勿靠近”,紫外线消毒设备说“现在开始紫外消毒,请全部人员离开”);
工作状态提醒(空调说“现在正在制冷换气”,电梯说“电梯故障”,防盗系统说“这里发生警情,请来检查”);
工作流程提醒(医疗仪器说“仪器开始工作。。。红外灯开启。。。请放松。。。开始心率检测。。。”);
人机对话(智能玩具熊说“我是巴迪,你叫什么名字呀”)等。
另一个更能体现语音芯片的重要性和智能性设计的,就是“语音组合”。所谓语音组合,就是用语音芯片把需要的语音元素分成很多段存储起来,然后用微处理控制器将这些语音元素按用户需要的组合起来,听起来就是一句或一系列完整的话。例如“现在温度三十六点五度,体温正常”,这其中的“现在”、“温度”、“三”、“十”、“六”、“点”、“五”、“度”、“体温正常”都是其中的语音元素,每个词就是一个语音段,微处理控制器把它们调出来按顺序播放就成为语音组合出一句完整的话。这样,语音组合设计就能够表达一个动态的意思。
过去的几年里,我们都是采用 ISD 芯片做语音组合设计。先制作用户需要的全部语音元素声音文件,用 ISD 编程拷贝机及其软件,将需要的语音元素分成很多语音段(及声音文件),分段录制在 ISD 芯片中,制成一片音源芯片。然后依每段不同的地址,由单片机去选择、调用,一段播放完毕紧接着再播放一段,形成一个完整的语音组合。
ISD 芯片有两大类:一是 ISD1400 、 2500 系列的电源电压 5V 、 8~10 根地址线的并行接口品种,语音时间 20~120 秒,这种控制稳定可靠,音质较好,就是需要占用单片机资源占用较多( 11~13 根口线);另一类是 ISD4000 系列的电源电压 3V 、 SPI 串行接口品种,这种语音容量较大,可达 2~16 分钟,这种音质较好,控制也较灵活,单片机资源占用少( 4~6 根口线),就是可靠度欠缺,使用时间一长存在丢失语音段的情况。
ISD 芯片做语音合成设计的共同问题是不能实现 ISP 在线编程,即不能在产品电路板上直接对语音芯片进行编程、更换语音段,问题在于首先是美国 ISD 公司没有提供在线编程的开发工具和方法;再者是改变其中一段或几段的语音内容,会影响各段的地址分布,从而需要改变单片机的软件控制。
2003 年底开始,随着 PM50 系列语音芯片的推出,语音合成设计更加简单、灵活、可靠、价廉。
PM50 系列语音芯片有 20 秒、 50 秒、 100 秒、 150 秒、 200 秒等多个系列,电源电压 3~6V 均可,做语音组合用途时只需要占用外部单片机 3 根口线,可以最多分 128 段,直接驱动喇叭均使用。 PM5 系列芯片有 FLASHRAM 和 MASKROM 两个版本,在实验和小批量生产阶段可以使用 FLASHRAM 版本的芯片,可以反复修改其中的语音和分段,直到满意为止。当产品的生产、需求和语音内容完全定型后,就可以大批量投产 MASKROM 版本的芯片,编程软件和电路都无须变化,而价格却能降低几倍以上。 ATVOC-PM50 型编程器做产品开发、编辑和烧录的工具。该编程器采用最新的 USB 电脑接口设计,专为语音组合用途做了完善的设计,使语音组合设计变得非常简单、方便。
下面仅以设计一个播报温度和时间的语音组合设计为例说明 PM50 芯片的使用和设计。
(一)、将语音组合使用的所有语素都列写出来,括号内为段号,后面跟的是读音的内容,如:( 1 )现在、( 2 )温度、( 3 ) 0 、( 4 ) 1 、( 5 ) 2 、( 6 ) 3 、( 7 ) 4 、( 8 ) 5 、( 9 ) 6 、( 10 ) 7 、( 11 ) 8 、( 12 ) 9 、( 13 )十、( 14 )百、( 15 )点、( 16 )负、( 17 )度、( 18 )上升、( 19 )下降、( 20 )嘟、( 21 )分、( 22 )秒、( 23 )音乐铃声 01 、( 24 )音乐铃声 02 。
(二)、录制声音文件,实验时可以自己或找个发音纯正的人对着电脑录音,专业制作时可以委托广播电台、电视台、电影制片厂、专业录音棚去做专业录音。有些声效文件、音乐文件可以从一些电脑的声音音效文件中寻找,增加这些文件会大大增加产品使用的乐趣和产品的档次。将做好的声音文件按上述分段,切分成 24 个文件。
(三)、使用 ATVOC-PM50 编程器,使用其中的串行模式菜单,将需要的这 24 个文件放入菜单,如下图。每段声音文件听取无误后,存成一个文件名(如“标准温度时间合成 01 。 PM5 ”),即可以联机烧写到 PM50S20 芯片中。
http://www.atvoc.com/image/zxj/200409080931150734.jpg
(四)、在 ATVOC-PM50 编程器上就可以对烧好的芯片测试,听取每一段声音效果,听取八段连续播放时合成的效果,如果无误,就可以把该芯片放到产品电路上了。
(五)现在这片制作好的 PM50S20 芯片的各段语音内容和地址见上图中显示,从80H开始,表示第一段语音存放对应地址,依次类推。
设计师可以用此表开始产品的单片机软件设计。下图是一个单片机与 PM50 芯片连接的范例式原理图,它可以实现用手按键,任意调出 PM50 芯片的某一段或某几段播放,有关具体电路功能设计和程序设计内容可参见中青世纪公司的网站 www.atvoc.com 。参考该单片机软件设计,设计师能迅速完成一个语音合成电路的开发设计工作。
http://www.atvoc.com/image/zxj/200409080931150750.jpg
答 1: 不知道购买方不方便 答 2: 购买方便,北京深圳都有北京深圳都有,方便啊:) 答 3: look
共2条
1/1 1 跳转至页
回复
有奖活动 | |
---|---|
【有奖活动】分享技术经验,兑换京东卡 | |
话不多说,快进群! | |
请大声喊出:我要开发板! | |
【有奖活动】EEPW网站征稿正在进行时,欢迎踊跃投稿啦 | |
奖!发布技术笔记,技术评测贴换取您心仪的礼品 | |
打赏了!打赏了!打赏了! |
打赏帖 | |
---|---|
vscode+cmake搭建雅特力AT32L021开发环境被打赏30分 | |
【换取逻辑分析仪】自制底板并驱动ArduinoNanoRP2040ConnectLCD扩展板被打赏47分 | |
【分享评测,赢取加热台】RISC-V GCC 内嵌汇编使用被打赏38分 | |
【换取逻辑分析仪】-基于ADI单片机MAX78000的简易MP3音乐播放器被打赏48分 | |
我想要一部加热台+树莓派PICO驱动AHT10被打赏38分 | |
【换取逻辑分析仪】-硬件SPI驱动OLED屏幕被打赏36分 | |
换逻辑分析仪+上下拉与多路选择器被打赏29分 | |
Let'sdo第3期任务合集被打赏50分 | |
换逻辑分析仪+Verilog三态门被打赏27分 | |
换逻辑分析仪+Verilog多输出门被打赏24分 |