不知道大家发现没有,在我们的日常生活当中,其实有很多会“说话”的产品,比如我们日常骑行电动自行车,在没电的时候它会通过语音播报提醒你“电量低请及时充电”。在便利店或者很多餐饮商家付款的时候,都会有一个语音播报,收款24元等等。不知道大家发现没有会“说话”的产品越来越多了,不仅仅是声音播放,还可以进行语音交互也就是大家说的AI对话芯片,下面小编将会带大家一起了解语音播报背后的那些芯片。
让机器发出固定声音的芯片
一些简单播报需求都可以使用OTP语音芯片,以WTN6系列的OTP语音芯片就大量的应用在简单的门铃叮咚的声,智能锁简单的固定播报内容:“密码错误、解锁成功”,电动牙刷、电饭煲、洗衣机、电动车等有简单播报的需求,这种芯片的特点就是通过出厂前批量烧录语音内容到芯片里面。OTP语音芯片的缺点其实也很明显,容量有限只能支持20秒-170秒之间的语音内容,并且是一次性写入的,后期无法修改语音内容。
那我想要更长时间的语音播放怎么办?
这时候就是FLASH语音芯片出厂了,FLASH语音芯片支持更大的语音时长,同时也支持更高采样率的语音内容,同时还支持外挂flash语音芯片,因为FLASH储存是支持重复擦写的,所以FLASH语音芯片也是支持二次修改的,灵活性更高,当然价格也比OTP语音芯片更高。
那我想让我的产品动态播报语音怎么办?
如果把Otp语音芯片和FLASH语音芯片看成一个“磁带芯片”,那么TTS文字合成语音芯片简直不要太灵活,TTS文字合成语音芯片你只需要把文字提供给它,它就能够按照提前设定好的音调、音色和语速来播放,没有内容限制了。当然TTS文字转语音芯片的成本也会高不少,但是对于用户体验的提升,那是很大的。以WT3000Ax为例,这是32位DSP内核240M主频,支持8-16M储存,支持工业级宽温-45°-85°,也就意味着这颗芯片可以应用在工业设备上,它支持SPI/PWM/UART/I2C/IO,工作电压2.6-5.5v,支持16位DAC和ADC SNR≥90dB。
TTS文字转语音的优势在哪里?
在于灵活,以收音机为例,收到1元,它就播报1元,收到100元,它就播报一百元,但是大家都知道在付款的时候,从1毛1分到几百上千上万乃至十万百万,是有无数个播报内容的,如果用OTP或FLASH语音芯片,那点内存根本放不下,即便储存够用,整理这些音频文件都需要好长的时间,而TTS文字转语音芯片没有这个烦恼,你给它什么内容它就播报什么内容,还可以调节男声女声音调音速,如果是WT3000A在线的TTS支持超拟人音色,支持16国语音和7种方言。
以上就是关于“语音播报芯片:让产品开口说话的秘密”。