这些小活动你都参加了吗?快来围观一下吧!>>
电子产品世界 » 论坛首页 » 嵌入式开发 » STM32 » 【转载】声控模块的原理讲解--from毅

共2条 1/1 1 跳转至

【转载】声控模块的原理讲解--from毅

工程师
2026-03-19 20:45:07     打赏

实物图

image.png

image.png

二、原理图

image.png

image.png

三、简介

SU-03T离线语音模组是一种基于数字信号处理技术的硬件设备,具有自然语言语音识别、文本转语音合成等功能。它不依赖于云端服务,而是直接在设备上进行语音识别和合成,在响应速度、稳定性和安全性方面具有优势,适用于各种智能音箱、智能家居、智能硬件、车载导航等场景。


SU-03T离线语音模组采用专业级DSP芯片和远场麦克风技术,可以在较远距离范围内实现准确的语音识别和指令控制。同时,该模组支持多国语言识别,可满足全球各地区的市场需求。除此之外,它还支持离线语言包升级,可以随时更新语音识别和合成技术,提高用户体验。


总之,SU-03T离线语音模组是一款高性能、高可靠性、易于集成和定制的离线语音识别与合成设备。以下是它的一些特性:


32bit RISC 内核,运行频率 240M

支持 DSP 指令集以及 FPU 浮点运算单元

 FFT 加速器:最大支持1024点复数 FFT/IFFT 运算,或者是2048点的实数 FFT/IFFT 运算

 内置高速SRAM,内置 2MB FLASH

 内置 3W、单声道 AB 类功放

支持1 路驻极体麦

 支 持 I2S input/output

支持 5V 电源输入 内置 5V 转 3.3V,3.3V 外部负载不超过 150mA

RC 12MHz 时钟源和 PLL 锁相环时钟源

内置 POR(Power on Reset),低电压检测和看门狗

所 有GPIO 均可配置为外部中断输入和唤醒源

1 个标准 SPI Master 接口,最高速率 30MHz

1 个 SPI Slave 接口最高速率 30MHz

1 个全双工 UART 最高速率 3Mbps。

1 个 I2C 主/从控制器最高速率 400kHz

2 个 PWM 输出

1 个 12-bit SAR-ADC 最大 450Khz 采样率

image.png

基本原理

SU-03T离线语音模组是一种基于数字信号处理(DSP)技术的硬件设备,具有将语音指令转化为可识别文本的能力,其基本原理如下:


采集:使用麦克风等输入设备采集语音信号。

预处理:对采集到的语音信号进行预处理,包括去除噪声和回音等干扰。

特征提取:通过对预处理后的语音信号进行分帧、时频分析等操作,提取出与语音特征相关的参数。

模型匹配:将提取的语音特征与预先训练好的模型进行匹配,寻找最佳匹配结果。

语音识别:根据匹配结果,将语音信号翻译成文本输出。

SU-03T离线语音模组与云端语音识别相比,具有响应速度更快、对网络环境要求较低、隐私安全性更高等优点,适用于各种语音控制场景。


智能公元

SU-03T 离线语音模组具备强大的软件开发定制能力,用户可以使用“智能公元”平台,配置模组的 PIN 脚、语音识别、输入和输出控制等各项能力,生成语音 SDK,并在平台上直接编译、生成固件,实现零代码开发,降低开发难度,提高开发效率,减少开发成本,缩短开发周期。智能公元平台是机芯智能公司为嵌入式开发打造的开放式开发平台,网址如下:


http://www.smartpi.cn


在网站上设置好之后,需要下载 SDK和固件,在SDK中有下载固件的软件。在烧录固件时,需要用到USB转串口模块,B6和B7是串口烧录口

image.png

image.png

image.png

五、注意
  • 在烧录固件时,模块要接USB转串口的5V电源,且要共地。

  • 存放SDK和固件的路径中不能有中文。

  • 点击烧录后,要重新给模块上电。

  • 在用单片机控制时,注意波特率是9600。

    来源: 整理文章为传播相关技术,网络版权归原作者所有,如有侵权,请联系删除。


院士
2026-03-20 17:04:26     打赏
2楼

谢谢分享。


共2条 1/1 1 跳转至

回复

匿名不能发帖!请先 [ 登陆 注册 ]