电子产品世界 » 论坛首页 » 高校专区 » 学习交流 » 拟人感官智能语音交互型机器人头部设计

共3条 1/1 1 跳转至页

拟人感官智能语音交互型机器人头部设计

renazan2000

专家

2013-01-07 14:00:31 打赏

只看楼主 1楼

作者：琼州学院王国勇孙涛徐文涛
指导教师：龙顺宇杨伟

　　作品简介

　　【作品开发背景】：
　　基于具有面部表情的机器人头部系统研究涉及机械、材料、计算机、电子、控制、仿生学、生理学、心理学等诸多研究领域，已经成为目前人机交互和仿人技术领域的一个研究热点，并在此基础上将会对机器人的机械结构及驱动装置的设计提出更多特殊的要求。如果将面部表情再现技术应用于仿人机器人，使其具有表达感情与人机交互的能力，将从根本上改变机器人与人之间的关系，对机器人智能化程度的提高打下良好的技术基础。　　

　　美国著名心理学家阿尔陪特(Albert Mehrabian)认为，人类在进行感情表达时，言辞的使用仅仅占了7%，而声调占了38%，剩下的55%则有人类的面部表情和动作来完成。由此我们知道，人类的面部表情与动作在人类的感情表达中占据着重要的地位。　　

　　具有人类头部外形特征的仿人机器人的研究能够促使未来机器人朝着人性化、情感化方向发展，促进未来机器人与人类自然、和谐、友好地交流，其研究对于丰富和发展机器人学具有深远的科学意义。　　

　　如图3所示，佛蒙特州Life Naut项目的尼克·梅尔坐下与机器头Bina48聊天，实现了一定智能程度的机器人交互。本设计中利用了非特定语音识别技术、单片机智能处理技术、PWM舵机控制技术、音频文件解码技术、TTS技术、语境模式响应技术等融合构建了最终的参赛作品。

　　【参赛作品结构说明】：　　

　　由于机器头的脖子承受了头全部的重量，所以脖子的3个转向舵机为大扭矩的舵机，分别可实现真实的头部左右转动和抬头点头等动作。起支撑作用的是万向轮，考虑到万向轮的活动是随意和未知的，所以在万向轮部位的改造上，我们添加了弹簧圈，使万向轮的外环力矩增大，加上两个大扭力舵机臂杆的支撑，机械头变得更为稳固。眼睛的部位我们用了8个小型的舵机，其中的4个实现眼球上下、左右转动，两个舵机控制眼皮的运动，另外的两个实现眉毛的运动。为了让机械人在与人的交互中更为生动和更具趣味性，我们让机器头的下颚和嘴唇也具有运动的功能。　　

　　【参赛作品功能与使用说明】：
　　机器头可模仿人类的表情动作，并且可感知外部环境参量，整个机械头部共使用了13个舵机，利用大扭矩舵机实现机械头部的转动和支撑，利用小扭矩舵机实现精细结构的动作，分别控制五官活动，由摄像头实现视觉，气体传感器实现嗅觉，静电传感器实现触觉，综合面部的传感节点使得机器头具有更多潜力功能，机械头在多个舵机及连杆的带动下可实现喜怒哀乐表情互动、诗词游戏、数学运算、唱歌互动等仿人类行为活动。

　　平台选型说明

　　本系统以竞赛组委会提供的51开发平台为设计平台，以STC15F2K61S2芯片为控制核心搭建了全部的功能构架。如图6所示，控制芯片一共处理和指控4大功能组成，首先由驻极体接收外部环境的语音信号，传送至语音识别处理单元进行语音识别，若识别结果正确则返回字符串给单片机进行判断，实现语音识别功能。
　　单片机主控控制语音解码的使能，如果语音识别结果正确，由单片机发送指令，让SD卡文件系统中的语音解码单元进行语音解码，随后将解码后的语音信号传送至功放中进行播报。　　

　　主控制核心还控制视觉传感器、声音传感器、气体传感器、静电传感器等传回的信号，进行智能判断以达到感官的功能研究，对于传感器传回的信号进行信号变换和信号调制，配合单片机内部数据编程进行智能感知，并且根据感知结果做出响应。

　　设计说明

　　一、拟人感官智能语音交互型机器人头部设计功能图：
　　整个机器头系统利用非特定语音识别技术、传感器技术、语音信号处理技术、PWM舵机控制技术等技术融合，构建了一个拟人可感知可运动的机器人头部，通过语音交互手段突破了原有传统的交互观念，属于机器人到现实世界的功能研究，未来可以将其应用于机器人巡检、电子保姆、机器人服务员、消费玩具、表情机器人、记忆机器人、生命探测、海底图像传送机器人等应用方面。　　

　　二、主要设计原理及方案：
　　1、非特定语音识别技术
　　1.1非特定语音识别方案
　　非特定人语音识别系统是用很广泛的说话人语音来训练识别系统模型，在保证有足够的数据来精确刻画语音单元的各种复杂的时变特性和协同发音的同时，也可忽略说话人之间的差异，从而降低了系统对单个的说话人建模的精度，因此这种识别系统的通用性好、应用面广，具有更广阔的研究前景。　　

　　从图8可以看出，输入的模拟语音信号首先要进行预处理，包括预加重、加窗分帧、端点检测等，接下来就是特征参数提取。特征提取主要是完成基于频谱的特征矢量的计算，最后是训练或识别阶段。在训练阶段，是为每个词条得到一个模型，保存为参考模板;在识别阶段，将待测语音生成测试模板，与参考模板进行匹配，将匹配分数最高的参考模板作为识别结果进行输出。　　

　　LD3320是一颗基于非特定人语音识别技术的语音识别/声控芯片。该芯片集成了语音识别处理器和一些外部电路，包括ADC、DAC、麦克风接口、声音输出接口等。该芯片不需要外接任何的辅助芯片如Flash、RAM等，直接集成在现有的产品中，即可以实现语音识别/声控/人机对话功能。LD3320完成非特定人语音识别，每次识别最多可以设置50项候选识别句，每个识别句可以是单字、词组或短句，长度为不超过10个汉字或者79个字节的拼音串。另一方面，识别句内容可以动态编辑修改，因此可由一个系统支持多种场景。　　

关键词：拟人感官智能语音交互型机器人头部设计

renazan2000

专家

2013-01-07 14:03:04 打赏

2楼

　　1.2非特定语音识别硬软件实现　　

　　本参赛作品的LD3320非特定语音识别核心电路如图11所示，组成LD3320工作核心的需要4大电路，电源供电电路，时钟电路，驻极体浮动电压产生电路和模式选择电路。　　

　　LD3320的数据量较大，利用LD3320配合一颗STM32F103单片机进行数据解析和文件系统搭建。采用Keil环境进行程序编制，程序工程中构建了FAT文件系统，可以读写外部SD卡，支持LD3320语音解码，处理匹配字符串后由串口输出识别标示至核心处理器。

　　2、传感器技术
　　2.1嗅觉实现-气体传感器
　　本机械人采用的是MQ-135气体传感器作为嗅觉传感单元，仿生鼻子器官。MQ-135可广泛用于空气质量检测，其工作原理如下图13所示：　　

　　分析图14，电路图左边圆形电气元器件即为MQ系列的气体传感器探头，内有AB两个电极，当VCC和加热丝一端连接，经过了一个限流电阻R1到地构成了回路，加热丝开始发热，电极信号也开始变化，等到加热稳定后电极信号基本不变。

　　2.2 静电传感器
　　本参赛作品运用自主设计的高灵敏人体触摸电路，该电路体积小巧，可以感知人体静电，从而输出高低电平，我们将其和单片机系统连接，作为触摸开关使用，从而实现触觉功能。　　

　　3、PWM舵机控制技术　　

　　本参赛作品可模仿人类的表情动作，整个机械头部共用了13个舵机，分别控制五官活动，单片机系统要实现对舵机输出转角的控制,必须首先产生基本的PWM周期信号,即产生20 ms的周期信号,其次要调整脉宽,即调节单片机输出PWM信号的占空比。　　

　　单片机能使PWM信号的脉冲宽度实现微秒级的变化,因而具有较高的控制精度,单片机可以通过控制算法将计算结果转化为PWM信号输出到舵机信号线上。但由于单片机系统是数字系统,其工作方式由程序决定,而控制信号的变化完全依靠硬件计数,所以受外界干扰小,系统可靠程度高。在用单片机驱动舵机之前,要先确定舵机的功率,然后选择足够功率的电源为舵机供电,通过计算，系统选用5V 10A的电源。舵机信号控制端则只需要直接连接在单片机I/O口上即可。
　　利用单片机的定时器方式2,,THX被作为常数缓冲器,当TLX计数溢出时,在溢出标志TFX置1的同时,还会自动将THX中的常数重新装入TLX中,使TLX从初值开始重新计数,这样就避免了人为软件重装初值所带来的时间误差,从而提高了定时器的计数精度,因此,方式2特别适合用做对精度要求较高的脉冲信号发生器的设计。因为其计数器只有8位,故最多能装载的计数个数为28= 256个,在12 MHz的晶振频率下,单次最多可计时256Ls。　　

　　4、串口摄像头
　　本参赛作品运用串口摄像头实现其视觉功能。串口摄像头是一款具有视频采集和图像压缩功能的摄像头，它是一个内部含有拍图控制、视频捕捉、图像数据采集、JPEG图像压缩、串口通讯等功能齐全的工业级图像采集设备。串口摄像头一般都带有可选择的红外照明功能，能够实现自动照度补充、远程照明和完全隐蔽照明。　　

　　5、MMS协议图像传输与采集技术
　　本参赛作品利用内置MMS协议的GPRS模块配合摄像头搭建了现场图像采集功能，即为机器人头部的视觉功能。传统的机器人监控系统都是以计算机为核心，通过有线宽带接入技术，对工作人员的要求比较高，多是运用于现代工业生产中的仪器设备监控。而在实际使用中，受到人力物力成本过高等局限。根据GPRS系统和多媒体信息业务(MMS)的特点，本系统利用PT101和PM10作为GPRS核心和图像采集终端，该系统可以实现远程监控并在发生意外状况时发送多媒体短消息，可以扩展为循迹机器人头部和图像采集机器人头部，让监控者直观了解现场状况，并可以通过短信向处理器发送指令控制启动相关设备或通知相关人员。　　

　　作品特色

　　【参赛作品先进性、实用性】：
　　本参赛作品利用非特定语音识别技术、传感器技术、语音信号处理技术、PWM舵机控制技术等技术融合，构建了一个拟人化可感知可运动交互的机器人头部，通过语音交互手段突破了原有传统的交互观念，属于机器人到现实世界的功能研究，未来可以将其应用于机器人循检、电子保姆、机器人服务员、消费玩具、表情机器人、记忆机器人、生命探测、海底图像传送机器人等应用面。

　　【参赛作品创新性】：
　　【1】传统机器人头部只能实现个别运动，单调呆板，本设计利用了三个大扭矩舵机实现脖子的全向运动，模拟出头部上下左右连续运动，利用万向轮配合弹簧圈构成全向支撑和缓力结构，利用8个9g舵机实现五官姿态，实现眼球、眼皮、眉毛、嘴唇、下颚的组合运动。　　

　　【2】可感知环境参量，机器人头部具有视、听、嗅、触等功能，分别采用了图像采集、驻极体、气体传感、静电感应等传感前端。
　　【3】可进行非特定语音识别，将识别结果传送至核心MCU作出识别策略。
　　【4】具有五官执行机构，可发出特定PWM信号控制头部姿态。
　　【5】可利用GPRS和MMS协议采集现场图像与手机终端进行交互。
　　【6】可以进行音频对话和解码，广泛适用于众多人机交互场合。

系统演示视频：http://v.eepw.com.cn/video/play/id/2330

halibote523

专家

2013-01-07 16:16:09 打赏

3楼

机器人的市场价值也是非常之大的

共3条 1/1 1 跳转至页

发新帖

每日签到

有奖活动
「破界·共生」——2026蓝牙技术变革与工程实战思辨会
【“龙虾”创意工坊征集令——用XClaw玩出最出乎意料的智能终端】有奖活动~
2026年“我要开发板活动”第三季，开始了！
硬核工程师专属补给计划——填盲盒
“我踩过的那些坑”主题活动——第002期
【EEPW电子工程师创研计划】技术变现通道已开启~
发原创文章【每月瓜分千元赏金凭实力攒钱买好礼~】
【EEPW在线】E起听工程师的声音！

我要赚赏金打赏帖
【S32K3XX】FlexCAN 模块配置使用被打赏￥30元
【S32K3XX】FlexCAN RAM 资源分配整理被打赏￥25元
【S32K3XX】IPCF 适配核间中断处理被打赏￥21元
【S32K3XX】IPCF 核间通讯模块UNMANAGED方式使用被打赏￥29元
片外存储Flash使用方法(Arduino IDE环境)被打赏￥22元
三分钟快速上手ESP-NOW(ArduinoIDE环境)被打赏￥23元
【S32K3XX】LPSPI参数配置说明被打赏￥21元
在WT9932C61-TINY上实现超声波测距被打赏￥22元
基于WT9932C61-TINY的环境构建及OLED屏驱动测试被打赏￥20元
【S32K3XX】Core-to-Core 中断使用被打赏￥21元

热门分类
STM32	MCU
通讯及无线技术	物联网技术
电子DIY	板卡试用
基础知识	软件与操作系统
我爱生活	小e食堂

拟人感官智能语音交互型机器人头部设计

回复