基于非特定人语音识别芯片的技术方案

XJzy · 发表于 2015-12-7 23:16:00

[导读] 为进一步提高模拟训练的训练效果，利用智能语音芯片设计开发了某模拟训练器的示教与回放系统。该系统综合运用语音识别、声强检测、语音合成、数据记录等手段，完成对操作过程的实时记录与回放，取得了良好的训练效果。该系统也可以运用到便携式设备上，具有广阔的应用前景　0 引言

　　随着高新技术在军事领域的广泛运用，武器装备逐步向高、精、尖方向发展。传统的军事训练由于训练时间长、训练费用高、训练空间窄，常常不能达到预期的训练效果，已不能满足现代军事训练的需要。为解决上述问题，模拟训练应运而生。

　　为进一步提高训练效果，本文利用智能语音交互芯片设计了某模拟训练器的示教与回放系统。示教系统为操作人员生动的演示标准操作流程及相应的操作现象，极大地缩短了对操作人员的培训时间，提高了培训效果。回放系统通过记录操作训练过程中各操作人员的口令、声音强度、动作、时间、操作现象等，待操作训练结束后通过重演训练过程，以便操作者及时纠正自己的问题。示教系统也可理解为对标准操作训练过程的回放。该系统不需要虚拟现实技术的支持，在小型的嵌入式系统上就可以实现。

　　1 系统原理

　　该模拟训练器由一台测控计算机和多台从设备组成。如图1所示。在此仅对一台从设备进行介绍，其硬件系统主要由测控计算机、Arduino mega2560 控制器、语音识别单元、声强检测单元、语音合成单元、面板控制单元、仪器面板等组成。面板控制单元较为复杂，包含多种控制电路，在模拟训练中负责该从设备在Arduinomega2560 控制器的控制下完成整个训练过程，在示教与回放系统中完成对刚才操作训练操作现象的重演，其具体电路设计在此不做介绍。

　　语音识别单元负责识别操作人员的操作口令；声强检测单元负责检测声强大小并以此作为判断是哪台从设备操作人员口令的依据；Arduino mega2560控制器负责监视仪器面板各元件的状态来识别操作人员的动作，从而完成对操作训练过程的记录。各仪器的操作现象根据操作动作事先编制无需记录。在操作回放过程中，测控计算机根据所记录的数据，通过控制相应从设备的Arduino mega2560控制器重现所记录的操作过程。

　　2 单元系统设计

　　2.1 语音识别单元设计

　　目前，语音识别技术的发展十分迅速，按照识别对象的类型可以分为特定人和非特定人语音识别。特定人是指识别对象为专门的人，非特定人是指识别对象是针对大多数用户，一般需要采集多个人的语音进行录音和训练，经过学习，从而达到较高的识别率。

　　本文采用的LD3320语音识别芯片是一颗基于非特定人语音识别（Speaker？Independent Automatic SpeechRecognition，SI？ASR）技术的芯片。该芯片上集成了高精度的A/D 和D/A 接口，不再需要外接辅助的FLASH 和RAM，即可以实现语音识别、声控、人机对话功能，提供了真正的单芯片语音识别解决方案。并且，识别的关键词语列表是可以动态编辑的。其语音识别过程如图2所示。

　　语音识别单元采用ATmega168 作为MCU，负责控制LD3320完成所有和语音识别相关的工作，并将识别结果通过串口上传至Arduino mega2560 控制器。对LD3320芯片的各种操作，都必须通过寄存器的操作来完成，寄存器读写操作有2种方式（标准并行方式和串行SPI方式）。在此采用并行方式，将LD3320的数据端口与MCU的I/O口相连。其硬件连接图如图3所示。

　　语音识别流程采用中断方式工作，其工作流程分为初始化、写入关键词、开始识别和响应中断等。MCU的程序采用ARDUINO IDE编写［5］，调试完成后通过串口进行烧录，控制LD3320完成语音识别，并将识别结果上传至Arduino mega2560控制器。其软件流程如图4所示。

基于非特定人语音识别芯片的技术方案

浏览过的版块