基于VQ的婴儿哭声中的情感与需求信息识别开题报告

 2022-11-11 10:59:21

1. 研究目的与意义

由于时代的进步,科技的发达,人们的生活水平日益提高。机器的出现使人们的许多工作得到了替代,这样,机械在婴幼儿领域也变得不可忽视。为了使人们更快更清楚的了解到新生婴儿的需求,从而减轻自身压力,使得可以将更多的精力放到工作上去,本课题将使用《基于VQ的婴儿哭声中的情感与需求信息识别技术》来进行对婴儿哭声的识别和检测,父母从检测的结果中知道婴儿的需求,这样就可以更好的照顾,同时,不用浪费大量时间导致工作压力增大,大大提高了时间利用率。

哭声作为婴儿与外界交流的重要方式之一,其中蕴含着丰富的、与婴儿的心理和病理状态有关的信息。根据资料显示,不同婴儿基于某种特定需求或状态的哭声存有一定的共性。本文根据婴儿哭声的声学特征,研究与其实际情感或需求之间的客观对应关系。依据从婴儿哭声中提取的能区分不同情感与需求的特征参数,通过运用矢量量化模型(VQ)算法来实现对哭声进行模式识别,判断婴儿哭声的不同原因,如饥饿,不适困倦等。

本课题的成果可以更好的帮助父母观测婴儿的状况,及时帮助父母更好地照顾新生婴儿,达到优生优育、促进国家发展的目的。所以研究婴幼儿哭声具有很大的价值意义。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

目前主要有以下几个难点:

(1) 数据的采集与筛选。因为人们对于婴幼儿声音的研究没有足够的重视,从而导致至今没有一个比较统一、完整的婴幼儿语音库。所以,要对此做研究,就必须建立一个规模相对中等,语音效果比较好的婴儿语音库。因此,应该和相关公司、医院及婴幼儿机构进行联系并做相应的数据采集及标注工作。

(2) 特征的筛选。语音特征可以分为不同特征,包含时域特征、频域特征、时频域特征及长时特征等,因此如何选择最有效的特征组合也是一大难题。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

由于最近几十年信息技术的发展,大规模集成电路及大型计算机的出现,给像声音事件检测等需要大量计算的算法带来了福音,使其研究及应用成为了可能。并且,随着隐马尔科夫模型与高斯混合模型的理论成熟,其应用于语音信号处理成为了可能。随着语音识别技术的实用化,隐马尔科夫模型和高斯混合模型得到不断改进与完善,因此,在婴幼儿哭声识别领域使用HMM与GMM更是如虎添翼。进入21世纪尤其是近几年以来,深度神经网络的理论基础日趋成熟,以及以谷歌和微软为首的企业将深度学习源码进行开放,这都给我们在婴幼儿哭声检测中使用深度神经网络提供了极大的便利。对于特征提取部分,所使用的语音的特征如梅尔倒谱系数,能量等特征早已应用于语音识别等领域。因此,本文所使用的特征提取、GMM模型、HMM模型及DNN模型已有成熟的理论支持,本课题的可行性是不言而喻的。

婴儿哭声识别算法是基于智能婴儿摇篮的实际应用而提出的。婴儿哭声识别可算做是语音识别的一种,它是根据婴儿发出的哭声,利用计算机来辨认。婴儿哭声识别系统的任务是通过对收集到的语音信号进行分析,确定婴儿是否处于哭状态。识别时根据所得到的待识别语音信号的特征参数序列,由系统对这些参数和已有模型之间的相似程度进行比较,并根据比较的结果进行判断。婴儿哭声特征的提取对识别结果的有效性是至关重要的。在实际应用中,一般多选取MFCC(Mel-Frequency Cepstral Coef-ficients)作为特征矢量来使用。因为MFCC参数从人耳对频率高低的非线性心理感觉角度反映了语音短时幅度谱的特征,和传统的线性预测倒谱系数LPCC相比,其识别性能和抗噪性能具有较强的优势。

特征参数提取MFCC(Mel-Frequency Cepstral Coefficients):Mel频率倒谱参数。与普通实际频率倒谱分析不同,Mel频率倒谱参数是基于人耳听觉特性提出来的,因此其与声音的频率并不成线性正比关系。目前MFCC已经广泛地应用在语音识别领域。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

具体论证法案,工作内容如下:

(1) 婴幼儿数据的分类及前期特征提取。婴幼儿相关语料的收集;婴幼儿相关语料的分类;婴幼儿相关语料的标注;根据标注语料对婴幼儿语料进行语音激活检测(voice activity detection ,VAD);对获得的语料进行预加重、分帧和加窗处理;并将每一帧数据采取相关特征提取;提取每一帧的能量当作特征参数;对数据进行特征选取;对相关特征进行组合。

(2) 基于VQ技术的婴幼儿哭声检测。VQ的训练代码的编写;VQ测试代码的编写;数据统计代码的编写;实验参数的调整;实验结果的分析。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

六、工作计划

第一周:查找文献资料,对婴儿哭声辨识技术有个大体的了解;

第二周:对课题中涉及的知识作深入掌握,掌握参数分析方法、VQ方法和婴儿哭声辨识技术方法等;

第三周:制定研究计划,写开题报告;

第四周:学习程序语言以及编程方法;

第五周:练习编程; 第六周:实现参数分析方法软件部分;

第七周:实现VQ方法软件部分;

第八周:实现婴儿哭声辨识技术方法软件部分;

第九周:实现系统软件联调的主要功能;

第十周:实现软件的可视化界面;

第十一周:程序修改和完善,结果分析;

第十二周:写论文以及准备答辩;

第十三周:写论文以及准备答辩;

第十四周:验收程序,进行毕业设计答辩

剩余内容已隐藏,您需要先支付 1元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。