基于HMM的婴儿哭声中的情感与需求信息识别开题报告

 2022-11-11 10:59:23

1. 研究目的与意义

随着我国科技及经济的发展,人们的生活日益快捷简便。但随着我国人口红利的消失,劳动人口及劳动成本的增加,需要更多的机器来替代本属于人的工作,机器在婴幼儿健康成长领域的作用亦不容忽视。为了给新生婴儿提供更好的生活质量,为了减轻父母照顾婴儿的成本从而有更多的精力去工作、去推动经济的发展,本课题使用高斯混合模型、隐马尔科夫模型等方法来对婴儿的哭声进行检测,并将识别结果及时通知父母,这样可以保证父母可以一边照顾婴幼儿,一边进行其他工作,大大提高了时间利用率。该课题的成果可以帮助父母监测婴儿的状况,帮助父母更好地照顾新生婴儿,从而达到优生优育、促进国家发展的目的。因此研究婴幼儿哭声具有很大的价值意义,然而目前在婴幼儿领域的研究,明显存在一下不足:

1.误识率高

在部分研究中,具有婴幼儿哭声的识别率不是很高,误识率却很高的现象--在正常的家居环境中,一些其他声音诸如大人说话声音等亦会被认为是婴幼儿哭声。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

本课题主要是对婴幼哭声进行检测,将检测结果报告出来。具体工作内容安排如下:

婴幼儿数据的分类及前期特征提取。婴幼儿相关语料的收集;婴幼儿相关语料的分类;婴幼儿相关语料的标注;根据标注语料对婴幼儿语料进行语音激活检测(voice activity detection ,VAD);对语料进行预加重、分帧及加窗处理;将每一帧数据进行相关特征提取;提取每一帧的能量作为特征参数;对数据进行特征选取;对相关特征进行组合。

1基于高斯混合模型(Gaussian Mixture Model, GMM)的婴幼儿哭声检测。高斯混合模型的训练代码的编写;高斯混合模型测试代码的编写;数据统计代码的编写;实验参数的调整;实验结果的分析。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

近几十年信息技术的发展,大规模集成电路及大型计算机的出现,给像声音事件检测等需要大量计算的算法带来了福音,使其研究及应用成为了可能。并且,随着隐马尔科夫模型与高斯混合模型的理论成熟,其应用于语音信号处理成为了可能。随着语音识别技术的实用化,隐马尔科夫模型和高斯混合模型得到不断改进与完善,因此,在婴幼儿哭声识别领域使用HMM与GMM更是如虎添翼。进入21世纪尤其是近几年以来,深度神经网络的理论基础日趋成熟,以及以谷歌和微软为首的企业将深度学习源码进行开放,这都给我们在婴幼儿哭声检测中使用深度神经网络提供了极大的便利。对于特征提取部分,所使用的语音的特征如梅尔倒谱系数,能量等特征早已应用于语音识别等领域。因此,本文所使用的特征提取、GMM模型、HMM模型及DNN模型已有成熟的理论支持,本课题的可行性是不言而喻的。

[1] 石自强, 韩纪庆, 郑铁然. 鲁棒声学事件检测综述[J]. 智能计算机与应用, 2012, 2(6):31-35.

[2] 赵力. 语音信号处理第2版[M]. 北京市:机械工业出版社, 2009. 1-4

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

婴儿哭声具有反应婴儿情绪,折射情感与生理需求的重要作用。本课题主张使用科学方案研究婴儿哭声与实际情感需求间的科学互动关系,建立一个较好的婴儿语音库,筛选婴儿哭声中有研究价值的特征参数,判断婴儿啼哭的原因,判别啼哭的情况。

(1)建立婴儿语音库,采集数据标注

(2)筛选语音特征,采用梅尔倒谱系数

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

(1)数据的采集与筛选。由于人们对于婴幼儿声音的研究没有足够的重视,导致至今没有一个比较统一、完整的婴幼儿语音库。因此,要对此做研究,必须建立一个规模相对中等,语音效果比较好的婴儿语音库。鉴于此,应该和相关公司、医院及婴幼儿机构进行联系并做相应的数据采集及标注工作。

(2)特征的筛选。由于语音特征可以分为时域特征、频域特征、时频域特征及长时特征等,因此如何选择最有效的特征组合也是一大难题。在这里,采用最常用的特征如梅尔倒谱系数等作为婴幼儿的特征参数。

(3)高斯混合、隐马尔科夫及深度神经网络模型参数的选择。模型参数决定了婴幼儿哭声识别效果的好坏,有些参数效果极好,有些参数就不那么理想了。为了选择最佳参数,此处将会做一系列的实验并将实验结果进行一一对照。

剩余内容已隐藏,您需要先支付 1元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。