基于隐马尔可夫模型的声纹识别方法的研究开题报告

 2022-12-03 10:53:36

1. 研究目的与意义

对于声纹识别的研究要追溯到上个20世纪30年代。早期的工作主要集中在人耳听辨实验和探讨听音识别的可能性方面。此后,产生了语谱图描记技术(sonography),为语音的三维图表征奠定了声纹分析技术的基础。这一研究经过40年代到70年代的逐渐积累过程,形成了靠声纹嗓音识别罪犯的声纹(voice recognition)鉴定技术,形成了声纹识别的研究潮流。其间的工作主要集中在各种识别参数的提取、选择和实验上,并将倒谱和线性预测分析等方法应用于声纹识别。

20 世纪60年代至今,声纹识别的研究重点转向对各种声学参数的线性或非线性处理以及新的模式匹配方法上,如动态时间规整、主成分分析、隐马尔可夫模型、神经网络和多特征组合等技术。

此次设计就是研究基于隐马尔可夫模型(HMM)技术的声纹识别的方法。包括语音信号的采集、预处理、建模、提取特征参量,以及模型的优化,最后进行声纹识别。语音信号的采集需要A/D变换,可直接利用声卡实现,其他环节都由软件实现。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

本课题主要是对声纹进行检测,将检测结果报告出来。具体工作内容安排如下:

声纹数据的分类及前期特征提取。声纹相关语料的收集;声纹相关语料的分类;声纹相关语料的标注;根据标注语料对声纹语料进行语音激活检测(voice activity detection ,VAD);对语料进行预加重、分帧及加窗处理;将每一帧数据进行相关特征提取;提取每一帧的能量作为特征参数;对数据进行特征选取;对相关特征进行组合。

基于隐马尔科夫模型(Hidden Markov Model,HMM)的声纹哭声检测。隐马尔科夫模型的训练代码的编写;隐马尔科夫模型测试代码的编写;数据统计代码的编写;实验参数的调整;实验结果的分析。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

近年来,隐马尔可夫模型(HMM)在语音信号处理上得到了广泛应用。由于HMM既能用短时模型---状态解决声学特性相对稳定段的描述,又能用状态转移规律刻画稳定段之间的时变过程,所以能统计地吸收发音的声学特性和时间上的变动。因此,在现有多种不同的说话人识别模型中,HMM已成为目前最佳的说话人识别处理模型。在与文本有关的说话人识别中,最好的结果是用连续HMM(CHMM)对说话人特征建模而取得的。对于与文本无关任务来说,HMM模型的瞬态结果是不需要的,所以各态历经HMM(Ergodic HMM)常被使用。另外,1状态CHMM(也称高斯混和模型,GMM)也被广泛用作说话人模型并且取得了比多状态CHMM更好的结果。和以语音内容时间序列为识别对象的语音识别不同,说话人识别主要是识别说话人特征,因此怎样的特征参数以及HMM结构可以最佳地表现说话人信息是研究的重点,而且说话人信息特征对时间变化的敏感性以及在说话人识别系统中模型训练数据不可能很多等原因,使得说话人识别HMM中的研究课题和语音识别有所不同。

说话人识别HMM的学习方法

由于在说话人识别系统中,登录的说话人的发音数据都比较少,所以用于各说话人HMM训练的语料就少,给HMM的学习带来一定困难。为了建立各说话人的高精度的模型,已有各种说话人HMM的学习方法被提出。这里介绍一下有关文献提出的两种类型的模型训练方法,一种是仅利用少量的登录说话人学习数据的学习方法;另一种是利用非特定人语音HMM和登录说话人学习数据的学习方法。在第一类型学习方法中,首先利用说话人的所有发音数据建立一个和基元类别无关的话者HMM,然后以此为初始模型,根据各说话人的训练语音文本内容,利用连接学习法,仅仅对各高斯分布的权值进行再推定,而均值和方差不变。因为参加学习的数据少,所以基元模型不能分得太细。第二类型学习方法是利用非特定人基元HMM和各话者HMM进行组合的方法。例如设非特定人基元HMM是3状态4混合高斯分布CHMM,话者HMM是1状态64混合高斯分布CHMM。先利用非特定人HMM收集对应于每一状态的学习数据,利用这些数据对说话人HMM的各高斯分布的权值进行再推定,并且把每一状态和相应的推定后的话者HMM置换,得到各话者基元HMM(3状态64混合高斯分布CHMM),转移概率保持不变。然后以此作为初始模型,根据各说话人的发音文本内容,利用连接学习法,再一次对各话者基元HMM的各高斯分布的权值进行再推定。以上仅仅对高斯分布的权值进行再推定是为了保留说话人特性不变。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

声纹识别系统一般由预处理、特征提取、建立模型、模式匹配、判决等部分组成。

1.预处理:

预处理,包括采样、量化、去掉无声段和噪声、归一化、预加重、加窗等。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

第一周:查找文献资料,对基于HMM法的声纹识别技术有个大体的了解;

第二周:对课题中涉及的知识作深入掌握,掌握参数分析方法、基于HMM法的声纹识别技术等;

第三周:制定研究计划,写开题报告;

剩余内容已隐藏,您需要先支付 1元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。