1. 研究目的与意义
本课题为现代身份认证技术的又一次实践。随着现代人工智能的逐渐发展,大数据的普及,人们开始研究使用神经网络开始分析数据,从中衍生出一个新的科研方向:身份认证技术。
现代身份认证技术目前有大家说熟知的人脸识别,其通过人脸面部的五官分布、皱纹、斑点等来判断一个人的年龄、男女、美丑度等。同时还有例如微软正在推广的虹膜识别、科大讯飞推出的声纹识别等。
2. 研究内容和预期目标
Windows Hello 是 Microsoft(下简称微软)公司在 2015 年 3 月 8 日更新的 Windows10中的一项新功能(详情可以点击:链接)。它的主要功能是通过在微软公司购买的 WindowsHello 设备与当前使用者机器相连接,每当用户开启电脑时, Windows Hello 通过设备采集用户的指纹或面部信息,进行用户的识别,从而登陆到 Windows 系统开始工作。这样的认证方式使得用户不需要再花费时间去输入密码,从而快速的进入工作状态。但是这样的认证方式使得用户需要花费一笔钱去购买一套支持 Windows Hello 的设备。而本课题采用的方法只需要使用电脑本身自带的麦克风或市场上任意一款麦克风即可使用。成本低廉。
本课题采用声纹识别的方式,通过麦克风将用户登陆前所说的话记录下来,通过语音信号的分帧与加窗,再经过使用短时过零率与短时能量的双门限检测法进行端点检测,再经过 Mel 滤波器计算出 Mel 频率倒谱系数,再将 Mel 频率倒谱系数放入 GMM 高斯混合模型中利用 k-means 算法估计出 GMM 的参数,利用 GMM 的参数再计算出为某个待测语音的识别概率。从而判断出当前的说话人为语音库中的某个使用者。
3. 国内外研究现状
上个世纪 30 年代,伴随着信息技术和计算机技术的发展,通过仪器可以实现说话人信息的识别。声纹的概念最早由 Bell 实验室的 L.G.Kesta 在观察语谱时提出的。人们的研究中心从听音识别和人耳的听辨实验转移到提取有利的声纹特征上来。
上个世纪 40 年代至 70 年代是声纹识别技术的创新阶段, Bell 实验室的 S.Pruzansky 提出了基于模式匹配和概率统计方差分析的说话人识别方法,实现了人耳听辨到自动识别技术的越变,各国的专家学者开始研究提出了倒谱技术和线性预测分析技术。
4. 计划与进度安排
起止日期 | 毕业设计(论文)工作进度(主要内容、完成要求) |
2022.12-2022.1 | 收集有关声纹识别的相关论文与参考资料 |
2022.1-2022.2 | 完成语音信号的初处理工作,完成语音信号提取 Mel 倒谱系数的工作 |
2022.2-2022.3 | 完成语音信号训练模型的建立,完成语音信号训练模型的建立 |
2022.3-2022.4 | 完成语音信号的识别过程,完成语音信号的实际应用程序 |
2022.4-2022.5 | 完成课题论文 |
5. 参考文献
数据库名称:中国知网
检索策略:声纹识别
[1] VQ 声纹识别算法和实验[2] 采用 DTW 算法和语音增强的嵌入式声纹识别系统_周跃海[3] 基于 GMM 模型的声纹识别模式匹配研究[4] 基于 MFCC 的声纹识别系统研究_王正创[5] 基于 VQ 和 GMM 的实时声纹识别研究[6] 基于 VQ 和 GMM 的双层声纹识别算法[7] 基于高斯混合模型 GMM 的说话人识别方法_臧晓昱[8] 基于高斯混合模型的声纹识别方法及系统[9] 基于高斯混合模型的语音性别识别[10] 基于声纹识别的嵌入式防盗系统[11] 基于声纹识别的说话人身份确认方法的研究_周雷[12] 声纹识别技术及其应用_杨阳[13] 声纹识别系统关键技术研究_裴鑫[14] 声纹识别系统原理及其关键技术_朱浩冰[15] 一种基于感知特性的鲁棒性语音认证算法_古今[16] 语音感知认证的关键技术研究_古今[17]Voice Resognition Algorithms using MFCC[18] 混合 MFCC 特征参数应用于语音情感识别[19] 基于 MFCC 的说话人识别系统_郭春霞[20] 基于 MFCC 的语音情感识别[21] 基于 MFCC 和 GMM 的说话人识别系统研究_丁爱明[22] 基于 MFCC 和双重 GMM 的鸟类识别方法[23] 基于端点检测和高斯滤波器组的 MFCC 说话人识别[24] 说话人识别中改进的 MFCC 参数提取方法[25]GMM:高斯混合模型[26] 高斯混合模型的背景建立
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。