1. 研究目的与意义
语音识别是应用多学科交叉知识将语音信号转换为对应文字的技术,目的在于用声音实现人机交互。
汉语、英语等主流语言的语音识别已取得很多成果,实验室环境下的识别效果可以满足人机交互系统的需要,在一些领域被广范应用。
语言是人类相互交流最常用、最有效、最重要和最方便的通信形式,语音是语言的声学表现,与机器进行语音交流是人类一直以来的梦想。
2. 课题关键问题和重难点
在HTK平台上进行测试,找出影响识别率的几个干扰因素和解决方法。
但是,这与实现真正的人机交流还有相当遥远的距离。
目前,计算机对用户语音的识别程度不高,人机交互上还存在一定的问题,智能语音识别系统技术还有很长的一段路要走,使用语音输入的过程中通过自然语言说出指令来修改、添增、删除文字等操作。
3. 国内外研究现状(文献综述)
[1]王川,段德全,王晓东.基于改进的POS和HMM的Web信息抽取算法[J].河南师范大学学报(自然科学版),2010,38(5):65.[2]魏 巍,张海涛.一种基于HTK的数字语音识别系统[J].计算机系统应用,2011,20(9):17.[3]李冠宇,孟猛.藏语拉萨话大词表连续语音识别声学模型研究[J].计算机工程,2012,38(5):189.[4]周楠 ,基于深度学习的藏语非特定人连续语音识别研究[J] 中央民族大学 2017[5]裴春 藏语数字语音识别仿真实验及测试方法分析 宝西藏大学藏文信息技术研究中心 2016 05[6]刘晓凤 藏语语音深度特征提取及语音识别研究 中央民族大学 2016 0510藏语语音识别:随着对语言信息处理研究工作的不断深入,藏文信息处理技术也从文字处理逐步转向语言信息处理。
藏文自动分词和词性标注是进行藏语语义理解、藏文信息检索、藏语与其他语种之间的机器翻译等的首要问题。
藏语是我国一支重要的少数民族语种,藏语语音识别技术的研究与发展不仅可以使得不同民族之间的语言进行无障碍的沟通交流,也可以促使藏区经济、文化、教育等各领域的发展。
4. 研究方案
(1) 预处理,对于输入原始语音型号的相关处理,筛选其中有效的信息并且删去背景噪声,进行语音的检测(2) 特征提取,用于计算语音参数,并且进行相关计算,给出特征参数(3) 将此模块进行多次反复训练,提取有关参数,修正并确定语音的数据库(4) 将输进去的语音的相关参数与之前给出的参考的数据库中的语音相互比较,最后很具一系列的知识得出最终答案
5. 工作计划
第1周,查找文献和翻译文献的相关内容,了解需要用的工具和大体的方向。
第2周,撰写开题报告,根据任务书,填写要求的内容。
第3周,总体设计和规划,确定研究的方向和思路。
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。