1. 研究目的与意义
基于语音处理技术的交互式计算机辅助语言学习系统是目前语音技术的研究热点之一,它可以改变现有的语言学习环境和教学模式,极大地提高语言学习的效率。为了能够将英语机考考试模式应用在大学英语口语测试中,因此有必要对英语评分的方法和原理进行相关的研究。为了能够迎合大学英语等级考试的教学改革,对应试者的英语口语发音进行机考评分将是最终趋向,若能攻克相关技术难题将会具有良好的市场应用前景。针对大学英语四六级考试,对大学生的英语口语发音水平进行网络机考,给一个客观合理的评价分数来反映应试者的英语口语发音水平。目前市场上平板电脑很流行,若能将该技术嵌入到平板电脑上做出一个英语口语发音评分的应用软件,类似于汉语学习机的那种形式,在国内尤其是在中小学生领域会有很好的市场前景。此外还有很多很有应用前景的例子在这不一一列举,可见该课题还是很有应用前景的和很值得深入研究的。
2. 课题关键问题和重难点
1. 英语口语预处理及端点检测
2.英语口语发音特点和英语口语信号处理的基本理论
3.英语口语特征参数的提取,基于自相关与平均幅度差法的基音提取,频域基音提取方法
3. 国内外研究现状(文献综述)
目前国内各个研究院所和公司对语音方面的研究投入已趋于成熟,在计算机领域、声学领域和应用语言学方面各领风骚。现已出现了以中科院、清华大学、浙江大学研发为主的国内领先软件。以第一代智能语音交互技术为例。仅仅能实现一个对用户发音的简单综合评分,无法实现非特定人、非特定环境、连续语音的精细评测、没有针对性反馈、指导,更无法有人机的交互,因此无法根本满足需求。这成为教育行业内口语发展的瓶颈和国际难题,致使大量市场需求无法得到满足。2007年广东首次实施普通高校英语口语网考。自2010年起,江苏省的中考也开始试行英语口语网考。但口语测试的重点仍放在模仿能力的测试,实质上国内大都受限于智能语音技术与国际的差距,并没有利用语音技术,而是采用录音让老师通过网络远程打分。
近几年国外相关的研究主要集中于英语口语发音评分与发音错误侦测。评价英语口语发音主要依据对数似然度,后验概率等一些机器分数而这些机器分数并非人们主观能接受。在发音错误方面主要研究了将音素发音成另一音素的概率大小。而这些机器分数并不适合表达人们主观能接受的客观分数。以S.M.Witt为代表,他在2000年提出了基于对数似然度的评分方法,对英语句子中的每个音素做评分。SeciichiNakagawa等在2003年通过测试对数似然度,最大后验概率,音素识别率,语速等来作为评分的的依据。最后实验发现通过结合对数似然度,音素识别率和语速能够获得与专家较高的相关性。目前评价口语发音的方法已有很多,比较通用的有:对发音段用HMM训练处的模型进行对数似然度打分,对数后验概率打分等。对超音段进行评价的主要方法有段时长打分,语速打分等。所有这些分数多数将标准英语口语发音作为参考模板,通过与测试口语计算相似性来获得,在得到机器评分后。通常是通过把它与专家组的评分结果做一致性和可靠性的测试来评价发音。
许多国外的大学早已对英语口语展开了评估研究,甚至出现了比较成熟的应用软件。例如卡梅基隆大学语言技术研究院的的Fluency系统,美国SRI公司的EduSpeak评测平台,CMU大学的sphinx3以及新版本sphinx4,以香港科技大学研发的的Plaser平台作为国内的典型代表,但国内主要针对汉语口语的发音进行评分研究。
4. 研究方案
主要研究内容分为以下几部分:
1.学习英语口语发音特点和英语口语信号处理的基本理论和研究英语口语发音的一些基本特点和基本知识。
2.掌握端点检测,英语口语的基音提取,特征参数MFCC以及非均匀线性预测倒谱系数的提取方法。
5. 工作计划
第一周:查找文献资料,了解什么是数学建模,什么是英语口语发音处理的参数和算法,并了解MATLAB语言工具,以及程序设计流程;
第二周:课题中涉及的知识作深入了解,掌握MATLAB语言工具,以及程序设计流程;
第三周:制定研究计划,写开题报告;
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。