1. 研究目的与意义
手写体数字识别是模式识别领域中的一个重要课题。该课题的研究已有30多年的历史,是多年来的研究热点。手写体数字识别正越来越成为当前模式识别和人工智能领域的一个研究热点。尽管人们对手写数字的研究己从事了很长时间的研究,并己取得了很多成果,但到目前为止,机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题,所以对手写数字识别的进一步研究,寻求如何更高效更准确更节能地实现手写数字的自动录入和识别的解决方案对提高经济效益、推动社会发展都有深远的意义。
目前,手写体数字识别已成功应用到邮政分拣系统、银行管理系统等许多领域。利用本课题不但可以熟悉神经网络的工作原理,而且可以熟悉matlab编程语言,从而为以后的工作打下坚实的基础。
2. 课题关键问题和重难点
手写体数字识别的过程一般分为预处理、特征提取、数字串的分割、分类器、等模块。原始图像是通过光电扫描仪,CCD器件或电子传真机等获得的二维图像信号。预处理包括对原始图像的去噪、倾斜校正或各种滤波处理。手写体数字具有随意性,其字符大小、字间距、字内距变化很大,分割难度较大。手写数字串的分割是其中最重要的环节,是制约识别率的瓶颈所在。去噪是预处理中极重要的环节。预处理中的规格化也不仅仅是同比例的放缩,它不仅要保持拓扑不变,更要最大限度地突出所取特征。在众多应用环境中,特征提取、分类器、多分类器集成是整个识别系统的核心。大体上来说特征可以分为结构特征和统计特征两类。由于分类器的选择取决于所提取的特征,因此相应的识别方法便有结构方法和统计方法。总之,从手写体数字识别原理可见,手写体数字识别技术主要包括以下几点:1)图像预处理,包括彩色图像转成灰度图像、二值化,归一化,滤除干扰噪声等;2)基于数字图像的特征选择和提取;3)数字串的分割;4)模式分类识别。其中,第二和第四部分是手写数字识别的重点,直接关系到识别的准确率和效率,也是本课题研究的重点所在。
3. 国内外研究现状(文献综述)
手写体数字识别是多年来的研究热点,也是一项极具研究价值的课题。手写体数字识别研究的最终目标是设计出速度快、精度高的识别算法并运用到实际工作中。一般情况下,当涉及到数字识别时,人们往往要求识别器有很高的识别可靠性。因此针对这类问题的处理系统设计的关键环节之一就是设计出高可靠性和高识别率的手写体数字识别方法。在过去的数十年中,研究者们提出了许许多多的识别方法。然而,到现在为止,还没有哪个手写体数字识别器达到完美的识别效果。
将神经网络应用于手写体数字识别是神经网络应用最为成功的方面之一,它为手写体数字识别提供了一种新的,行之有效的方法。人工神经网络在模式识别问题上,相比其他传统方法有其优势:要求对问题的了解较少;可以对特征空间进行较复杂的划分;适用于高速并行处理系统来实现。
人工神经网络是近年发展起来的模拟人脑生物过程的人工智能技术.它由大量的、同时也是很简单的处理单元(神经元)广泛互连形成的复杂的非线性系统。它不需要任何先验公式,就能从已有数据中自动地归纳出规则,获得这些数据的内在规律,具有很强的非线性映射能力,特别适合于因果关系复杂的非确定性推理、判断、识别和分类等问题.随着计算机科学的高速发展,人工神经网络技术在语音识别、模式分类、自动控制等领域取得了成功的应用。神经网络的实现方案可分为基于传统计算机技术和基于直接硬件实现,但目前最常用的方法还是软件模拟.随着ANN技术的发展,涌现出许多ANN建模仿真软件和仿真语言,这些工具软件使我们在应用ANN技术时避免陷入复杂数学算法的推导和计算,提高效率,并对ANN技术应用的推广都起到了不可低估的作用。MATLAB提供的神经网络工具箱就是一个重要代表,它是以人工神经网络理论为基础,用MATLAB语言构造出了该理论所涉及的公式运算、矩阵操作和方程求解等大部分子程序,以用于神经网络设计和训练.熟悉神经网络工具箱的使用,可以进一步掌握ANN的建模方法,并能够以较丰富的界面形式来表现ANN的运算和结果.用户只要根据自己的需要调用相关函数,免除了自己编写复杂而庞大的算法程序的困扰.
4. 研究方案
本课题要求利用matlab编程语言编写一个神经网络的分类程序,然后利用教师给定的训练集训练这个神经网络,最后使用训练好的神经网络测试教师给定测试集的识别率。
将教师给定的手写体数字图像向量化;
向量化的数据集划分为训练集和测试集;
5. 工作计划
第1周准备开题报告,阅读并摘要与课题有关的中文资料,收集相关设计资料。
第2周准备开题报告,阅读并摘要与课题有关的中文资料,收集相关设计资料。
第3周完成开题报告,完成与课题相关的中文资料摘要。
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。