1. 研究目的与意义
随着几十年的飞速发展,我国现已进入高速发展的信息化社会。
其中文字作为最主要的信息载体,在信息处理更是占据了主要地位,因此文字的录入变得尤为重要。
但过去人工输入文字的方式存在效率低、成本高等问题。
2. 课题关键问题和重难点
本课题使用TensorFlow设计一个神经网络来进行文字识别,现已有许多文字识别。
首先这是一个离线项目与在线手写输入不同,无法获得输入的笔画顺序、结构,只能对现有的图像识别。
另外就文字识别还有以下几个问题必须解决:1.在输入文字前,进行预处理来使原始图片更加清晰2.如何合理设计神经网络结构,设定参数,来实现更高的准确度 3.进一步的,对于受损的图片如何提高其识别准确度实际操作时又有几个问题需要解决:1.汉字数量远多于英文,样本数量与训练时间大大增加,识别正确性很难保证;其次汉字笔画数多,在提取特征方面是个巨大的问题;在实际生活场景中书写的汉字,并非所有按照标准汉字书写,各人对汉字都有不同的书写风格和结构改变或笔画省略,这对汉字识别应用于实际生活中提出了极高的挑战。
3. 国内外研究现状(文献综述)
手写文字识别研究现状文字识别自1929年就已经诞生,但识别种类少,且手写体识别率极低。
因为手写字体并非一个线性问题,无法通过直接与标准字库直接对比得到结果。
直到神经网络以及深度学习的出现,文字识别有了大步的提升。
4. 研究方案
1.实验环境Anacondas搭建环境;学习框架使用TensorFlow,以实现可视化;开发语言选用python,降低开发难度和代码量;开发环境为Windows 10;2.汉字数据集手写汉字数据集选用MNIST、HWBD1.1,以这两个字库作为数据集能与更多研究结果对比。
其中60%作为训练集,20%作为验证集,20%留作测试集。
实验结果理想后可用现场拍摄的图片作为测试样本。
5. 工作计划
第3周 搭建并调试项目所需环境,学习并使用python、Tensorflow进行基本的开发。
掌握python语言的基本语法规则以及Tensorflow的特性。
第4周 根据毕业设计题目进行神经网络学习,简要了解深度学习,理解卷积神经网络中所使用的输出层神经元计算方式和反馈计算、梯度下降等函数公式。
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。