1. 研究目的与意义
背景:近年来,随着网络信息时代的来临,互联网上充斥着大量的信息,人们迫切地需要更加方便的方式来获取信息,而传统的搜索引擎也开始无法满足用户的需求,这就促进了对自动问答技术的研究开发。每年一度的TREC大会即文本信息检索大会上,自动问答技术的研究一直是关注度最高的主题之一,国内外越来越多的机构参与到自动问答技术的讨论中,交流自动问答技术的发展。
美国的麻省理工学院(MIT)早在1993年就在互联网上发布了一套自动问答系统Start,是发布在网络上的第一个自动问答系统,通过对用户提出的问题进行语义分析等处理,直接回答用户的问题,涉及历史、地理、科技等多个方面。此外,同样是美国的密歇根大学在2001年也发布了一个较为成熟的自动问答系统AnswerBus,这个自动问答系统的特点在于可以支持多语种进行提问和回答,目前可以支持英语、法语、德语、葡萄牙语、西班牙语、意大利语这六种语言,同样已经应用于多个领域去处理并回答用户的问题。此外,如微软公司的小冰,近年来也逐步拥有了一定的市场知名度。
在国内,虽然对于自动问答技术的研究起步比较晚,但是近几年国内对自动问答系统的研究也越来越火热,越来越多的大学和公司参与到自动问答系统的研发中。目前有哈尔滨工业大学的ITNLP,复旦大学的FudanNlp以及中国科学院的ICTCLAS等。国内也有很多的公司在自己的产品中融入了自动问答系统,比如腾讯目前用于客服系统的阳光小Q,理解并处理用户的一些问题。
2. 研究内容与预期目标
研究内容:本实验主要是研究自动问答系统,就是指用户以自然语言提问的方式提出信息查询需求,系统依据对问题的分析,从各种数据资源中自动找出准确的答案。从系统功能上讲,自动问答分为开放域自动问答和限定域自动问答。具体方法就是,运用一些现有的机器人接口,如小冰,图灵机器人,阳光小Q等,当用户向每个机器人提出问题时,将它们反馈出来的问题与准备的标准答案作比较,选出可靠性最高的设置权重。系统选择最佳答案的过程就是运用语义相似度匹配,这是本系统研发的一个难点。如果三个或多个机器人反馈的答案中有两个或两个以上的答案相似时,可以以它作为本问题的答案。
预期目标:实现一个智能聊天机器人系统,尽量使机器人返回的答案有一定的可靠性,保证系统的质量。
具体目标:
3. 研究方法与步骤
研究方法:
本论文首先对基于Java语言的自动问答机器人系统进行了需求分析,从系统开发环境、系统目标、设计流程、功能设计等几个方面进行系统的总体设计,使用Java语言设计了自动问答机器人系统,通过讯飞语音输入法实现语音转文字,通过图灵机器人开发接口实现智能聊天功能, 系统主要实现了智能聊天,自动问答等功能。
4. 参考文献
[1] 陈勤, 自然语言处理基本理论和方法[M], 哈尔滨工业大学出版社,2013.08.
[2] 牟孝金, 洪紫洲, 李维良. 智能聊天机器人系统:, CN104615646A[P]. 2015.
[3] 姜姝姝. 俞志晨:图灵机器人是智能大脑[J]. 机器人产业, 2015(3):116-120.
5. 工作计划
(1) 1月11日至2月15日 分析课题,查找资料。
(2) 2月16日至2月28日 完成需求分析。
(3) 3月01日至3月16日 完成开题报告。
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。