针对特定网页的程序化输入与提交的研究开题报告

 2022-09-06 09:49:28

1. 研究目的与意义

1.本课题研究的背景、目的及意义

I.研究背景

随着Internet的快速发展,Web已经发展成为一种巨大的、分布式的和共享的信息资源。目前Web数据大都以HTML页面的形式出现。由于HTML描述的数据是一种半结构化的数据,这使得由HTML描述的Web页面只适合人类的浏览,应用程序无法直接解析并利用Web上的DOM信息。如何利用程序从海量的信息中快速抽取信息,自动填入到页面中,从而提高人们快速登录网页的效率变得越来越重要。为了增强Web数据的可用性,提供更多的增值服务,出现了Web信息抽取技术。它通过包装(Wrapper)现有的Web信息源,将网页上的信息以结构化的方式抽取出来,为应用程序利用Web中的网页DOM提供了可能,因此有着广阔的前景,是当今数据库领域的研究热点之一。本系统设计了一个基于DOM模型的智能程序化输入与提交系统,做到能够对网页文本进行分析处理、特征提取与选择、文本分类以及页面区域的分割与重构等,从而将有用信息以结构化数据存储在数据库中,并且可以随时应用于针对特定信息查询的应用程序中。

II.研究目的和意义

21世纪是互联网的时代,网络的应用越来越广泛。同时网页的开发过程中存在着诸多共性,相同类型的网页开发也拥有着很大的交集。因此,解析网页DOM结构,将已经存储的信息自动输入到DOM元素中,实现程序化输入与提交。综上所述,进行基于组件的针对特定网页的程序化输入与提交的研究是很很意义的。

针对特定网页的程序化输入与提交有以下三大优势:

(1)提高了用户效率。用户所需输入的信息,将会由程序自动输入,提高了用户的使用效率。

(2)提升了系统的便利性,实用性,可操作性和灵活度,降低了系统的复杂度。实现了不限设备,时间,地点,只需一个账号,便可以在任何设备、时间、地点登录,使用该系统,并且实现特定网页的自动化输入与提交功能。系统设计上切实考虑了用户的需求,真正实现让用户能够随时随使用该系统,这样便能够让系统更容易被用户接受和使用,从而有利于系统更大范围的推广。

(3)减少点击次数。实现程序的自动提交功能,减少了用户的点击次数,增强了用户体验度。在设计原则中,尽量减少点击次数,是当今程序设计的趋势。

因此,针对特定网页的程序化输入与提交还是很有发展前景的。

2. 研究内容和预期目标

2.本课题主要研究内容和预期目标

I.研究内容

学习、体验网页的结构分析,在此基础上实现程序化输入,研究该方法的优越和局限性。

实现以下功能:

(1)网页程序化的注册模块:用户可以访问网页程序化的注册模块,进行注册账户。

(2)网页程序化的登录模块:用户可以访问网页程序化的登录模块,登录验证通过后,可以使用网页程序化的相关功能。

(3)网页程序化的数据自动输入模块:用户成功登录网页程序化的网站后,可以看到自己之前保存的指定的网站登录入口列表,点击网站入口,可以自动将该用户的在该网站的用户,名密码自动输入,如果存在验证码,则提供验证码的手动输入界面。

(4)网页程序化的数据自动提交模块:1)网站入口存在验证码时:用户在完成验证码的输入后,将会进行程序自动提交数据,登录网站.2)网站入口不存在验证码:用户点击网站入口,程序将自动输入用户名,密码,并自动用户名,密码到server端进行登录。

(5)网页程序化的网站入口显示模块:在用户完成登录之后,网站入口列表显示的规则采用加权的方式进行存入数据库,并根据网页入口地址的权值进行按序显示.即:用户使用次数越多的网站入口,则会出现在列表的上方,方便用户使用。

II.研究目标

(1)学习网页结构组成与定位的基本知识,组件应用的基础知识,和软件工程方面的知识;

(2)学习网页的结构分析,然后设计并实现程序化输入和提交;

3. 研究的方法与步骤

3.本课题拟采用的研究方法、步骤

本课题主要采用文献研究法、实验研究法、经验总结法进行设计。设计的过程中,将会参考相关文献,总结前人经验,在前人的基础上,做进一步的研究开发。设计的过程分为五个部分:需求分析、软件设计、程序编写、软件测试、运行维护,整个开发过程采用面向对象的分析、设计方法。

(1)需求分析

了解课题要求,掌握完整的项目需求,并且整理成明细的文档,为后期设计器开发作为参考。

(2)软件设计

根据项目需求细节,选择合理的设计模式,以及软件架构,以便在软件开发中能有更好的性能和开发过程。

(3)程序编写

根据软件设计完成实际代码编程。

(4)软件测试

程序开发的过程中将会同时进行代码测试,以便及时查明系统中存在的缺陷并及时更正。同时在整体开发完成后,将会对系统进行全面测试。

(5)运行维护

系统开发完成后系统仍然可能存留一些bug,这些bug会在维护期进行修护。同时在开发过程中会产生一些文档,这些文档也能在维护期内对系统进行更深层次的整理。

4. 参考文献

4.本课题主要参考文献

[1]编程技术机械工业出版社.耿祥义张跃平

[2]程序设计清华大学出版社.蒋培,王笑梅

[3]高级编程清华大学出版社.

[4]组件级编程清华大学出版社.王立福等

[5]软件工程(第二版)北京大学出版社.

[6]周鹏,高昂,刘超.Windows服务程序的编码与分析[J].微计算机应用.2011(10)

[7]郑建标.基于COM技术的VFPWeb开发系统的设计[J].现代电子技术.2003(15)

[8]郑建标.一种基于ASP平台的VFP脚本系统开发[J].新疆师范大学学报(自然科学版).2004(03)

5. 计划与进度安排

5.本课题的具体进度安排(包括序号、起迄日期、工作内容)

2022年12月28日2022年3月19日接受毕业设计任务,查阅资料并完成开题报告;

2022年3月20日2022年4月11日完成具体网页结构分析和组件的应用练习;

2022年4月12日2022年5月11日完成程序并进行实战测试;

2022年5月12日2022年5月18日整理文挡,并翻译1篇相关的外文资料;

2022年5月19日2022年6月1日撰写毕业设计论文,准备答辩资料。

剩余内容已隐藏,您需要先支付 1元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。