1. 研究目的与意义
针对当前时代爆炸的信息量,为了节省时间,爬虫诞生是顺应时代变化的必然。爬虫不仅可以节省时间,更是让人们方便快捷地找到自己需要的东西,满足自己的需求,因此具有极大的实用性。
今天,在各式各样的视频网站上,一边看视频一边发弹幕已经成为了众多网友的习惯。爬取相关的弹幕信息,能更好的分析用户潜在的行为习惯,进而根据用户不同的行为做出报不同的反应。
2. 研究内容和预期目标
研究内容:网络爬虫的基本设计方法,以及信息可视化的技巧,并通过爬虫爬取的信息和可视化图表分析用户的行为,进而了解用户的需求。
拟解决问题:(1)了解网络爬虫如何工作;(2)选择合适的IDE开发工具;(3)实现信息的可视化(4)分析用户行为信息。
写作提纲:绪论,python简介、发展历史及分析,选题的目的及拟解决的问题,系统设计与实现,总结评价,附录。
3. 国内外研究现状
作为搜索引擎技术核心元素之一,自1993年初 Matthew Gray’s Wandered 在麻省理工学院开发出有史记载的第一个网络爬虫以来,爬虫技术历经20多年的发展,技术已日趋多样。为满足不同用户多种多样的需求,创建开发了类型众多的爬虫系统。按照实现技术和其系统构成,爬虫系统主要可以分为通用网络爬虫、增量网络爬虫、聚焦网络爬虫三种,随着科技的进步,网络爬虫的将会继续向前发展,可以预见,网络爬虫仍然有着广阔的前景。
4. 计划与进度安排
1.2022年10月—11月:毕业课题选定;
2.2022年12月:相关资料收集与阅读,完成开题报告;
3.2022年1-2月:了解Python开发相关环境,学习开发语言及开发工具;
5. 参考文献
[1] 林文涛,陈伟强,刘杭燕,叶楠.面向热点新闻的爬虫系统设计与实现[J].数字通信世界,2019(01):261-262 132.
[2] 吕博庆. 基于爬虫与数据挖掘的电商页面信息分析[D].兰州大学,2018.
[3] 李俊,周玉英,唐志航.基于主题网络爬虫的服装信息采集[J].信息技术与信息化,2018(08):97-99.
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。