1. 研究目的与意义
近年来,高校毕业生规模的不断扩大,大学生的就业问题不容忽视,社会对此问题给予了广泛关注。
目前网络上招聘网站不胜枚举,很多招聘信息存在重复冗余,查询效率低,信息可靠性低的问题,对毕业生来说,需要花费大量的时间甄别虚假信息、筛选重复信息,影响求职效率。
为了帮助大学生更好地选择工作,故建立此系统。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究内容和预期目标
- 研究内容:Python的爬虫框架的使用及文本、图片、数字信息的分析与处理
- 拟解决的关键问题:中型爬虫框架的使用、数据分析
- 写作提纲:1.介绍题目相关背景。2.介绍使用的工具。3.系统功能制作流程介绍。4.功能展示。5.总结。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 国内外研究现状
P.DeBra提出了Fish-Search算法,该算法是经典的基于文本内容的主题判定策略。
该算法通过对生物仿生学的研究,将鱼群在海洋的觅食过程应用到爬虫在互联网爬取网页的过程。
网页内容被类比为食物,网页中的URL集合被类比为鱼的后代。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
4. 计划与进度安排
- 3月13日前完成初稿
- 5月10日前完成论文修改、重复率检查、定稿等工作
5. 参考文献
《MySQL必知必会》、《python网络数据采集》、《精通Scrapy网络爬虫》
剩余内容已隐藏,您需要先支付 1元 才能查看该篇文章全部内容!立即支付
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。