1. 研究目的与意义
随着信息技术的普及,各地人力资源市场也纷纷建设自己的信息平台。
单位和个人在网站注册后可以发布招聘和求职信息,人力资源信息平台逐渐成为广 大求职者谋求工作的首选途径。
但是,大部分的人力资源信息平台往往只专注于发布信息、查询信息与数据统计功能,而求职者通过简答的筛选并不能达到精确定位的目的,往往要花更多时间去做筛选。
2. 课题关键问题和重难点
【关键问题】(1)用户能看到市场上各技术岗位的占比,大致了解总的需求;(2)给用户直观展示不同地区,不同职位带来的薪资和发展空间的差异;(3)根据用户选择的地区,岗位等条件,直观展示该地区该职位的薪资等信息;(4)分析样本数据,向用户展示岗位需求中权重较大的项,让用户进行查漏补缺,更好的获得自己中意的岗位;(5)求职分析,自定义条件,分析用户能入职该岗位的概率,和入职后的预计薪资。
【难点】(1)拉勾网海量的招聘信息,无法通过人工一条条的进行统计记录,需要使用爬虫技术将我们所需要的信息进行爬取。
(2)对爬取到的数据进行预处理,包括数据清洗、数据集成、数据变化和数据离散化等步骤(3)建立基于C4.5算法的决策树算法,并不断的通过训练,测试,修正,使得该决策树算法的正确率能的到保证(4)人才与商品的个性化推荐存在本质上的不同,而各地人力资源网在个性化人才推荐并没有过多的涉足,更多的是简单的匹配,并不精确,所以这里需要一种基于数据挖掘技术的个性化人才推荐方法
3. 国内外研究现状(文献综述)
【就业现状】 根据统计,2015年高校毕业生将达到749万人,如果加上中专、技校和初中高中毕业以后不再继续升学的学生, 新增就业人数又将创下历史新高。
不仅如此,随着我国改革开放的不断深入发展以及市场经济体质的快速发展,城市与农村之间经济与社会地位的差距不断增 大,导致农村富余劳动力不断向城市转移。
这些就业人口将给各大城市就业带来巨大的压力。
4. 研究方案
(1)分析拉勾网上招聘信息的的文本格式,并建立与之对应的数据库表结构,然后,通过Python爬虫,爬取拉勾网上若干技术岗位对应的招聘信息存储在数据库中。
(2)对数据进行数据清洗等处理,做成可视化界面,方便用户直观了解不同条件下,职位的待遇和需求等不同的变化(3)建立合适的决策树算法,对样本数据进行训练,最后达到一定的准确率(4)基于上述结果,再基于流行的推荐方法:内容的推荐算法和基于协同过滤的推荐算法,使得推荐算法在精确率上有更大的提高。
5. 工作计划
第1周:学生撰写开题报告和完成外文翻译。
第2周:指导学生进行课题总体规划和课题的详细设计。
第3-5周:指导学生进行课题模块化设计并进行模块代码编写与调试。
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。