基于支持向量机的数据分类与识别开题报告

 2022-12-07 11:24:27

1. 研究目的与意义

近年来,在IT行业,人工智能成为了非常火的话题。人工智能的发展得益于云计算和大数据技术的成熟与普及。人工智能可看作一个数据挖掘系统,其中,机器学习的作用主要是学习历史数据的经验,将这些经验构建成数学模型。人们利用这个模型可以解决日常生活中的一些问题,如商品推荐和拍照搜索等[1]。随着互联网技术的发展,数据量与日俱增,因此处理数据的数量和复杂度会带来一系列的问题。

机器学习是近年来兴起的一门多领域交叉学科,涉及统计学、概率论、博弈论、信息论、算法复杂度理论等多门学科,其目的是设计和分析一些让计算机可以自主“学习”的算法,对大数据及复杂数据进行处理、分析,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能[2]

支持向量机(Support Vector Machine,SVM)是机器学习中的基本算法之一,是Corinna Cortes和Vapnik等在1995年首先提出的[3]。SVM在小样本数据的分类识别中具有良好的表现,在非线性和高维模式识别中也表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。在机器学习中,支持向量机是与相关的学习算法有关的监督学习模型,可以分析数据,识别模式,用于分类和回归分析。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容与预期目标

主要研究内容:

本课题主要研究支持向量机算法的原理,并在此基础上利用合适的语言对测试数据进行分类识别。支持向量机算法定义某些数据点为支持向量,由这些点确定一个最优分类面将两类数据有效的分开,所以就将该算法命名为支持向量机算法(SVM)。支持向量机的基本模型是在特征空间上找到最佳的分离超平面使得训练集上正负样本间隔最大,如何来确定这个最佳的分离超平面是主要问题。

SVM是用来解决二分类问题的有监督学习算法,不过在引入了核方法之后,SVM也可以用来解决非线性问题。实际应用中,基本上都是多分类问题,所以将二分类算法SVM应用到多分类问题上是具有重要意义的,如何实现是需要深思的。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究方法与步骤

研究方法:

本课题采用SVM 和 K-means这两种分类模型对数据进行分类和识别并进行比较。算法的实现和测试通过Python语言完成,采用的平台为PyCharm和Anaconda。SVM为了达到最好的分类效果,就要找一个最佳的分离超平面,将数据集正确地分类,并且间距最大。

支持向量机可分为两种:一种是线性支持向量机(Linear Support Vector Machine),另一种是非线性支持向量机(Non-linear Support Vector Machine)。线性支持向量机主要解决的是线性可分的场景,与逻辑回归的实现场景是一样的,它表示的是通过一条线可以将数据进行分类;非线性支持向量机涉及到空间维度转化理论,以及平衡分类效果和置信度的软间隔最大化方法,利用核函数的方法先将数据映射到高维空间中去,然后在更高的维度中把数据进行分类。线性分类器使用的是超平面类型的边界,非线性分离器使用超曲面。本课题采用的是线性支持向量机。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1] 李博. 机器学习实践应用[M]. 人民邮电出报社,2017:81-83.

[2] (美)Jason Bell著.机器学习实技术指南[M].邹伟,王燕妮,译. 机械工业出版社, 2018:107-112

[3] Vapnik V. The Nature of Statistical Learning Theory[M].New York:Springer-Verlag,1995.

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

序号起讫日期 工作内容

1、2022.3.4-2022.3.22:充分查阅相关资料,撰写并修改完成开题报告;

2、2022.3.25-2022.4.5:深入研究机器学习的基本理论及支持向量机的基本原理;

剩余内容已隐藏,您需要先支付 1元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。