KCF与GOTURN视频跟踪算法评价与改进开题报告

 2022-08-03 11:09:37

1. 研究目的与意义

卷积神经网络(CNN)由于其强大的特征提取能力,近年来被广泛用于计算机视觉领域。1998年Yann LeCun等提出的LeNet-5网络结构,该结构使得卷积神经网络可以端到端的训练,并应用于文档识别。LeNet-5结构是CNN最经典的网络结构,而后发展的卷积神经网络结构都是由此版本衍生而来。在过去六年中,由于深度学习和卷积网络的发展和进步,基于图像的目标检测和分类能力已经大大提高。而目标检测是计算机视觉领域一个重要的研究方向,是众多高级任务的必备前提,包括场景理解,事件识别等。

目前,目标检测也广泛用于安全监控,自动驾驶,人机交互,增强现实等众多领域。目标检测对计算机视觉和产业界实际应用都有十分重要的意义。然而, 由于视角、遮挡、姿态等因素引起目标发生形变, 导致目标检测成为一个具有挑战性的任务。设计高准确率高效率的目标检测算法仍具有重大意义。

采用基于Mask R-CNN的模型方法, 在目标区域方框和类别预测的基础上, 增加掩膜分支, 在描述视频目标特征的同时, 增加对其轮廓边缘的限制, 取得了较好的检测效果。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

研究内容:

1、基于Mask RCNN模型进行视频目标检测

2、提取视频中被检目标信息

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状

目标检测:目标检测是计算视觉领域一个重要的研究方向,主要解决了图像中各种目标的分类和定位等视觉基本问题。由于近年来深度学习特别是深度卷积神经网络研究的兴起,各类基于神经网络的目标检测算法不断地刷新标准检测数据集的最好性能成绩。目前主流的基于卷积神经网络的目标检测算法,包括各种两阶段检测(RCNN,FastRCNN,FasterRCNN,MaskRCNN,TridentNet)以及单阶段检测器(YOLO,SSD,CornerNet,ExtremeNet)。

建筑物目标检测:基于Mask-RCNN的建筑物目标检测方法,是基于卷积神经网络思想,在深度学习框架下通过多线程迭代训练,将无人机影像作为训练样本,在卷积神经网络中得到目标特征再通过区域建议网络(RPN)与ROIAlign操作将特征输入不同的全连接分支。最后得到具优化的权重参数的目标检测模型。

Mask Rcnn:2017年Kaiming He等提出了Mask R-CNN ,并获得ICCV2017 Best Paper Award。作者指出,Faster R-CNN在做下采样和RoI Pooling时都对特征图大小做了取整操作,这种做法对于分类任务基本没有影响,但对检测任务会有一定影响,对语义分割这种像素级任务的精度影响则更为严重。为此,作者对网络中涉及特征图尺寸变化的环节都不使用取整操作,而是通过双线性差值填补非整数位置的像素。这使得下游特征图向上游映射时没有位置误差,不仅提升了目标检测效果,还使得算法能满足语义分割任务的精度要求。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 计划与进度安排

2022年11月份选题,

2022年11月-2022年2月份广泛收集、整理、阅读有关文献及数据资料,

2022年11月份撰写、修改、提交开题报告,

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 参考文献

[1] 张索非,冯烨,吴晓富。基于深度卷积神经网络的目标检测算法进展[J]。南京邮电大学学报(自然科学版),2019,39(05):72-80。

[2] 温尧乐,李林燕,尚欣茹,胡伏原。一种改进的Mask RCNN特征融合实例分割方法[J]。计算机应用与软件,2019,36(10):130-133。

[3] 李大军,何维龙,郭丙轩,李茂森,陈敏强。基于Mask-RCNN的建筑物目标检测算法[J]。测绘科学,2019,44(10):172-180。

剩余内容已隐藏,您需要先支付 1元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。