1. 研究目的与意义
如今,网络电影介绍已经成为影响用户是否消费影视作品的重要因素之一。
随着信息技术的发展、影视作品的繁荣以及人民精神消费需求的提升,越来越多人选择网上观看影视作品。
与以前被动接受相反,如今面对海量影视作品,用户拥有主动选择和搜索权。
2. 研究内容和预期目标
研究内容:下载网络电影简介及对应标签,形成电影介绍数据库,在预先分类好的文本集上进行训练,建立判别规则,从而对新样本进行自动归类。
拟解决的关键问题是:通过分词和词性标注,利用语言规则筛选出候选特征集,利用合适的算法最终抽取出特征结果。
写作提纲方面,论文主要部分分为:引言、研究背景、特征抽取、实验实证及评价、总结。
3. 国内外研究现状
文本分类的研究可以追溯到上世纪六十年代,早期的文本分类主要是基于知识工程(Knowledge Engineering), 通过手工定义一些规则来对文本进行分类,这种方法费时费力,且必须对某一领域有足够的了解,才能写出合适的规则。
到上世纪九十年代,随着网上在线文本的大量涌现和机器学习的兴起,大规模的文本(包括网页)分类和检索重新引起研究者的兴趣。
文本分类系统首先通过在预先分类好的文本集上训练,建立一个判别规则或分类器,从而对未知类别的新样本进行自动归类。
4. 计划与进度安排
论文的研究计划具体如下1.2022年11月10日——完成选题工作;2.2022年11月30日前——完成开题工作;3.2022年3月17日前——完成初稿;4.2022年5月5日前——完成论文修改、定稿、外文文献翻译工作;5.2022年5月31日前——完成答辩环节工作。
5. 参考文献
[1] 陈祎荻, 秦玉平. 基于机器学习的文本分类方法综述[J]. 渤海大学学报(自然科学版), 2010, 31(2):201-205.[2] 薛春香, 张玉芳. 面向新闻领域的中文文本分类研究综述[J]. 图书情报工作, 2013, 57(14):134-139.[3] 马丽菲, 莫倩, 杜辉. 面向中文短影评的分类技术研究[J]. 山东大学学报(理学版), 2016, 51(1):52-57.[4] 张紫琼. 在线中文评论情感分类问题研究[D]. 哈尔滨工业大学, 2010.[5] 胡泽文, 王效岳, 白如江. 国内外文本分类研究计量分析与综述[J]. 图书情报工作, 2011, 55(6):78-81.[6]艾丽丽. 基于文本挖掘的视频资源分类研究[D]. 电子科技大学, 2013.[7] 薛毅. 统计建模与R软件[M]. 清华大学出版社, 2007. [8] 李实, 叶强, 李一军, et al. 挖掘中文网络客户评论的产品特征及情感倾向[J]. 计算机应用研究, 2010, 27(8):3016-3019. [9] 祖李军, 王卫平. 中文网络评论中提取产品特征的研究[J]. 计算机系统应用, 2014, 23(5):196-201.[10] Hu M , Liu B . Mining and summarizing customer reviews[C]// Tenth Acm Sigkdd International Conference on Knowledge Discovery amp; Data Mining. DBLP, 2004.[11] Zhuang L , Jing F , Zhu X . Movie review mining and summarization[J]. 2006.[12] 袁松岭. 基于深度学习的多场景短文本分类的研究与应用[D].电子科技大学,2018.[13] 李晓军. 基于语义相似度的中文文本分类研究[D].西安电子科技大学,2017.[14] 马丽菲,莫倩,杜辉.面向中文短影评的分类技术研究[J].山东大学学报(理学版),2016,51(01):52-57.[15] 黄永文. 中文产品评论挖掘关键技术研究[D].重庆大学,2009.
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。