基于图神经网络的电子商务平台推荐系统开题报告

 2022-08-15 09:30:36

1. 研究目的与意义

随着大数据时代的来临,海量的蕴含着丰富价值与巨大潜力的各种类型数据得以产生,这带来了工业界变革性的发展,但同时也带来了严重的“信息过载”问题,如何快速有效地从海量的数据中获取有价值的信息成为了当前大数据发展的关键难题。推荐系统作为解决“信息过载”问题的有效方法,近年来已经成为学术界和工业界的关注热点,同时各种各样的推荐系统亦随之在电子商务平台、跨境电商平台、社交网站、电子旅游和互联网广告等大量领域得到了广泛应用,并展示出优越的效果与前景。

电子商务平台数据规模也急剧扩大,用户面临着日益严重的“信息过载”问题,推荐系统在缓解信息过载方面发挥了重要作用。目前在大多数电子商务平台的推荐模型中(如淘宝、天猫和亚马逊),更多采用是基于协同过滤或者矩阵分解等改进的推荐模型,此类模型只考虑了用户对产品的“显式”和“隐式”的反馈信息,而忽视了由用户与项目组成的图结构信息,推荐性能很难满足平台和用户的要求。实际上在推荐系统中,大多数信息都具有图结构。例如,用户之间的社会关系和与项目相关的知识图谱,自然就是图形数据;用户与项目之间的交互可以看作是二部图,项目在序列中的转换也可以构建为图。因此,图形学习方法被用来获得用户/项目嵌入。在图学习方法中,图神经网络 (Graph Neural Network, GNN)目前受到了极大的追捧。有鉴于此,本作品拟采用新颖的GNN模型为电子商务平台提供推荐服务。

不论是基于协同过滤或者矩阵分解的推荐模型,还是已有的基于GNN推荐模型,都忽视了潜在的主题信息,而主题信息将有助于显示用户的兴趣倾向,缓解“用户-项目”交互矩阵带来的稀疏性和冷启动的难题。例如,在基于GNN的推荐模型中,尽管某用户购买的商品不多,但是可以通过这些购买商品的潜在的语义主题聚合更多的有用信息,从而学习到高质量的用户兴趣表征向量,进而实现精准的推荐。有鉴于此,本项目拟将采用LDA (Latent Dirichlet Allocation)隐语义模型抽取商品的主题,构建异构的“用户-项目-主题”图数据结构,通过GNN模型不仅仅学习到有用的“用户-项目”二部图结构信息,还能够以隐语义主题为桥梁,聚合图中商品节点的邻居节点以获取更多的有用信息。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

本作品以电商平台数据或公开数据集为驱动,拟设计针对电子商务平台的个性化推荐系统,以提升用户体验进进和平台的收益。

1、采用Python中的Gensim库对于电子商务平台的商品的文本描述数据进行去除停用词等预处理操作;

2、采用jieba分词对于预处理后的文本进行中文分词操作;

3、采用LDA主题模型进行主题抽取,形成“项目-主题”的分布矩阵(矩阵的元素代表项目属于主题的概率),选择最大概率分布的主题作为该项目的最终主题;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状

自动编码器基于用户或项目的自动编码器[27、32、29]是一类最新的最新协作过滤模型,可以看作是我们的图形自动编码器模型的特例,其中只有一个用户或物品嵌入在编码器中。 Sedhain等人的AutoRec。 [27]是第一个这样的模型,其中用户(或物品)部分观察到的评级矢量通过编码器层投影到潜在空间上,并使用解码器层进行重构,并具有均方误差。Zheng等人的CF-NADE算法。 [32]可以被认为是上述自动编码器架构的特例。在基于用户的设置中,消息仅从项目传递给用户,而在基于项目的情况下,则相反。请注意,与我们的模型相比,未分级的项目在编码器中的默认分级为3,从而创建了完全连接的交互图。 CF-NADE对节点施加随机排序,并通过随机剪切将进入的消息分为两组,仅保留其中一组。因此,该模型可以看作是降噪自动编码器,在该模型中,输入空间的一部分在每次迭代中都会随机丢失。分解模型许多最流行的协作过滤算法都属于矩阵分解(MF)模型。这类方法假定评级矩阵可以通过低秩矩阵很好地近似:M _ UV T,其中U 2 RNu_k和V 2 RNi_k,其中k_ Nu; Ni。 U和V的行可视为用户和项目的潜在特征表示,通过其评分模式表示其兴趣的编码。 Salakhutdinov等人的概率矩阵分解(PMF)。 [20]假设M中包含的等级是具有高斯噪声的独立随机变量。然后,最大似然的最优化导致将M中的观测条目与UV T中的重构等级之间的均方误差最小化。 Koren等人的BiasedMF。 [16]通过合并用户和项目特定偏差以及全局偏差来改进PMF。神经网络矩阵分解(NNMF)[7]通过将潜在用户和项目特征通过前馈神经网络传递,扩展了MF方法。 Lee等人的局部低秩矩阵近似。 [17]介绍了使用低秩近似的不同(依赖于条目)组合重建评级矩阵条目的想法。附带辅助信息的矩阵完成在矩阵完成(MC)[3]中,目标是用低等级的评分矩阵来近似评分矩阵。但是,秩最小化是一个棘手的问题,Candes&Recht [3]用最小化核范数(矩阵奇异值之和)代替了秩最小化,从而将目标函数变成了可处理的凸函数。 Jain&Dhillon(2013年和Xu等人,2013年)的归纳矩阵完成(IMC)在特征向量中合并了用户和项目的内容信息,并通过xi和yj近似将评估矩阵的观察元素近似为Mij = xTi UV T yj。分别代表用户i和项j的特征向量。Kalofolias等人提出的几何矩阵完成(GMC)模型。 2014年[12]引入了通过以用户图和项目图的形式添加边信息来对MC模型进行正则化。在[25]中,一种更有效的交替最小二乘优化方法(GRALS)被引入到图正则化矩阵完成问题中。最近,Monti等人。 [22]建议通过使用卷积神经网络在图上结合基于图的边信息在矩阵完成中,再结合递归神经网络对动态评级生成过程进行建模。他们的工作与我们的工作不同,因为我们直接使用图卷积编码器/解码器方法对评级图进行建模,该方法在一个非迭代的步骤中预测看不见的评级。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 计划与进度安排

通过阅读国内外关于图神经网络的推荐系统的研究现状,基于已有的研究来进行我们的研究,同时参考书籍刘忠雨等著《深入浅出图神经网络》进行学习,把方法运用到具体案例的实践当中,选定合适的公开的或相关的电子商务平台数据集,再进行相应的数据预处理后,采用jieba分词对于预处理后的文本进行中文分词操作,根据分词数据采用LDA主题模型进行主题抽取,形成“项目-主题”的分布矩阵(矩阵的元素代表项目属于主题的概率),选择最大概率分布的主题作为该项目的最终主题,构建异构的“用户-项目-主题”图数据结构,基于图神经网络(GNN)的架构,设计一种图卷积(Graph Convolutional Network, GCN)编码器对用户、项目表示进行自编码学习,从而分别学习获得用户和项目的表征向量,两组表征向量进行点乘并通过激励函数进行转换即可求得用户对项目的预计购买次数(等同于感兴趣程度),通过数据集对模型进行训练,参考相关的模型评价指标对推荐系统的性能进行评价,调校模型并记录实验数据,最终撰写论文。

5. 参考文献

[1]Kipf T N, Welling M. Variational graph auto-encoders[J]. arXiv preprint arXiv:1611.07308, 2016.

[2]Hu L, Li C, Shi C, et al. Graph neural news recommendation with long-term and short-term interest modeling[J]. Information Processing amp; Management, 2020, 57(2): 102142.

[3]Berg R, Kipf T N, Welling M. Graph convolutional matrix completion[J]. arXiv preprint arXiv:1706.02263, 2017.

剩余内容已隐藏,您需要先支付 1元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。