MKGAT 2020（CIKM）Multi-modal Knowledge Graphs for Recommender Systems笔记

2023年6月1日上午11:44 • 人工智能 • 阅读 83

提出背景

现有的KG-based的推荐系统 仅仅利用了知识图谱的结构化数据，关注于图谱节点和节点关系， 忽略了多模态知识图谱信息（图像，文本，视频等）。
多模态信息在进行推荐的时候起到至关重要的作用。例如在电影推荐中，用户通常会观看其海报或者预告片，决定是否观看此影片，因此，将多模态信息加入知识图谱中，利用知识图谱进行推荐是有必要的。

; 多模态知识图谱表示学习

基于特征的表示学习

基于特征的方法将模态信息视为实体的辅助特征。

基于实体的表示学习

基于实体的方法将不同类型的信息（例如文本和图像）视为结构化知识的关系三元组。

本文贡献

这是将多模态知识图引入推荐系统的第一项工作，由于多模态知识建模往往是不同模态的辅助信息关系，而非传统图谱中三元组所代表的语义关联关系，故传统的图谱建模方式并不能很好地对多模态知识图谱进行建模。。
我们开发了一种新的MKGAT模型，该模型利用多模态知识图上的信息传播来获得更好的实体嵌入以进行推荐。

共现知识图谱Collaborative Knowledge Graph

MKGAT 2020（CIKM）Multi-modal Knowledge Graphs for Recommender Systems笔记

该知识图谱包括用户-项目二部图和原始的多模态知识图谱；知识图谱中的实体既包括物品，也包括用户。物品和用户之间的关系只有交互关系，即把共现矩阵的信息补充到知识图谱中。

; 模型基本架构

Multi-modal Knowledge Graph Embedding Module

以协作知识图谱作为输入，知识图谱嵌入模块利用多模式知识图（MKG）实体编码器和MKG注意层为每个实体学习新的实体表示。新的实体表示将汇总其邻居的信息，同时保留有关其自身的信息。然后，可以使用新的实体表示来学习知识图嵌入，以表示知识推理关系。

Multi-modal knowledge graph entity encoder

为了将多模态实体整合到模型中，我们提出了对 不同模态数据学习不同的嵌入。我们利用深度学习的最新进展为这些实体构造编码器以表示它们，从而为所有实体提供嵌入。

结构信息
采用翻译模型获得三元组的头实体，关系，尾实体的嵌入表示。
图像信息
为了表示图像的语义信息，采用经过在 Imagenet预训练的ResNet50获取嵌入表示。
文本信息
采用Word2Vec获得文本信息的嵌入表示然后应用平滑逆频率（SIF）模型[1]来获取句子的单词向量的加权平均值，将其用作代表文本特征的句子向量。

; Multi-modal Knowledge Graph Attention Layer

传播层

给定候选实体h h h，首先通过transE模型学习知识图的结构化表示，然后把实体ℎ的多模态邻居实体信息汇总到实体h h h（若h h h为物品实体，则相邻实体可以是购买过此物品的所有用户，或者是同属于某一类型的其他物品，这些实体信息都有助于增强h h h的语义表示；若h h h为用户实体，则相邻实体是该用户购买过的所有物品，体现了该用户的历史购买兴趣）。N h N_h N h 表示直接连接到h的三元组的集合，集合了邻居实体信息，是每个三元组的线性组合，计算公式为
e a g g = ∑ ( h , r , t ) ∈ N h π ( h , r , t ) e ( h , r , t ) \mathbf{e}{a g g}=\sum{(h, r, t) \in \mathcal{N}{h}} \pi(h, r, t) \mathbf{e}(h, r, t)e a g g =(h ,r ,t )∈N h ∑π(h ,r ,t )e (h ,r ,t )
其中 e ( h , r , t ) e(h, r, t)e (h ,r ,t )是每个三元组 ( h , r , t ) (h, r, t)(h ,r ,t ) 的嵌入，而 π ( h , r , t ) π(h, r, t)π(h ,r ,t ) 是每个三元组e ( h , r , t ) e(h, r, t)e (h ,r ,t ) 的注意力得分；e ( h , r , t ) e(h, r, t)e (h ,r ,t )是通过对头部实体，尾部实体和关系的嵌入的串联进行线性变换得到的
e ( h , r , t ) = W 1 ( e h ∥ e r ∥ e t ) \mathbf{e}(h, r, t)=\mathbf{W}{1}\left(\mathbf{e}{h}\left\|\mathbf{e}{r}\right\| \mathbf{e}{t}\right)e (h ,r ,t )=W 1 (e h ∥e r ∥e t )
在这里，选择LeakyReLU作为非线性激活函数。此后采用softmax函数对所有与将与连接的所有三元组的系数归一化
π ( h , r , t ) = exp ⁡ ( π ( h , r , t ) ) ∑ ( h , r ′ , t ′ ) ∈ N h exp ⁡ ( π ( h , r ′ , t ′ ) ) \pi(h, r, t)=\frac{\exp (\pi(h, r, t))}{\sum{\left(h, r^{\prime}, t^{\prime}\right) \in \mathcal{N}_{h}} \exp \left(\pi\left(h, r^{\prime}, t^{\prime}\right)\right)}π(h ,r ,t )=∑(h ,r ′,t ′)∈N h exp (π(h ,r ′,t ′))exp (π(h ,r ,t ))

聚集层

为了保留实体的原始信息，我们需要将e a g g \bold {e_{agg}}e a g g 和e h \bold{e_h}e h 进行聚集。
（1）f a d d = W 3 e h + e a g g f_{\mathrm{add}}=\mathbf{W}{3} \mathbf{e}{h}+\mathbf{e}{a g g}f a d d =W 3 e h +e a g g
（2）f concat = W 4 ( e h ∥ e agg ) f{\text {concat }}=\mathbf{W}{4}\left(\mathbf{e}{h} \| \mathbf{e}_{\text {agg }}\right)f concat =W 4 (e h ∥e agg )

知识图谱嵌入任务

对上述经过MKGs得到的实体编码进行表示学习，这里采用的是翻译模型
score ⁡ ( h , r , t ) = ∥ e h + e r − e t ∥ 2 2 \operatorname{score}(h, r, t)=\left\|\mathbf{e}{h}+\mathbf{e}{r}-\mathbf{e}{t}\right\|{2}^{2}s c o r e (h ,r ,t )=∥e h +e r −e t ∥2 2
损失函数
L K G = ∑ ( h , r , t , t ′ ) ∈ T − ln ⁡ σ ( score ⁡ ( h , r , t ′ ) − score ⁡ ( h , r , t ) ) , \mathcal{L}{\mathrm{KG}}=\sum{\left(h, r, t, t^{\prime}\right) \in \mathcal{T}}-\ln \sigma\left(\operatorname{score}\left(h, r, t^{\prime}\right)-\operatorname{score}(h, r, t)\right),L K G =(h ,r ,t ,t ′)∈T ∑−ln σ(s c o r e (h ,r ,t ′)−s c o r e (h ,r ,t )),

Recommendation Module

推荐模块知识图实体嵌入（由知识图谱嵌入模块获得）和协作知识图作为输入，推荐模块还采用MKG实体编码器和MKG注意层来利用相应的邻居来丰富用户和物品的表示。最后，可以根据传统推荐模型来生成用户和项目之间的得分分数。
注意，在推荐模块中，不同于嵌入模型的一点时，在MKG注意层中我们为了保留每一层的信息，进行了表示拼接
e u ∗ = e u ( 0 ) ∥ ⋯ ∥ e u ( L ) , e i ∗ = e i ( 0 ) ∥ ⋯ ∥ e i ( L ) \mathbf{e}{u}^{}=\mathbf{e}{u}^{(0)}\|\cdots\| \mathbf{e}{u}^{(L)}, \quad \mathbf{e}_{i}^{}=\mathbf{e}{i}^{(0)}\|\cdots\| \mathbf{e}{i}^{(L)}e u ∗=e u (0 )∥⋯∥e u (L ),e i ∗=e i (0 )∥⋯∥e i (L )
损失函数
y ^ ( u , i ) = e u ∗ ⊤ e i ∗ \hat{y}(u, i)=\mathbf{e}{u}^{ \top} \mathbf{e}_{i}^{}y ^(u ,i )=e u ∗⊤e i ∗
L recsys = ∑ ( u , i , j ) ∈ O − ln ⁡ σ ( y ^ ( u , i ) − y ^ ( u , j ) ) + λ ∥ Θ ∥ 2 2 \mathcal{L}{\text {recsys }}=\sum{(u, i, j) \in O}-\ln \sigma(\hat{y}(u, i)-\hat{y}(u, j))+\lambda\|\Theta\|_{2}^{2}L recsys =(u ,i ,j )∈O ∑−ln σ(y ^(u ,i )−y ^(u ,j ))+λ∥Θ∥2 2

数据集

MovieLens+Knowledge Graph
Knowledge Graph来自于. Knowledge-aware graph neural networks with label smoothness regularization for recommender systems
视频信息来自Youtube
文本信息来自TMDB
Dianping+Knowledge Graph
大众点评食品的知识图是从美团链收集的-美团点评集团为餐饮和娱乐构建的内部知识图。
图片信息来自大众点评餐厅top榜
文本信息来自大众点评评价区。

; 自问自答

本文的创新点是什么？

利用多模态知识图谱提高推荐的准确率

本文的主要架构？

KGE
知识图谱传播方法+注意力机制

为什么在知识图谱嵌入模块和推荐模块使用了相同的模型？

参考文章

https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/111350563

Original: https://blog.csdn.net/qq_38420451/article/details/114383832
Author: TVfan
Title: MKGAT 2020（CIKM）Multi-modal Knowledge Graphs for Recommender Systems笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/556689/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

关于 FLOPS、FLOPs、参数量的相关计算

最近找到一些计算FLOPs的文章，奈何全是水文，讲都讲不清楚，完完全全的究极缝合怪。因此，这里准备彻底搞懂。 2023.3.12更新： FLOPS：全称：FLoating poin…

人工智能 2023年7月26日
0072
DataWhale-(动手学数据分析)-Task01(数据加载及探索性数据分析)-202201

1第一节：数据加载 1.1 载入数据数据集下载 https://www.kaggle.com/c/titanic/overview 1.1.1 任务一：导入numpy和panda…

人工智能 2023年7月18日
0054
DeepLabv3+

一.摘要本文在进行语义分割任务时将空间金字塔池化（SPP）模块或encoder-decoder结构引入到深度神经网络中。以前的网络通过对输入的feature map使用多种尺度的…

人工智能 2023年5月26日
0087
目标检测：RCNN-＞Fast RCNN-＞Faster RCNN

一、RCNN RCNN（Region with CNN feature）是深度卷积神经网络应用于目标检测问题的一个里程碑的飞跃。2014年提出的，之前都是传统的检测算法。算法步骤…

人工智能 2023年7月1日
0078
训练一个图像分类器demo in PyTorch【学习笔记】

【学习源】Tutorials > Deep Learning with PyTorch: A 60 Minute Blitz > Training a Classifi…

人工智能 2023年6月4日
00162
【tensorflow2.6】图片数据建模流程：猫狗分类，83.6%识别率

目标：识别猫和狗文章目录 * – 一、猫狗数据集 – 二、训练环境 – 三、数据处理 – 四、建立模型 – 五、图像处…

人工智能 2023年5月25日
0079
Yolov5基于目标区域（Region of Interest）的检测

Yolov5基于目标区域（Region of Interest）的检测 * – 前言引入 – mask图的制作 – yolo基于mask的检测 …

人工智能 2023年5月28日
0089
【目标检测】|PPYOLOV2

尽管有大量方法声称可以独立提高目标检测器的精度，但在实践中，某些方法在结合使用时并不有效。因此，需要对这些技巧的组合进行实际测试。按照渐进的方式逐一评估其有效性。事实上，本文更像是…

人工智能 2023年7月9日
0056
推荐7个Python自动化办公免费学习资源~（数据分析、Python、VBA等）

欢迎大家收藏学习、留言分享你的学习收获，也欢迎将本文转发给需要的朋友哦～ 1、Python自动化办公（2021最新版！有源代码，适合小白~）课程链接：https://www.b…

人工智能 2023年6月11日
0075
海康工业相机连续存图、录像功能介绍

海康工业相机连续存图功能介绍 * – 1.MVS连续存图功能基本使用方法 – 2.抓图测试与实际问题分析 – + 总结 – 3. S…

人工智能 2023年7月27日
00396
基于深度学习的车辆检测系统（MATLAB代码，含GUI界面）

摘要：当前深度学习在目标检测领域的影响日益显著，本文主要基于深度学习的目标检测算法实现车辆检测，为大家介绍如何利用(\color{#4285f4}{M}\color{#ea4335…

人工智能 2023年6月4日
0092
anaconda安装教程-手把手教你安装

文章目录 anaconda安装教程 * 一、anaconda安装包的下载二、anaconda安装过程三、验证anaconda安装是否成功 anaconda安装教程 ; 一、an…

人工智能 2023年6月22日
0070
【Data Governance】数据治理是什么

从管理者视角看数据治理某化工集团的CEO在一次工作报告中指出：”数据治理是企业发展战略的组成部分，是指导整个集团进行数字化变革的基石，要将数据治理纳入企业的顶层规划，各…

人工智能 2023年7月17日
0053
一文读懂xgboost,lightgbm分类评价指标与阈值threshold的选取

分类的评价指标主要有F-score(F-measure), recall, precision，ROC曲线，AUC曲线.其中涉及到混淆矩阵(confusion matrix), T…

人工智能 2023年6月16日
0072
BERT和GPT模型简介

引言从现在的大趋势来看，使用某种模型预训练一个语言模型看起来是一种比较靠谱的方法。从之前 AI2 的 ELMo，到 OpenAI 的 fine-tune transformer，…

人工智能 2023年5月31日
0080
Python数据分析教程06：蒙特卡洛采样、拉丁超立方采样方法及其python简单实现

使用AOP有几种方法： SpringAOP 使用了AspectJ的配置方法 AspectJ 自己写代码一.要使用AOP有几种方法 1.xml配置 Original: https…

人工智能 2023年6月26日
0080

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31