【论文笔记】Explainable Reasoning over Knowledge Graphs for Recommendation

2023年6月1日上午11:09 • 人工智能 • 阅读 69

原文作者：Xiang Wang，Dingxian Wang，Canran Xu, Xiangnan He, Yixin Cao,
Tat-Seng Chua

原文标题：Explainable Reasoning over Knowledge Graphs for Recommendation

原文来源：AAAI 2019

原文链接：https://ojs.aaai.org//index.php/AAAI/article/view/4470

Explainable Reasoning over Knowledge Graphs for Recommendation

近些年，通过附加信息刻画用户-物品交互特征，为推荐系统赋予更好的可解释性成为了一个较热的研究课题。

通过知识图谱，用户-物品间的交互可以通过知识图谱找到的关联路径作解释。这类关联路径不仅表述了知识图谱中实体和关系的语义，还能够帮助我们理解用户的兴趣偏好，赋予推荐系统推理能力和可解释性。该论文提出了一种基于循环神经网络的方法KPRN，建模用户-物品对在知识图谱中存在的关联路径，为用户提供可解释的推荐。

问题定义

传统知识图谱可被定义为在已知实体和关系集合上的有向图：

KG = { ( h , r , t ) ∣ h , t ∈ E , r ∈ R } \mathcal{\text{KG}} = {(h,r,t) \mid h,t\mathcal{\in E,}r\mathcal{\in R}}KG ={(h ,r ,t )∣h ,t ∈E ,r ∈R }

其中，E \mathcal{E}E是实体集合，R \mathcal{R}R是关系集合。三元组( h , r , t ) (h,r,t)(h ,r ,t )则表示从头实体h h h到尾实体t t t有关系r r r这样的事实。

U = { u t } t = 1 M \mathcal{U =}\left{ u_{t} \right}{t = 1}^{M}U ={u t }t =1 M 和I = { i t } t = 1 N \mathcal{I =}\left{ i{t} \right}_{t = 1}^{N}I ={i t }t =1 N 分别表示用户集和item集，M和N是用户和item的数量。使用一个三元组τ = ( u , interact , i ) \tau = \left( u,\text{interact},i \right)τ=(u ,interact ,i )表示用户和item之间的交互，将用户与实体合并，关系与交互合并，得到一个新的知识图谱。

G = { ( h , r , t ) ∣ h , t ∈ E ′ , r ∈ R ′ } \mathcal{G} = {(h,r,t) \mid h,t \in \mathcal{E}^{‘},r \in \mathcal{R}^{‘}}G ={(h ,r ,t )∣h ,t ∈E ′,r ∈R ′}

其中，E ′ = E ∪ U \mathcal{E}^{‘}\mathcal{= E \cup U}E ′=E ∪U，R ′ = R ∪ {interact} \mathcal{R}^{‘} = \mathcal{R \cup}\text{{}\text{interact}\text{}}R ′=R ∪{interact }。

给定用户u u u，目标item
i i i，以及( u , i ) \left( u,i \right)(u ,i )间的路径集合P ( u , i ) = { p 1 , p 2 , ⋯ , p K } \mathcal{P(}u,i) = \left{ p_{1},p_{2},\cdots,p_{K} \right}P (u ,i )={p 1 ,p 2 ,⋯,p K },
对用户与item发生交互的可能性做估计(CTR)：

y ^ ui = f Θ ( u , i ∣ P ( u , i ) ) {\widehat{y}}{\text{ui}} = f{\Theta}(u,i \mid \mathcal{P(}u,i))y ui =f Θ(u ,i ∣P (u ,i ))

与基于嵌入的模型不同的是，可以将y ^ ui {\widehat{y}}_{\text{ui}}y ui 解释为由P ( u , i ) \mathcal{P(}u,i)P (u ,i )推理出的三元组τ = ( u , interact , i ) \tau = \left( u,\text{interact},i \right)τ=(u ,interact ,i )的合理性分数。

KPRN模型

【论文笔记】Explainable Reasoning over Knowledge Graphs for Recommendation

如上图所示KPRN模型中有三个关键部分：

嵌入层。

将实体、实体类型、指向下一个节点的关系投影到隐空间中。将每个实体的类型、值分别投影为两个嵌入向量，e l ∈ R d ， e l ′ ∈ R d \mathbf{e}{l} \in \mathbb{R}^{d}，\mathbf{e}{l}^{‘} \in \mathbb{R}^{d}e l ∈R d ，e l ′∈R d。现实世界中，很多实体对在不同的关系下有着完全不同的语义，作者认为这些差异或许是用户选择item的原因。因此，将关系的语义明确地纳入路径表示学习中是很重要。每个关系嵌入表示为：r l ∈ R d \mathbf{r}{l} \in \mathbb{R}^{d}r l ∈R d。对于路径p k p{k}p k ，可以得到[ e 1 , r 1 , e 2 , ⋯ , r L − 1 , e L ] \left\lbrack \mathbf{e}{1},\mathbf{r}{1},\mathbf{e}{2},\cdots,\mathbf{r}{L – 1},\mathbf{e}_{L} \right\rbrack [e 1 ,r 1 ,e 2 ,⋯,r L −1 ,e L ]，其中每个元素都表示一个实体或关系。

LSTM层。

按顺序对元素进行编码，目的是捕获以关系为条件的实体的组合语义。使用RNN模型来研究路径中的序列信息。为了记忆序列中的长期依赖，作者选择了LSTM模型。在评估连接用户和item实体的交互关系的可信度时，长期序列模式是很重要的。在路径中l − 1 l – 1 l −1步，LSTM层输出状态向量h l − 1 h_{l – 1}h l −1 ，同时将当前实体e l − 1 e_{l – 1}e l −1 和关系r l − 1 r_{l – 1}r l −1 作为输入向量：

x l − 1 = e l − 1 ⊕ e l − 1 ′ ⊕ r l − 1 \mathbf{x}{l – 1} = \mathbf{e}{l – 1} \oplus \mathbf{e}{l – 1}^{‘} \oplus \mathbf{r}{l – 1}x l −1 =e l −1 ⊕e l −1 ′⊕r l −1

其中⊕ \oplus ⊕为拼接操作。这样x \mathbf{x}x中即包含序列信息，又包含语义信息(实体和与下一个实体间的关系)。

h l − 1 h_{l – 1}h l −1 和x l − 1 \mathbf{x}_{l – 1}x l −1 用来学习下一步的隐藏状态：

z l = tanh ⁡ ( W z x l + W h h l − 1 + b z ) f l = σ ( W f x l + W h h l − 1 + b f ) i l = σ ( W i x l + W h h l − 1 + b i ) o l = σ ( W o x l + W h h l − 1 + b o ) c l = f l ⊙ c l − 1 + i l ⊙ z l h l = o l ⊙ tanh ⁡ ( c l ) \begin{matrix} \mathbf{z}{l}\ &= \tanh\left( \mathbf{W}{z}\mathbf{x}{l} + \mathbf{W}{h}\mathbf{h}{l – 1} + \mathbf{b}{z} \right) \ \mathbf{f}{l}\ &= \sigma\left( \mathbf{W}{f}\mathbf{x}{l} + \mathbf{W}{h}\mathbf{h}{l – 1} + \mathbf{b}{f} \right) \ \mathbf{i}{l}\ &= \sigma\left( \mathbf{W}{i}\mathbf{x}{l} + \mathbf{W}{h}\mathbf{h}{l – 1} + \mathbf{b}{i} \right) \ \mathbf{o}{l}\ &= \sigma\left( \mathbf{W}{o}\mathbf{x}{l} + \mathbf{W}{h}\mathbf{h}{l – 1} + \mathbf{b}{o} \right) \ \mathbf{c}{l}\ &=\mathbf{f}{l} \odot \mathbf{c}{l – 1} + \mathbf{i}{l} \odot \mathbf{z}{l} \ \mathbf{h}{l}\ &= \mathbf{o}{l} \odot \tanh\left( \mathbf{c}{l} \right) \ \end{matrix}z l f l i l o l c l h l =tanh (W z x l +W h h l −1 +b z )=σ(W f x l +W h h l −1 +b f )=σ(W i x l +W h h l −1 +b i )=σ(W o x l +W h h l −1 +b o )=f l ⊙c l −1 +i l ⊙z l =o l ⊙tanh (c l )

其中，c l ∈ R d ′ , z ∈ R d ′ \mathbf{c}{l} \in \mathbb{R}^{d^{‘}},\mathbf{z} \in \mathbb{R}^{d^{‘}}c l ∈R d ′,z ∈R d ′分别表示记忆细胞的状态向量和信息转换模块。i l \mathbf{i}{l}i l ，o l \mathbf{o}{l}o l ，f l \mathbf{f}{l}f l 分别为输入门，输出门和遗忘门。利用记忆状态，最后一个状态h L \mathbf{h}_{L}h L 就能表示整个路径。最后本文使用两个全连接层把最终状态映射为预测得分：

s ( τ ∣ p k ) = W 2 ⊤ ReLU ( W 1 ⊤ p k ) s\left( \tau \mid \mathbf{p}{k} \right) = \mathbf{W}{2}^{\top}\text{ReLU}\left( \mathbf{W}{1}^{\top}\mathbf{p}{k} \right)s (τ∣p k )=W 2 ⊤ReLU (W 1 ⊤p k )

池化层。

组合多个路径并输出最终评分。用户item对通常有很多个路径，令S = { s 1 , s 2 , ⋯ , s K } \mathcal{S =}\left{ s_{1},s_{2},\cdots,s_{K} \right}S ={s 1 ,s 2 ,⋯,s K }表示K个路径的预测分数，最终的预测值为：

y ^ u i = σ ( 1 K ∑ k = 1 K s k ) {\widehat{y}}{ui} = \sigma \left( \frac{1}{K} \sum{k = 1}^{K} s_{k} \right)y u i =σ(K 1 k =1 ∑K s k )

有研究表明，不同的路径对于用户偏好有着不同的贡献，在上式中并没有体现这一点，因此作者设计了一个带权池化操作：

g ( s 1 , s 2 , ⋯ , s K ) = log ⁡ [ ∑ k = 1 K exp ⁡ ( s k γ ) ] g\left( s_{1},s_{2},\cdots,s_{K} \right) = \log\left\lbrack \sum_{k = 1}^{K}\exp\left( \frac{s_{k}}{\gamma} \right) \right\rbrack g (s 1 ,s 2 ,⋯,s K )=lo g [k =1 ∑K exp (γs k )]

其中γ \gamma γ是控制每个指数权值的超参数。那么，最终的预测分为：

y ^ u i = σ ( g ( s 1 , s 2 , ⋯ , s K ) ) {\widehat{y}}{ui} = \sigma\left( g\left( s{1},s_{2},\cdots,s_{K} \right) \right)y u i =σ(g (s 1 ,s 2 ,⋯,s K ))

这样的池化能够区分路径的重要性。池化函数给予了预测函数更大的灵活性，当γ \gamma γ趋于0时，该函数退化为最大池化；当γ \gamma γ趋于无穷时，该函数变为平均池化。

本文中，作者将推荐任务视为二分类问题，观察到的user-item交互value为1，否则为0。KPRN模型目标函数如下：

L = − ∑ ( u , i ) ∈ O + log ⁡ y ^ u i + ∑ ( u , j ) ∈ O − log ⁡ ( 1 − y ^ u j ) \mathcal{L = -}\sum_{(u,i) \in \mathcal{O}^{+}}^{}\log{\widehat{y}}{ui} + \sum{(u,j) \in \mathcal{O}^{-}}^{} \log\left( 1 – {\widehat{y}}_{uj} \right)L =−(u ,i )∈O +∑lo g y u i +(u ,j )∈O −∑lo g (1 −y u j )

其中，O + = { ( u , i ) ∣ y u i = 1 } \mathcal{O}^{+} = \left{ (u,i) \mid y_{ui} = 1 \right}O +={(u ,i )∣y u i =1 }和O − = { ( u , j ) ∣ y u j = 0 \mathcal{O}^{-} = \left{ (u,j) \mid y_{uj} = \right.\ 0 O −={(u ,j )∣y u j =0分别为正样本和负样本。这里为了简单，省略了L2正则项(避免过拟合)。

; 实验

本文使用了三个数据集：电影领域MovieLens-1M和IMDb；音乐领域KKBox。表一中为数据集相关信息。

对于user-item之间的路径，有研究发现，路径超过6会产生不必要的噪音实体，因此本文路径长度最大为6。

选取了4个baseline：MF、NFM、CKE、FMG。

实验结果如图三所示。

可以看出KPRN模型的效果是最好的，通过利用路径来推断用户偏好，KPRN能够明确user-item的连接。

方法总结

本文将user、item作为实体融入知识图谱中，user-item之间的interact作为并入关系中，从而得到知识图谱中从user到item的路径。
然后先进行embedding，embedding中将实体的type也进行了嵌入，这是否有必要？因为关系中已经包含了实体与下一个实体之间的语义联系。
得到embedding后，由于路径中存在着一个序列关系，因此使用LSTM得到路径的representation。
另外考虑到每个路径的重要性不同，因此使用一个加权的池化层得到最终的预测分数，这里的预测分数可以看作是对user-item间的interact的可信度。
因为有了路径的关系，推荐的可解释性也得到了解决。

缺陷

缺点在于

路径提取方法非常的耗时耗力。
推荐的结果很大程度上依赖于路径的质量。

Original: https://blog.csdn.net/BodyCsoulN/article/details/121136909
Author: BodyCsoulN
Title: 【论文笔记】Explainable Reasoning over Knowledge Graphs for Recommendation

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/556523/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

多层堆叠LSTM的理论与TensorFlow的实现

引言原始LSTM模型由单个LSTM层和随后的输出层组成。堆叠LSTM（Stacked LSTM）是此模型的扩展，具有多个LSTM层。关于LSTM相关知识请看这片文章：LSTM（…

人工智能 2023年5月26日
0098
【蓝桥杯冲击国赛计划第5天】哈希表

文章目录 1. 哈希表（散列表） * 1.1 定义 1.2 哈希表的作用 1.3 如何映射 1.4 哈希冲突 1.5 公共溢出区 1.6 哈希表的缺陷 1.7 实例「弗里的的语言」…

人工智能 2023年6月29日
0085
极智AI | centos7源码编译tensorflow

欢迎关注我的公众号 [极智视界]，获取我的更多笔记分享大家好，我是极智视界，本文介绍一下 centos7 源码编译 tensorflow 的方法。之前这篇《极智开发 | cen…

人工智能 2023年7月29日
0078
PointNet解读

PointNet解决的问题：如上图所示： 1.点云图像的分类（整片点云是什么物体） 2.点云图像的部件分割（整片点云所代表的物体能拆分的结构） 3.点云图像的语义分割（将三维点云…

人工智能 2023年6月23日
0055
YoloV5 train.py 如何使用

parser 参数详解 1 –weights 初始化模型：有yolov5m，yolov5s，yolov5x，yolov5l，如果为设置为空就是没有任何与训练模型2 –conf…

人工智能 2023年7月10日
0057
【计算机视觉】新冠肺炎COVID-19 CT影片阳性检测，感染区域分割，肺部分割，智慧医疗实践，医疗影像处理示例

引言新型冠状病毒肺炎（Corona Virus Disease 2019，COVID-19），简称”新冠肺炎”，世界卫生组织命名为”2019冠…

人工智能 2023年7月19日
00136
python read_excel 参数_对Python 2.7 pandas 中的read_excel详解

对Python 2.7 pandas 中的read_excel详解发布时间：2020-08-28 03:32:56 来源：脚本之家阅读：106 作者：G_66_hero 导入p…

人工智能 2023年7月7日
0097
手把手教你使用stata进行lasso回归

Stata版本目前已经更新到17了，外观也精美了许多，很增加了许多新的功能，如制作表格导出，双重差分法。自从更新到了16版本后自带了lasso回归功能，到了17以后功能更加强大了，…

人工智能 2023年6月17日
00123
HAWE放大板_EV1M3-24/48_现货

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月28日
0058
天猫订单数据分析

项目说明数据说明本数据集共收集了发生在一个月内的28010条数据，包含以下字段：[‘订单编号’, ‘总金额’, ‘买…

人工智能 2023年7月8日
0076
RNA 20. SCI 文章中单样本免疫浸润分析（ssGSEA）

点击关注，桓峰基因桓峰基因生物信息分析，SCI文章撰写及生物信息基础知识学习：R语言学习，perl基础编程，linux系统命令，Python遇见更好的你 85篇原创内容公众号…

人工智能 2023年7月17日
0086
《Deep Feature Extraction and Classification of Hyperspectral Images Based on Convolutional Neural Networks》论文笔记

1)提出了三种基于CNN的深度特征提取结构，用于提取HSI的光谱特征、空间特征和光谱-空间特征。所设计的三维CNN能有效提取光谱空间特征，具有较好的分类性能。 2)针对训练样本数量…

人工智能 2023年6月3日
0083
【毕业设计】单片机图像分类智能识别机器人 – 物联网深度学习 AI

文章目录 0 前言 1 项目背景 2 在 Arduino IDE 上安装 ESP32-Cam 3 用 BLINK 测试电路板 4 测试 WiFi 5 测试相机 6 运行你的网络服务…

人工智能 2023年6月25日
0057
相机模型、相机标定及基于yolov5的单目测距实现

相机模型、相机标定及基于yolov5的单目测距实现 * – 1 前言 – 2 相机模型及单目测距原理 – 3 相机参数标定 – + …

人工智能 2023年7月26日
0073
我在STM32单片机上跑神经网络算法—CUBE-AI

摘要：为什么可以在STM上面跑人工智能？简而言之就是通过X-Cube-AI扩展将当前比较热门的AI框架进行C代码的转化，以支持在嵌入式设备上使用，目前使用X-Cube-AI需要在S…

人工智能 2023年6月24日
0083
YOLOX-目标检测算法（代码解读）

YOLOX简洁且高效，分享具体实现过程。部分代码可以迁移，很具有参考价值。测试比较简单，首先看demo.py。 -运行需要指定三个参数：–path：测试图片路径–exp_file…

人工智能 2023年5月26日
0083

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31