知识图谱用于推荐系统问题（MVIN，KERL，CKAN，KRED，GAEAT）

2023年6月1日下午12:03 • 人工智能 • 阅读 112

应各位博客读者大佬的看得起…本篇文章继续整理这个lineup的后续，主要是2020年SIGIR，CIKM，RecSys的相关文章。

关于以前博主整理过的知识图谱文章传送门：

MVIN: Learning Multiview Items for Recommendation
来自SIGIR2020的文章。现在有很多文章都在推荐系统中引入外部的知识来提升推荐系统的效果，但没有人考虑过多方面的item特性，所以不能非常精确的学习商品表示。这个意思就是说某一些用户对同一作者的书籍感兴趣，而其他用户则对某一本书体裁感兴趣。即在现实世界中，每个用户对给定的项目都有不同的看法视图（views），而在实体视图中，项目表示由KG中连接到它的实体来定义的。这也对应了想要解决多视图的两大问题：

用户视图Graph如何丰富？
实体视图Graph如何细化？

所以作者相应提出multi-view item network (MVIN) ，从user和item来学习多个视角下的商品表示，进而进行商品推荐。具体对应以上两点的解决方案为：

为了丰富 用户-实体交互。具体是提出一个用户导向模块去描述每个实体之间关系的重要性。如上面模型图的左边user-entity interaction，论文里面的公式比较复杂，大致就是做以user为中心的多跳GNN聚合（如图中坐下的小蓝框），可以得到：π r v , e u = W r ( c o n c a t ( [ u , r , v ] ) ) + b r \pi^u_{r_{v,e}}=W_r(concat([u,r,v]))+b_r πr v ,e u =W r (c o n c a t ([u ,r ,v ]))+b r
为了细化 实体-实体交互。具体提出一个混合层，以进一步改进GCN聚合的实体的嵌入，并允许MVIN从各种分层邻域特征中捕获混合GCN信息。如上面模型图的右边entity-entity interaction，简单来看就是将分层的GCN进行信息对比，以从KG中的内部实体-实体交互中获得全面的特征：v w + 1 1 = M w ( c o n c a t ( [ v w 1 , v w 2 , . . . , v w l d ] ) ) v^1_{w+1}=M_w(concat([v^1_w,v^2_w,…,v^{l_d}_w]))v w +1 1 =M w (c o n c a t ([v w 1 ,v w 2 ,…,v w l d ]))v w d + 1 = a g g ( v w d , n w d ) = σ ( W v ( v w d + n w d ) ) + b v v^{d+1}_w=agg(v^{d}_w,n^{d}_w)=\sigma(W_v(v^{d}_w+n^{d}_w))+b_v v w d +1 =a g g (v w d ,n w d )=σ(W v (v w d +n w d ))+b v

最后再计算分数：y u v ′ = σ ′ ( u T v ′ ) y’_{uv}=\sigma'(u^Tv’)y u v ′=σ′(u T v ′)
code：https://github.com/johnnyjana730/MVIN

KERL: A Knowledge-Guided Reinforcement Learning Model for Sequential Recommendation
来自SIGIR2020，如题，这篇论文将KG做到用强化学习控制序列推荐的任务中。加入KG的目的，同样是为了融合知识的信息来加强状态向量的表达能力。作者认为在序列推荐中，用户偏好的动态变化在强化学习探索过程中更不稳定，仅仅用历史序列的知识是不能充分的指导强化学习的探索过程。

强化学习不做科普，传送门。这里重要的改动为把state变成了三部分，即时序信息ht，历史知识ct，未来知识f，分别对应上图的GRU得到时序，外部知识用KG的TransE得到，未来知识用一个推断网络建模历史知识与未来知识的关联性，f t : t + k = M L P ( c t ) f_{t:t+k}=MLP(c_t)f t :t +k =M L P (c t )，最后拼接三者v s t = h t ⊕ c t ⊕ f t : t + k v_{s_t}=h_t \oplus c_t \oplus f_{t:t+k}v s t =h t ⊕c t ⊕f t :t +k

另一部分的改动是融合知识与序列的复合奖励函数，Reward有两部分组成一是序列（物品级），二是KG（知识属性级）。

序列。受机器翻译评估工作的启发，作者通过 BLEU 指标，评估预测序列和真实序列之间单个商品，以及子序列片断的相似性R s e q = e x p ( 1 M ∑ m = 1 M l o g p r e c m ) R_{seq}=exp(\frac{1}{M}\sum_{m=1}^M log prec_m)R s e q =e x p (M 1 m =1 ∑M l o g p r e c m )
KG。直接用余弦函数测量预测序列和真实序列之间知识的语义相似性即可。

paper：https://arxiv.org/abs/2004.08068

CKAN: Collaborative Knowledge-aware Attentive Network for Recommender Systems
同样来自SIGIR2020，这篇文章的论点在于现有的基于知识属性的推荐方法大多关注于如何有效地对知识属性关联进行编码，而没有突出隐藏在用户-物品交互中的关键协同信号。所以提出CKAN来编码协同信号。模型架构如上图，可以分为4个部分：

Collaboration Propagation。可以看到user的表示是很多个item set，item的表示是通过user得到的item表示，这一点和RippleNet是一致的。
Knowledge Graph Propagation。在KG中沿着链路传播，从而得到扩展的实体集，这里也和RippleNet差不多。
Knowledge-aware Attentive Embedding。提出了一种基于知识感知的动态嵌入方法，通过Attention去区分不同的头部实体和关系时尾部实体所具有的不同意义，这里直接做个attention就好。
Prediction。聚合方式有3种，加和，池化和拼接。

具体细节可以看一下code：https://github.com/weberrr/CKAN

KRED: Knowledge-Aware Document Representation for News Recommendations
来自RecSys2020，将KG扩展填充到新闻推荐中，技术上比较像KG Transformer。一般来说新闻文章通常包含名人或组织等知识实体，用KG来增强任意文档表示是非常合适的，但是现有方法1BERT这种大规模不考虑实体；2DKN只纳入标题，扩展全文效率低；3实体在文章中出现的位置，频率，类别等对理解新闻很重要。

模型架构如上图，首先是用KGAT来表示每个实体，然后：

Context Embedding Layer。加入实体Position Encoding（实体的位置），Frequency Encoding（实体出现频率），Category Encoding（实体的类别）。
Information Distillation Layer。实体的最终重要性不仅由它自己的消息决定，还受文章中同时出现的其他实体和文章的主题的影响。所以这里用Transformer来优化表征。
Multi-Task Learning。最后做一个多任务：包括个性化推荐，项目到项目推荐、新闻流行预测、新类别预测和本地新闻检测等等。

paper：https://arxiv.org/abs/1910.11494

GAEAT: Graph Auto-Encoder Attention Networks for Knowledge Graph Completion
来自CIKM2020的小短文，虽然比较短感觉还可以。motivation是一般学习kg只能学到三元组知识，却不能学到内在的关系（即不能推理和其他三元组内的复杂关系）。所以作者想表达实体和关系特征，同时挖掘实体-关系的交互作用。具体来说，GAEAT模型就是简单的attention的GAE学其内在关系。

模型图如上，第一个部分直接学三元组的Embedding g i j k = σ ( [ e i ∣ ∣ e j ∣ ∣ r k ] W 1 ) g_{ijk}=\sigma([e_i||e_j||r_k]W_1)g i j k =σ([e i ∣∣e j ∣∣r k ]W 1 )然后接一个GAE，即图自编码器，分为两块：

编码器：使用图注意网络得到实体和关系特征，这里用的也是实体多跳。
解码器：利用这些已经提取到的三元组内的潜在特征，DistMult算分数f ( h , r , t ) = e h T M r e t f(h,r,t)=e_h^TM_re_t f (h ,r ,t )=e h T M r e t

code：https://github.com/TomersHan/GAEAT

Original: https://blog.csdn.net/qq_39388410/article/details/114312187
Author: 上杉翔二
Title: 知识图谱用于推荐系统问题（MVIN，KERL，CKAN，KRED，GAEAT）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/556788/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python-opencv fft、dct变换 + 幅度、相位谱结合实现艺术效果

快速傅里叶变换（FFT）原始二维傅里叶变换公式： np工具箱中有fft2函数可以对图像做二维快速傅里叶变换（不断分解成更小的、更容易的小蝶形变换替换大变换），但是要让输出的频谱图…

人工智能 2023年5月28日
0070
pytorch_lesson10 二分类交叉熵损失函数及调用+多分类交叉熵损失函数及调用

注：仅仅是学习记录笔记，搬运了学习课程的ppt内容，本意不是抄袭！望大家不要误解！纯属学习记录笔记！！！！！！文章目录一、机器学习中的优化思想二、回归：误差平方和SSE 三、…

人工智能 2023年6月17日
0069
MPC算法学习(1)

目录一、了解MPC 1.MPC → Model PredictIve Control 2.MPC基本工作原理二、MPC设计 1.MPC参数设计 2.MPC使用范围 3.MPC速…

人工智能 2023年6月1日
0064
计算机视觉基础学习-图像拼接

1、基础理解首先本文介绍的图像拼接并非对尺寸相同的图片进行简单拼接，而是基于全景图的拼接普通相机拍摄图像时，无法兼顾相机视场与视场中单个物体的分辨率问题，而全景相机普遍价格昂贵…

人工智能 2023年6月23日
0070
pytorch实现MNIST识别——全流程

主要实现掌握pytorch自带数据集的导入初步编写DataLoader 定义模型、损失和优化器训练简单神经网络将模型结果保存至本地参考https://zhuanlan.z…

人工智能 2023年7月14日
0051
YOLO中对IOU、GIOU、DIOU、CIOU的理解

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月12日
0054
【自动驾驶轨迹规划之hybrid A*算法】

本文参考论文：https://ai.stanford.edu/~ddolgov/papers/dolgov_gpp_stair08.pdf 这篇文章是基于经典A*算法与reeds-…

人工智能 2023年6月2日
0059
基于SwinTransformer+UNet的遥感图像语义分割

目录摘要 1.Introduction 2.Related Work * 2.1.基于CNN的RS语义分割 2.2.自注意力机制 2.3.ViT 3.方法 * 3.1.网络结构 …

人工智能 2023年5月26日
0091
分类任务的标签与one-hot相互转化（tensorflow）

利用tensorflow自带的one_hot函数 1.从整数到one-hot 假设：四分类情况下label等于0~3 import tensorflow as tf label …

人工智能 2023年7月2日
0057
（九）逻辑回归多分类应用

逻辑回归（Logistics Regression）属于分类算法，最适合解决二分类问题，也可以解决多分类问题，下面两个例子都是解决多分类的应用一、鸢尾花案例 import num…

人工智能 2023年7月3日
0059
sklearn快速入门教程：标准化

标准化：让数据服从标准正态分布 StandardScaler 实现 from sklearn.preprocessing import StandardScaler data =…

人工智能 2023年6月25日
0067
【机器学习】逻辑回归案例二：鸢尾花数据分类，决策边界绘制逐步代码讲解

逻辑回归案例二：鸢尾花数据分类，决策边界绘制逐步代码讲解 1 数据加载 2 数据EDA 3 模型创建及应用 * 3.1 数据切分 3.2 创建模型与分类 3.3 决策边界绘制 &#…

人工智能 2023年6月16日
0074
pandas行和列的获取

DataFrame的行和列：df[‘行’, ‘列’] DataFrame行和列的获取分三个维度行和列选取：df[]，一次只能选取行…

人工智能 2023年7月7日
0040
模糊c–均值聚类算法的原理解释及推导

（1）设定簇的数目𝑐和阈值𝜀，并令𝑠 = 0。随机初始化所有样本对所有簇的隶属度，并将其记录在隶属度矩阵𝑄中，即： Q 0 = ( α 11 . . α 1 c . . . . …

人工智能 2023年5月31日
0096
美团大脑百亿级知识图谱的构建及应用进展

分享嘉宾：张鸿志博士美团算法专家编辑整理：廖媛媛美的集团出品平台：DataFunTalk 导读：美团作为中国最大的在线本地生活服务平台，连接着数亿用户和数千万商户，其背后…

人工智能 2023年6月1日
0071
NeRF：神经辐射场论文原理讲解

一、新视角合成 NeRF是开创了一种全新的视角合成方法。新视角合成任务指的是给定源图像（Source Image）及对应的源姿态(Source Pose)以及目标姿态(Target…

人工智能 2023年6月15日
0067

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

知识图谱用于推荐系统问题（MVIN，KERL，CKAN，KRED，GAEAT）

大家都在看