KGAT: Knowledge Graph Attention Network for Recommendation

2023年6月1日下午2:00 • 人工智能 • 阅读 98

摘要

推荐算法引入side info，传统算法（FM）假设每个交互都是一个带有side info 编码的独立实例，这些方法不足以从用户的集体行为中提取出协作信号。本文提出KGAT，显式地构造KG图中地高阶连通性。

1 引言

CF模型无法引入side info。SL模型引入side info的范式：将side info、uid，iid转化成特征向量，将他们送入监督模型来预测得分，比如FM、NFM、WideDeep、xDeepFM。
SL模型将一条交互建模成单独的数据样本，没有考虑交互之间的关系。

KGAT: Knowledge Graph Attention Network for Recommendation

由图一可见CF和基于特征的SL模型的局限性，对于target user u1来说：

CF模型关注历史行为的相似用户，也就是也看了i1的用户，u4
基于特征的SL模型，关注于和i1有相似特征（e1）的item，i2
忽略了黄色区域和灰色区域

为了解决SL模型的局限性，解决方法为考虑item side info的图形式（将KG和交互图混合，CKG，collaborative knowledge graph），这样就可以探索高阶连通性，就可以到达黄色区域和灰色区域。挑战有：阶数越高，计算复杂度高；高阶关系的加权和选择问题
CKG的研究有基于path的，基于正则化的，各有缺点；本文的KGAT使用GNN，高效、显式的和端到端的方式来对高阶连通性建模。

; 2 任务定义

用户-物品二部图
知识图谱，注意关系集合R包含正方向和逆方向（比如电影被xx主演；xx主演电影；这是两个关系）
协调知识图，CKE，将用户行为和物品知识整合成一个统一关系图，将交互看作一种关系，整合两个图

任务描述：输入CKE；输出u对i地预测得分

不同于CF模型，SL模型致力于基于属性的连通性，比如u1可能采用i2，i2和i1有相同的导演；但是SL模型不能展示跨field和相关实例的关系，比如：

3 模型

; 3.1 嵌入层

使用一种知识图嵌入模型——TransR，学习到实体和关系的表示。每个关系有一个转化矩阵 W r W_r W r ，将头实体和尾实体投影到关系r的空间中。下式这个得分越小，表明嵌入越好。

采用pair loss来训练：

3.2 注意力嵌入传播层

信息传播，用 N h N_h N h 表示h作为头实体的三元组集合，计算h的 ego-network，其中 π \pi π 表示在关系r下从尾实体t传递信息到头实体h，的信息量比例。

知识感知的注意力，π \pi π 通过关系注意力机制实现：
KGAT: Knowledge Graph Attention Network for Recommendation

注意分数取决于h和t在关系r空间中的距离，越近的实体传递的信息量越多。h通过所有的尾实体来传递信息给自身（感觉也可以反过来，尾实体由所有头实体传递信息），所以 π \pi π 归一化的分母是所有尾实体：
KGAT: Knowledge Graph Attention Network for Recommendation

GAN只以节点表示为输入，但是KGAT输入还包括关系r，在传播的过程中编码了更多信息。
信息聚合，聚合实体表示 e h e_h e h 和它的 ego-network表示 e N h e_{Nh}e N h ，使用了三种聚合算子：

GCN Aggregator
GraphSage Aggregator
Bi-Interaction Aggregator

嵌入传播层的优点在于显式地利用一阶连接信息来关联用户、物品和知识实体表示。

高阶传播，stack更多嵌入传播层，来探究高阶连通信息，从多阶邻居收集传播到的信息。

; 3.3 模型预测

concat 每一层的用户/物品表示（包括初始的嵌入）得到最终表示
对最终表示进行内积得预测分

3.4 优化

BPR loss:

联合TransR的损失，最终损失函数为：
KGAT: Knowledge Graph Attention Network for Recommendation

交替优化L K G L_{KG}L K G 和L C F L_{CF}L C F

; 4 实验

4.1 数据描述

10-core
Amazon-book和Last-FM，将item通过匹配Freebase中的实体；不同于现有的知识感知数据库只提供item的一阶实体，本文考虑涉及到item的二阶实体；
Yelp2018，从数据中（目录、位置、属性）提取item KG
每个用户交互行为的80%作为训练集；训练集的随机10%作为验证集调参
每个正样本采样一个负样本

4.2 实验设置

评价指标：所有模型输出用户对所有物品的预测得分（除了训练集中的正样本），recall，ndcg
baseline: FM、NFM；CKE、CFKG；MCRec、RippleNet；GC-MC
参数：Adam、batch1024、Xavier初始化、网格搜索{学习率、dropout率、L2系数}；提前终止：当recall在验证集上连续50epoch没有增长

4.3 模型表现 RQ1

还探究了使用高阶连通性能否缓解稀疏性：基于user的交互数量划分测试集为4个组，并且保持4个组每个组的总交互数相同

; 4.4 消融实验 RQ2

layer number、聚合操作、KG嵌入和注意力

4.5 案例研究RQ3

个人认为本篇论文核心是：KG和交互图的混合；先用KGE初始化嵌入；再使用GNN进行信息传播，同时使用注意力机制，用多阶邻居节点共同更新当前节点的表示。

Original: https://blog.csdn.net/qq_38119106/article/details/114453304
Author: Dive_
Title: KGAT: Knowledge Graph Attention Network for Recommendation

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/557199/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

ROS1代码向ROS2移植

ROS1代码向ROS2移植前言安装ros2 foxy 配置vscode ros2基本操作 * 创建工作空间添加工作空间环境变量创建ros2功能包安装第三方功能包节点相关…

人工智能 2023年6月2日
00302
聚类的性能度量和距离计算

聚类也许是机器学习中”新算法”出现最多,最快的领域,一个重要原因是聚类不存在客观标准;给定数据集，总能从某个角度找到以往算法未覆盖的某种标准从而设计出新算…

人工智能 2023年5月31日
0066
【Pytorch】torch.nn.init.xavier_uniform_()

目录简介 torch.nn.init.xavier_uniform_() * 语法作用举例参考结语 ; 简介 Hello！非常感谢您阅读海轰的文章，倘若文中有错误的地方，…

人工智能 2023年6月23日
0074
SpringBoot测试及web环境模拟测试

目录一、加载测试专用属性 * 1. 临时属性 2. 临时参数二、加载测试专用配置三、Web环境模拟测试 * 1. 启动web测试 2. 测试类中发送请求 3. 响应状态匹配 …

人工智能 2023年6月27日
0085
02标准建模流程:数据准备

1.1数据导入 1、数据孤岛A表在某个平台，B表在另外的平台，通过主键将A表和B表进行匹配，此时需要判断能匹配上的量级。● 量级过小（对于评分卡要求正负样本的数量不少于1500个，…

人工智能 2023年7月16日
0068
jstson nano 学习日志（六）

3 深度学习与jeston nano 3.1 笔记本环境搭建考虑到日后编写从程序需要移植到jeston nano上面，这里在选择深度学习框架的时候我更偏向于工程性更强的tenso…

人工智能 2023年5月26日
0067
ImportError：cannot import name ‘save_state_warning‘和解决torch1.7.1报分布式错误No rendezvous handler for env:

ImportError：cannot import name ‘save_state_warning’ from torch.optim.lr_schedu…

人工智能 2023年5月27日
0093
Odyssey 2022 | 希尔贝壳受邀参加国际顶级说话人和语种识别研讨会

Odyssey （说话人和语种识别研讨会）2022 将于2022年6月28日至7月1日在中国北京举办，会议将采用hybrid的形式，国内均线下（在北京市郊长城脚下的古北水镇），国外…

人工智能 2023年5月25日
0088
python astype category_利用Python进行数据分析(11)-高阶应用category

本文中介绍的是pandas的高阶应用-分类数据category image 分裂数据Categorical import pandas as pd import numpy as…

人工智能 2023年7月8日
0064
以nba球员数据学习聚类算法

本内容所有代码都在我的github上，喜欢的朋友可以点个赞https://github.com/zxhjames/NBA_DataAnalysis [TencentCloudSDK…

人工智能 2023年6月2日
00152
神经网络对多变量的性别结果预测

神经网络这几年可谓是火得一塌糊涂，它是目前最为火热的研究方向——深度学习的基础。在神经网络刚被发明之初，人们欢呼雀跃，认为是创造出来了比人更强的思维怪兽。它类比于人的神经元的工作方…

人工智能 2023年6月12日
0092
MATLAB算法实战应用案例精讲-【回归算法】XGBoost算法（附Java、Python和R语言代码）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月17日
0088
图入度大于出度 java实现_GitHub – bulebule00/Knowledge_Graph_Partitioning: 基于密度的大规模知识图谱分割算法…

[TOC] 基于节点纬度的知识图谱分割目录说明 ./Database 目录存放数据集 ./Image 存放readme中的相关图片 ./Tools 存放相关工具代码 Neo4j …

人工智能 2023年6月10日
0075
超分辨网络SRCNN的Pytorch实现

文章目录 * – + 整体框架 + 网络模型 + 数据集 + 训练整体框架 SR，即super resolution，即超分辨率。CNN相对来说比较著名，就是卷积神经…

人工智能 2023年7月20日
0046
如何进行聚类可视化_从爬虫到机器学习-高级Python数据处理与可视化

很多同学都听说过数据集 (dataset)。实际上，熟练使用爬虫技术获取和整理数据集是机器学习的第一步。而下载下来的数据如何处理则是一门功课，几乎就是机器学习这门课的核心要义之一。…

人工智能 2023年6月2日
0071
【故障诊断】动态过程监测方法

💖作者简介：大家好，我是车神哥，府学路18号的车神🥇⚡About—> 车神：从寝室到实验室最快3分钟，最慢3分半（那半分钟其实是等红绿灯）📝个人主页：车手只需…

人工智能 2023年7月17日
0062

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31