知识图谱用于推荐系统问题(MVIN,KERL,CKAN,KRED,GAEAT)

应各位博客读者大佬的看得起…本篇文章继续整理这个lineup的后续,主要是2020年SIGIR,CIKM,RecSys的相关文章。

关于以前博主整理过的知识图谱文章传送门:

知识图谱用于推荐系统问题(MVIN,KERL,CKAN,KRED,GAEAT)
MVIN: Learning Multiview Items for Recommendation
来自SIGIR2020的文章。现在有很多文章都在推荐系统中引入外部的知识来提升推荐系统的效果,但没有人考虑过多方面的item特性,所以不能非常精确的学习商品表示。这个意思就是说某一些用户对同一作者的书籍感兴趣,而其他用户则对某一本书体裁感兴趣。即在现实世界中,每个用户对给定的项目都有不同的看法视图(views),而在实体视图中,项目表示由KG中连接到它的实体来定义的。这也对应了想要解决多视图的两大问题:
  • 用户视图Graph如何丰富?
  • 实体视图Graph如何细化?

所以作者相应提出multi-view item network (MVIN) ,从user和item来学习多个视角下的商品表示,进而进行商品推荐。 具体对应以上两点的解决方案为:

  • 为了丰富 用户-实体交互。具体是提出一个用户导向模块去描述每个实体之间关系的重要性。如上面模型图的左边user-entity interaction,论文里面的公式比较复杂,大致就是做以user为中心的多跳GNN聚合(如图中坐下的小蓝框),可以得到:π r v , e u = W r ( c o n c a t ( [ u , r , v ] ) ) + b r \pi^u_{r_{v,e}}=W_r(concat([u,r,v]))+b_r πr v ,e ​u ​=W r ​(c o n c a t ([u ,r ,v ]))+b r ​
  • 为了细化 实体-实体交互。具体提出一个混合层,以进一步改进GCN聚合的实体的嵌入,并允许MVIN从各种分层邻域特征中捕获混合GCN信息。如上面模型图的右边entity-entity interaction,简单来看就是将分层的GCN进行信息对比,以从KG中的内部实体-实体交互中获得全面的特征:v w + 1 1 = M w ( c o n c a t ( [ v w 1 , v w 2 , . . . , v w l d ] ) ) v^1_{w+1}=M_w(concat([v^1_w,v^2_w,…,v^{l_d}_w]))v w +1 1 ​=M w ​(c o n c a t ([v w 1 ​,v w 2 ​,…,v w l d ​​]))v w d + 1 = a g g ( v w d , n w d ) = σ ( W v ( v w d + n w d ) ) + b v v^{d+1}_w=agg(v^{d}_w,n^{d}_w)=\sigma(W_v(v^{d}_w+n^{d}_w))+b_v v w d +1 ​=a g g (v w d ​,n w d ​)=σ(W v ​(v w d ​+n w d ​))+b v ​

最后再计算分数:y u v ′ = σ ′ ( u T v ′ ) y’_{uv}=\sigma'(u^Tv’)y u v ′​=σ′(u T v ′)
code:https://github.com/johnnyjana730/MVIN

知识图谱用于推荐系统问题(MVIN,KERL,CKAN,KRED,GAEAT)
KERL: A Knowledge-Guided Reinforcement Learning Model for Sequential Recommendation
来自SIGIR2020,如题,这篇论文将KG做到用强化学习控制序列推荐的任务中。加入KG的目的,同样是为了融合知识的信息来加强状态向量的表达能力。作者认为在序列推荐中,用户偏好的动态变化在强化学习探索过程中更不稳定,仅仅用历史序列的知识是不能充分的指导强化学习的探索过程。

强化学习不做科普,传送门。这里重要的改动为把state变成了三部分,即时序信息ht,历史知识ct,未来知识f,分别对应上图的GRU得到时序,外部知识用KG的TransE得到,未来知识用一个推断网络建模历史知识与未来知识的关联性,f t : t + k = M L P ( c t ) f_{t:t+k}=MLP(c_t)f t :t +k ​=M L P (c t ​),最后拼接三者v s t = h t ⊕ c t ⊕ f t : t + k v_{s_t}=h_t \oplus c_t \oplus f_{t:t+k}v s t ​​=h t ​⊕c t ​⊕f t :t +k ​

另一部分的改动是融合知识与序列的复合奖励函数,Reward有两部分组成一是序列(物品级),二是KG(知识属性级)。

  • 序列。受机器翻译评估工作的启发,作者通过 BLEU 指标,评估预测序列 和真实序列 之间单个商品,以及子序列片断的相似性R s e q = e x p ( 1 M ∑ m = 1 M l o g p r e c m ) R_{seq}=exp(\frac{1}{M}\sum_{m=1}^M log prec_m)R s e q ​=e x p (M 1 ​m =1 ∑M ​l o g p r e c m ​)
  • KG。直接用余弦函数测量 预测序列和 真实序列之间知识的语义相似性即可。

paper:https://arxiv.org/abs/2004.08068

知识图谱用于推荐系统问题(MVIN,KERL,CKAN,KRED,GAEAT)
CKAN: Collaborative Knowledge-aware Attentive Network for Recommender Systems
同样来自SIGIR2020,这篇文章的论点在于现有的基于知识属性的推荐方法大多关注于如何有效地对知识属性关联进行编码,而没有突出隐藏在用户-物品交互中的关键协同信号。所以提出CKAN来编码协同信号。模型架构如上图,可以分为4个部分:
  • Collaboration Propagation。可以看到user的表示是很多个item set,item的表示是通过user得到的item表示,这一点和RippleNet是一致的。
  • Knowledge Graph Propagation。在KG中沿着链路传播,从而得到扩展的实体集,这里也和RippleNet差不多。
  • Knowledge-aware Attentive Embedding。提出了一种基于知识感知的动态嵌入方法,通过Attention去区分不同的头部实体和关系时尾部实体所具有的不同意义,这里直接做个attention就好。
  • Prediction。聚合方式有3种,加和,池化和拼接。

具体细节可以看一下code:https://github.com/weberrr/CKAN

知识图谱用于推荐系统问题(MVIN,KERL,CKAN,KRED,GAEAT)
KRED: Knowledge-Aware Document Representation for News Recommendations
来自RecSys2020,将KG扩展填充到新闻推荐中,技术上比较像KG Transformer。一般来说新闻文章通常包含名人或组织等知识实体,用KG来增强任意文档表示是非常合适的,但是现有方法1BERT这种大规模不考虑实体;2DKN只纳入标题,扩展全文效率低;3实体在文章中出现的位置,频率,类别等对理解新闻很重要。

模型架构如上图,首先是用KGAT来表示每个实体,然后:

  • Context Embedding Layer。加入实体Position Encoding(实体的位置),Frequency Encoding(实体出现频率),Category Encoding(实体的类别)。
  • Information Distillation Layer。实体的最终重要性不仅由它自己的消息决定,还受文章中同时出现的其他实体和文章的主题的影响。所以这里用Transformer来优化表征。
  • Multi-Task Learning。最后做一个多任务:包括个性化推荐,项目到项目推荐、新闻流行预测、新类别预测和本地新闻检测等等。

paper:https://arxiv.org/abs/1910.11494

知识图谱用于推荐系统问题(MVIN,KERL,CKAN,KRED,GAEAT)
GAEAT: Graph Auto-Encoder Attention Networks for Knowledge Graph Completion
来自CIKM2020的小短文,虽然比较短感觉还可以。motivation是一般学习kg只能学到三元组知识,却不能学到内在的关系(即不能推理和其他三元组内的复杂关系)。所以作者想表达实体和关系特征,同时挖掘实体-关系的交互作用。具体来说,GAEAT模型就是简单的attention的GAE学其内在关系。

模型图如上,第一个部分直接学三元组的Embedding g i j k = σ ( [ e i ∣ ∣ e j ∣ ∣ r k ] W 1 ) g_{ijk}=\sigma([e_i||e_j||r_k]W_1)g i j k ​=σ([e i ​∣∣e j ​∣∣r k ​]W 1 ​)然后接一个GAE,即图自编码器,分为两块:

  • 编码器:使用图注意网络得到实体和关系特征,这里用的也是实体多跳。
  • 解码器:利用这些已经提取到的三元组内的潜在特征,DistMult算分数f ( h , r , t ) = e h T M r e t f(h,r,t)=e_h^TM_re_t f (h ,r ,t )=e h T ​M r ​e t ​

code:https://github.com/TomersHan/GAEAT

Original: https://blog.csdn.net/qq_39388410/article/details/114312187
Author: 上杉翔二
Title: 知识图谱用于推荐系统问题(MVIN,KERL,CKAN,KRED,GAEAT)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/556788/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球