《社交电商中的分享推荐研究》论文阅读笔记

2023年7月14日下午3:53 • 人工智能 • 阅读 98

A Study of Share Recommendation in Social E-commerce

《社交电商中的分享推荐研究》
该论文收录于35th AAAI 2021: Virtual Event
CCF A 类会议
原文链接

文章目录

A Study of Share Recommendation in Social E-commerce
一、摘要
二、简介
*
分享推荐需要解决以下问题：
–
本文贡献
三、正文部分
*
HGSRec模型
–
四、实验结果
*
数据集
基线模型
性能评估
注意力分析
在线实验

一、摘要

社交电商的蓬勃发展催生了多样化的推荐需求，并伴随着一种新的推荐模式—— 分享推荐。

与传统的二元推荐不同，分享推荐模型是

分享推荐通过整合社交关系和购买行为，提高了用户粘性并通过用户影响力变现

但是遇到了三个挑战：丰富的异构信息、复杂的三元交互和不对称的分享行为。

本文提出了一种基于异构图神经网络的共享推荐模型，称为 HGSRec。
HGSRec 包括一个三方异构 GNN 来描述用户和项目的多重特征，然后通过使用双重共同注意机制捕获潜在的三元依赖关系来动态融合这些信息，然后利用三元组来描述共享动作的不对称性并预测是否发生共享操作。

离线实验证明了 HGSRec 的优越性，与现有技术相比有显著改进（11.7%-14.5%），淘宝平台上的在线 A/B 测试进一步证明了 HGSRec 的高工业实用性和稳定性。

分享推荐和二元推荐的比较：

; 二、简介

由于以下特点，分享推荐一直是社交电子商务中一种独特的推荐模式:
首先，分享推荐结合了社交关系和物品推荐的优点。大多数用户同时存在于商业网络和社交网络中，因此用户非常了解他的购买项目，也了解他的朋友。分享推荐不仅可以增强用户的粘性和活跃度，还可以将用户影响力变现（例如注意力经济和网红经济）。其次，分享推荐具有可靠性。由于用户既知道推荐的商品，也了解他的朋友，所以用户的分享行为对他的朋友来说是可信的，这增加了推荐的可靠性，从而有利于购买行为。

分享推荐的目标是预测

分享推荐需要解决以下问题：

1、丰富的异构信息

分享推荐通常包含复杂的异构信息，包括用户和物品之间复杂的交互，以及大量用户和物品的特征信息。这样的例子如下图所示。需要处理复杂的交互并同时利用不同的特征的问题。

; 2、复杂的三元交互

需要考虑一个分享行为的适用性，评估三个对象（例如，u2，i3，u3）在分享动作中的匹配程度。根据推荐物品的特点，用户会将其推荐给合适的朋友，因此应该考虑该物品对用户（或朋友）的影响。

在上图中，用户 u2 会将鞋子 i3 分享给他的同学 u3，而不是他的妈妈 u1。所以需要对用户、物品和朋友的三元交互进行建模，考虑它们的适用性。

3、非对称分享行为

分享动作是不对称且不可逆的，这意味着如果交换用户和朋友的角色，分享行为可能不会发生。
用户 u2 可以将一件女式大衣 i1 分享给他的妈妈 u1，而用户 u1 不会将女式大衣 i1 分享给她的儿子 u2。因此，理想的模型应该考虑共享行为的不对称性。

本文贡献

本文首先研究了分享推荐问题，并提出了一种基于异构图神经网络的分享推荐模型（HGSRec）。将分享推荐系统建模为属性异构图以集成丰富的异构信息，然后设计 HGSRec 来学习 u、i、v 的嵌入向量并预测分享动作 hu、i、vi 发生的概率。
具体来说，在通过编码丰富的节点特征初始化节点嵌入之后，设计了一个三方异构 GNN，通过聚合它们的基于meta-path的邻居来分别学习 u、i、v 的嵌入，这使得 HGSR 能够灵活地融合不同方面的信息。动态融合不同meta-path的时候利用了双重注意力机制。

三、正文部分

HGSRec模型

HGSRec 的总体框架: (a) 通过特征嵌入初始化用户和项目嵌入。 (b) 通过三方异构图神经网络更新节点嵌入。 © 通过双重共同注意机制动态融合嵌入。 (d) 通过传递三元组表示对非对称共享行为进行建模。

; 1、初始化节点向量

首先将用户、商品、朋友的特征信息初始化这些节点的嵌入向量
特征嵌入有两个好处：（1）在实际应用中，每天都有大量新节点。特征嵌入通过利用它们的特征有效地为以前未见过的节点生成嵌入。 (2) 特征数量远少于节点数量，显着减少了可学习参数的数量。

对于节点的第k个特征，初始化一个特征向量矩阵Mfk
u 的第 k 个特征的向量如下所示

所以用户u的节点特征用下面的式子表示：
《社交电商中的分享推荐研究》论文阅读笔记

WU是权重矩阵，bU是偏置向量。

物品和朋友的向量初始化都是一样的过程

2、三方异构图神经网络

本文提出了三元异构 GNN，分别通过相应的异构 GNN（即 HeteGNNU 、 HeteGNNI 和 HeteGNNV）来学习 u、i、v 的嵌入。异构 GNN 通常遵循分层方式：它首先通过一个metapath聚合来自一种邻居的信息，并在节点级别学习语义特定的节点嵌入。然后，它聚合来自不同元路径的多个语义，并在语义级别融合一组特定于语义的节点嵌入。

具体来说，给定一个用户 u 和 k1 个与该用户相关的元路径，HeteGNNU 能够获得 k1 个语义特定的用户嵌入

不同节点的基于元路径的邻居的数量可能会有很大差异，因此我们需要对固定数量的邻居进行采样。随机采样策略会导致大量计算消耗和丢失重要节点。
本文提出了一种 top-N 语义采样策略：（1）如果基于元路径的邻居的数量大于固定数量 N，我们基于连接强度指标筛选（例如，多少次用户查看该物品）。 (2) 否则，我们采用重复采样来获得 N 个基于元路径的邻居。

本文提出了一种语义聚合器SemAgg，用于聚合用户u和对应的meta-path ΦU下的邻居：

考虑到时间效率，本文采用 MeanPooling 来加速聚合处理以加快预测速度。

为了凸显用户u本身属性的重要性，将初始嵌入 xu 和基于元路径的嵌入连接起来，得到语义特定的用户嵌入：

对于friend对象v们，也一样会得到：

由于项目的特征比用户简单且稳定，我们只采用一个元路径ΦI，通过 HeteGNNI 得到项目 i 的嵌入XiΦ :
《社交电商中的分享推荐研究》论文阅读笔记

; 3、双重共同注意机制 Co-Attention Mechanism

在获得一组特定于语义的节点嵌入后，接下来的目标是基于复杂的三元交互 hu、i、vi 正确融合它们。因此，考虑到项目 i 的影响，设计了一种双重共同注意机制来动态融合 u（或 v）在不同元路径下的嵌入。

该部分由U和I的共同注意力机制CoAttU,I，和V和I的共同注意力机制CoAttV,I两部分组成

具体来说，它学习了 hu、i、vi 元路径的交互特定注意力值，并获得了 u、v 的最合适的嵌入，具有以下好处：（1）它增强了 hu、i、vi 的依赖性，使 HGSRec更完整。 (2) 它动态融合了 u（或 v）的嵌入，提高了共享适用性。

CoAttU,I为用户U学习一组特定于与物品交互的注意力权重：

具体来说，我们将 u 和 i 的语义嵌入向量连接起来，并将它们投影到共同注意空间中。然后，我们采用共同注意向量 qU,I 来学习元路径对用户 u 的重要性。 metapathΦUm 对 U 在相互作用 U, I中的重要性

接下来对权重进行softmax归一化：

进而得到了U的嵌入向量如下：
《社交电商中的分享推荐研究》论文阅读笔记

“朋友”对象V和U的过程一样
对于物品I，因为只有一种metapath所以依旧是XiΦ，没有注意力部分

4、传递三元组表示

为了预测分享行为，我们需要基于u, i, v，通过hu, hi, hv, 构建一个三元组表示数ru,i,v
我们首先通过三个特定类型的 MLP，将三个对象的H属性投影到同样的向量空间上

构建三元组表示 ru,i,v 的一种简单方法是连接所有节点嵌入（ zu||zi||zv）
但是简单的连接并不能明确捕捉分享动作的显着特征：
（1）分享推荐实际上是基于用户和项目对候选朋友进行排名（例如，计算 zu + zi 和 zv 之间的相似度），所以分享动作是不对称的，用户和朋友的角色不能互换。（2）item描述了用户和好友之间的转换，是建立分享动作不可缺少的桥梁。

受”关系翻译”的启发，本文提出了一个可传递的三元组表示 ru,i,v 来通过 itemtranslating 显式地建模共享动作的特征，如下所示：

然后将其放到新的一个感知机中，得到一个预测指标：

定义了如下的交叉熵损失函数，y是三元组的标签。
《社交电商中的分享推荐研究》论文阅读笔记

通过该损失函数的梯度下降，最后可以训练出模型

; 四、实验结果

数据集

从淘宝平台收集数据，范围从 2019/10/09 到 2019/10/14
每个样本包含一个分享动作 hu,i,vi和相应的标签 yu,i,v∈ {0, 1}。
为用户选择了四个元路径，包括 U-s-U、U-b-Ib-U 和 U-v-I-v-U，为商品选择 U-b-I。

在离线实验中，使用最后一天（即 2019/10/14）作为验证集，之前的 3/4/5 天作为训练集，分别标记为 3 天、4 天和 5 天.为了全面评估结果，将每个训练集的大小从 40% 更改为 100%

基线模型

选择基于特征的模型（即 LR、DNN 和 XGBoost）和 GNN 模型（即 GraphSAGE、IGC 和 MEIRec）作为基线
为了验证 HGSRec 中的精细设计，还测试了 HGSRec 的两个变体（HGSRec\att 和 HGSRec\tra）
尽管深度模型依赖于随机性，其性能随随机种子的不同而变化，但它们在大规模淘宝数据集上的性能相当稳定（即 HGSRec 的方差小于 0.001）

性能评估

如表所示，我们有以下观察结果：
(1) HGSRec 始终比所有基线表现更好，并有显着改进。与最佳baseline相比，提升幅度高达11.7%-14.5%，表明HGSRec的优越性。
(2) 大多数 GNN（即 GraphSAGE、IGC 和 MEIRec）优于基于特征的方法（即 LR、DNN 和 XGBoost），表明结构信息的重要性。当深入了解这些方法时，我们可以发现，如果采用三元交互，三方版本（即 IGC+ 和 MEIRec+）的性能明显优于原始版本。它进一步证实了为股票推荐建模三元交互的好处。
(3) 将 HGSRec 与其变体的性能进行比较，我们可以发现 HGSRec 的性能最好。 HGSRec\att 的退化表明了双重共同注意机制的有效性，而 HGSRec\tra 的退化验证了传递三元组表示的优越性。请注意，HGSRec\tra 的退化比 HGSRec\att 的退化更显着，这意味着传递三元组表示可能比双重共同注意机制做出更高的贡献。

; 注意力分析

Dual co-attention 机制可以动态融合用户和朋友关于不同项目的多个嵌入，并提高共享适用性。我们首先通过图 4(a) 中 3 天数据集上用户注意力分布的箱线图呈现宏观层面的分析。请注意，朋友上的注意力值分布也显示出类似的现象。可以看出，元路径的注意力分布不同，U-b-I-b-U的注意力值最大，方差较高，说明这条元路径对大多数用户来说是最重要的。原因是U-b-I-bU与反映最强用户偏好的用户购买行为有关。 U-b-I-b-U 的较高方差也意味着其重要性对于不同的用户差异很大。我们进一步用单个元路径测试 HGSRec，并在图 4(b) 中用相应的平均注意力值显示它们的性能。与注意力分布一致，U-b-I-b-U 是最有用的元路径，它实现了最高的 AUC 并获得了最大的注意力值。
《社交电商中的分享推荐研究》论文阅读笔记

在线实验

在线服务需要满足以下要求：（1）海量数据的存储和处理。分享推荐系统以邻接表的形式存储在 MaxCompute 中，以提高内存效率。 (2) 异常股份行为。我们过滤异常的分享行为（例如，一个用户在 24 小时内与他的朋友分享了超过数千个项目）。 (3) 新功能和缺失功能。每天都有新功能出现，因此我们利用哈希函数来映射所有功能，在发生哈希冲突时会导致性能略有下降。缺少的功能用特定的标记填充。在线结果范围从2020/01/08到2020/02/02（25天）如图7所示。这里我们选择UCTR（UCTR=Unique Click/Unique Visitor）进行在线评估。 UCTR 越大，性能越好。长期观察表明，HGSRec 的性能始终优于 XGBoost，差距很大，证明了 HGSRec 的高工业实用性和稳定性。

Original: https://blog.csdn.net/weixin_43845522/article/details/123990448
Author: 正经放
Title: 《社交电商中的分享推荐研究》论文阅读笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/692374/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

〖Python自动化办公篇㉑〗- python实现邮件自动化 – 定时发送邮件

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月5日
0066
Pytorch实现有监督对比学习损失函数

Pytorch实现有监督对比学习损失函数关于对比损失 * 有监督对比损失数学公式 Pytorch实现有监督对比损失 END 关于对比损失无监督对比损失，通常视数据增强后的图像与…

人工智能 2023年7月21日
0031
神经网络必面之手撕 —— IOU、NMS、正向卷积、池化、BN【持续更新】

一、IOU：注意：求交区域的时候，一定要和0比较大小，如果是负数就说明压根不相交 import numpy as np def ComputeIOU(boxA, boxB): x…

人工智能 2023年7月13日
0044
李航《统计学习方法》笔记之k近邻法

; 第三章 k近邻法 1.同一标签的样本通常有很多相似的特征,所以同一类别的可能有扎堆现象，也就是物以类聚。 2.每进来一个样本，我们查看它周围的样本是什么类别的，那它也有极大可能…

人工智能 2023年6月16日
0066
RepVGG论文详解（结合代码）

目录 1.简介 2.RepVGG详情 2.1 RepVGG Block 2.2 结构重参数化 2.2.1融合Conv2d和BN，将三个分支上的卷积算子和BN算子都转化为卷积算子（包…

人工智能 2023年7月28日
0081
【机器学习】Few-shot learning（少样本学习）

文章目录少样本学习的诞生元学习少样本学习少样本学习中的相关概念 * 概念1：Support set VS training set 概念2：Supervised learn…

人工智能 2023年6月15日
0086
数据分析案例-航空公司客户价值分析（聚类）

目录项目背景原始数据情况挖掘目标分析方法与过程加载数据数据预处理构建模型项目背景在企业的客户关系管理中，对客户分类，区分不同价值的客户。针对不同价值的客户提供个性…

人工智能 2023年7月4日
00118
多实例学习PCNN在关系抽取中的应用

参考文献：Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networ…

人工智能 2023年6月1日
0071
Windows cmd 命令

1.cd命令 //进入d盘 //进入F盘 cd /? //获取使用帮助 cd \ //跳转到硬盘的根目录 cd C:\WINDOWS //跳转到当前硬盘的其他文件 cd /d e:…

人工智能 2023年7月30日
0044
全卷积神经网络（FCN）论文笔记

全卷积神经网络（FCN）论文笔记 Fully Convolutional Networks for Semantic Segmentation Abstract 卷积网络是一种功能…

人工智能 2023年7月14日
0086
VIVADO HLS图像处理

VIVADO HLS实现灰度转化实验设计目的：将RGB彩色三通道图像转化为灰度单通道图像。实验步骤：之前文章介绍过VIVADO HLS图像处理的一般步骤是将IplImage图像类…

人工智能 2023年6月20日
0064
[语音分离论文小记]Dual-Path RNN (DPRNN)

模型结构 DPRNN的组成部分：分割，块处理和重叠相加。分割阶段将顺序输入分割为重叠的块，并将所有块连接为一个3-D张量。然后将张量传递到堆叠的DPRNN块，以交替方式迭代应…

人工智能 2023年5月23日
0067
OSError:libcusparse.so.11:cannotopensharedobjectfile:Nosuchfileordirectory

背景：遇到这个问题不要慌，因为我已经解决了，大概率可以帮助到你。同事给我反应遇到了上述问题，我思考了下解决这个问题的思路。解决方案： 1、确认当前nvidia对应的cuda版…

人工智能 2023年7月24日
0070
基于BP神经网络的交通安全预警模型及代码实例

文章目录前言一、BP神经网络是什么？二、模型构建 * 1.模型输入输出指标的选取 2.模型结构设计 3.层数的确定 4.各层神经元个数的确定 5.激活函数及输出层的确定 6….

人工智能 2023年7月13日
00104
R语言实现决策树和朴素贝叶斯分类预测，并比较准确度（含数据集）

R语言实现决策树和朴素贝叶斯分类预测，并比较准确度（含数据集）一开始用了《数据科学与大数据分析》（美国EMC教育服务集团）的书上的案例分析是否出去玩，后来发现只有10条训练数据，…

人工智能 2023年7月2日
0093
[附源码]java毕业设计大学新生军训管理系统

项目运行环境配置： Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX（Webstorm也行）+ Eclispe（IntelliJ IDEA,Eclis…

人工智能 2023年6月28日
0077

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30