知识图谱论文阅读（八）【转】推荐系统遇上深度学习(二十六)–知识图谱与推荐系统结合之DKN模型原理及实现

2023年6月10日上午9:24 • 人工智能 • 阅读 131

知识图谱特征学习的模型分类汇总

知识图谱嵌入(KGE)：方法和应用的综述
论文： Knowledge Graph Embedding: A Survey of Approaches and Applications
知识表示学习的研究与进展

基于距离的翻译模型

这类模型使用基于距离的评分函数评估三元组的概率，将尾节点视为头结点和关系翻译得到的结果。这类方法的代表有TransE、TransH、TransR等；

知识图谱论文阅读（八）【转】推荐系统遇上深度学习(二十六)--知识图谱与推荐系统结合之DKN模型原理及实现

上面三个方法的基本思想都是一样的，我们以TransE为例来介绍一下这些方法的核心思想。在空间中，三元组的头节点h、关系r、尾节点t都有对应的向量，我们希望的是h + r = t，如果h + r的结果和t越接近，那么我们认为这些向量能够很好的表示知识图谱中的实体和关系。

https://blog.csdn.net/wp_csdn/article/details/79607727

https://zhuanlan.zhihu.com/p/50491255

; 基于语义的匹配模型

知识图谱嵌入(KGE)：方法和应用的综述

基于CNN的句子特征提取

下图中是第一个作者中的插图。但是我没懂，因为一般过滤器是需要三个参数的，（size， step，num）。这里给出了了size和个数，但是没有给出步长， size为2和3是没有办法访问整个句子的！不懂？
在视觉处理上，我们的滤波器滑过图像的局部块，但在 NLP 中， 我们通常使用滤波器滑过矩阵的一整行（一个单词）。因此，我们的滤波器的”宽度”通常与输入矩阵的宽度相同。高度或者说区域大小可能会有所不同，但通常每次将窗口滑过 2-5 个单词。

通常而言，绝大部分NLP问题可以归入上图所示的四类任务中：一类是序列标注，这是最典型的NLP任务，比如中文分词，词性标注，命名实体识别，语义角色标注等都可以归入这一类问题，它的特点是句子中每个单词要求模型根据上下文都要给出一个分类类别。第二类是分类任务，比如我们常见的文本分类，情感计算等都可以归入这一类。它的特点是不管文章有多长，总体给出一个分类类别即可。第三类任务是句子关系判断，比如Entailment，QA，语义改写，自然语言推理等任务都是这个模式，它的特点是给定两个句子，模型判断出两个句子是否具备某种语义关系；第四类是生成式任务，比如机器翻译，文本摘要，写诗造句，看图说话等都属于这一类。它的特点是输入文本内容后，需要自主生成另外一段文字。

解决这些不同的任务，从模型角度来讲什么最重要？是 特征抽取器的能力。尤其是深度学习流行开来后，这一点更凸显出来。因为深度学习最大的优点是”端到端（end to end）”，当然这里不是指的从客户端到云端，意思是以前研发人员得考虑设计抽取哪些特征，而端到端时代后，这些你完全不用管，把原始输入扔给好的特征抽取器，它自己会把有用的特征抽取出来。

; 模型框架

知识抽取

知识提取过程有三方面，一是得到标题中 每个单词的embedding，二是得到标题中每 个单词对应的实体的embedding。三是得到 每个单词的上下文embedding。每个单词对应的embedding可以通过word2vec预训练的模型得到。这里我们主要讲后两部分。

实体embedding
实体特征即标题中每个单词对应的实体的特征表示，通过下面四个步骤得到：

识别出标题中的实体并利用实体链接技术消除歧义
根据已有知识图谱，得到与标题中涉及的实体链接在一个step之内的所有 实体所形成的子图。
构建好知识子图以后，利用基于距离的翻译模型得到子图中每个 实体embedding（利用的是与上面构成的子图中节点之间的关系）
得到标题中每个单词对应的实体embedding。

上下文embedding
尽管目前现有的知识图谱特征学习方法得到的向量保存了绝大多数的结构信息，但还有一定的信息损失，为了更好地利用一个实体在原知识图谱的位置信息，文中还提到了利用一个实体的上下文来进一步的刻画每个实体，具体来说，即用每个实体相连的实体embedding的平均值来进一步刻画每个实体，计算公式如下：

; 新闻特征提取KCNN

在知识抽取部分，我们得到了三部分的embedding，一种最简单的使用方式就是直接将其拼接：

但这样做存在几方面的限制：

连接策略打破了单词和相关实体之间的联系，并且不知道它们的对齐方式。
单词的embedding和对应实体的embedding是通过不同的方法学习的，这意味着它们不适合在单个向量空间中将它们一起进行卷积操作。
连接策略需要单词的embedding和实体的embedding具有相同的维度，这在实际设置中可能不是最优的，因为词和实体embedding的最佳维度可能彼此不同。
因此本文使用的是multi-channel和word-entity-aligned KCNN。具体做法是先把实体的embedding和实体上下文embedding映射到一个空间里，映射的方式可以选择线性方式g(e) = Me，也可以选择非线性方式g(e) = tanh(Me + b)，这样我们就可以拼接三部分作为KCNN的输入：

基于注意力机制的用户兴趣预测

获取到用户点击过的每篇新闻的向量表示以后，作者并没有简单地作加和来代表该用户，而是计算候选文档对于用户每篇点击文档的attention，再做加权求和，计算attention：

Original: https://blog.csdn.net/qq_35222729/article/details/119757452
Author: 追赶早晨
Title: 知识图谱论文阅读（八）【转】推荐系统遇上深度学习(二十六)–知识图谱与推荐系统结合之DKN模型原理及实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/596058/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

细粒度文档图像版面分析

基于实例分割网络的细粒度文档图像版面分析英文引用：Zhao P, Wang W, Cai Z, et al. Accurate Fine-Grained Layout Analy…

人工智能 2023年6月20日
00110
【Educoder作业】问题求解——数值表示

这节课的讲的原码补码，代码实现倒是次要的，主要是理解为什么会有补码这种东西，为什么通过补码进行加法可以代替减法这个代码实现的巧妙在于用a b s abs a b s和e v a …

人工智能 2023年7月4日
00118
tfrecord原理详解手把手教生成tfrecord文件与解析tfrecord文件

1.什么是tfrecord TFRecord 是Google官方推荐的一种数据格式，是Google专门为TensorFlow设计的一种数据格式。 TFRecord本质上是二进制文件…

人工智能 2023年5月23日
00128
Python——数据分析，原来女孩子喜欢这些礼物

每次情人节我都会问女朋友，你喜欢啥？你想要啥？但是每次女朋友每次都说：”你自己想，伸手要来的没有惊喜”。这搞的我还没到情人节就开始失眠了，总是担心送的礼物她…

人工智能 2023年7月16日
00123
python将红底证件照转成蓝底

前言 emmm…快开学了，手头只有红底证件照，但是学院要求要蓝底，这可咋办呢。懒得下ps了。自己撸起来吧。方法一: lableme lableme标注完后。得到一个j…

人工智能 2023年7月19日
00111
自动驾驶仿真：VTD的SCP命令详解

文章目录前言一、SCP与VTD的通讯方式 * – 1、GUI界面发送SCP命令 2、Scenario发送SCP命令 3、外部TCP发送SCP命令二、SCP命令格式…

人工智能 2023年6月11日
00119
【机器视觉案例】(11) 眨眼计数器，人脸关键点检测，附python完整代码

各位同学好，今天和大家分享一下如何使用 mediapipe+opencv实现眨眼计数器。先放张图看效果。下图左侧为视频图像，右侧为平滑后的人眼开合比曲线。以左眼为例，若眼眶上…

人工智能 2023年7月19日
00140
Pyecharts简单实战——文章词云（Pyecharts库+jieba库）

题主最近要做一个政策可视化的小项目参加学校的比赛。想做一个简介凝练可以传达文章主题的图表，于是自然地想到了词云图。词云图需要原料，就是词语和词频。为了解决这个原料需求，简单利用…

人工智能 2023年5月28日
00103
【pytorch】将模型部署至生产环境：使用opencv(C++)中的dnn模块或onnxruntime(python)直接调用ONNX模型

(一）待训练模型采用CIFAR10，10分类按上述源码训练后得到模型参数文件：saveTextOnlyParams.pth关于onnx及onnxruntime使用见：【pytorc…

人工智能 2023年7月24日
00144
SPSS入门教程——方差齐性检验的方法有哪些

SPSS方差齐性检验，即检验样本数据的方差是否相同的一种方法。什么情况下需要进行方差齐性检验？在经典的线性回归模型中，方差齐性是进行回归的前提要素之一，因OLS(最小二乘法)回归式…

人工智能 2023年7月27日
0077
Javaweb：HTTP协议与Web服务端开发环境（一）

一、http协议 • 套接字（Socket）是通信的基石，是支持TCP/IP协议的网络通信的基本操作单元。• Socket可以看成在两个程序进行通讯连接中的一个端点，一个程序将一段…

人工智能 2023年6月29日
0075
【神经网络】(18) EfficientNetV2 代码复现，网络解析，附Tensorflow完整代码

各位同学好，今天和大家分享一下如何使用 Tensorflow 搭建 EfficientNetV2 卷积神经网络模型。 EfficientNetV2 在 EfficientNetV1…

人工智能 2023年5月25日
00218
上采样之最近邻插值、双线性插值

上采样之最近邻插值、双线性插值一、最近邻插值二、双线性插值一、最近邻插值设i+u, j+v(i, j为正整数， u, v为大于零小于1的小数，下同)为待求象素坐标，则待求象…

人工智能 2023年6月20日
00149
windows 安装 Elasticsearch

一.官网下载安装包 *Elasticsearch高版本内置jdk，无需使用系统安装的java，本文以 8.3.3 版本为例，无需修改配置文件 1. 下载安装包 https://ww…

人工智能 2023年7月30日
0093
python 逻辑回归算法实现文本情感分类（Logistic Regression）

一、算法介绍逻辑回归模型是一种判别概率模型，直接学习条件概率分布 P（Y | X）作为预测模型。 · 二元逻辑回归模型：设 x = {x1, x2, ……,…

人工智能 2023年6月17日
00144
推荐系统！基于tensorflow搭建混合神经网络精准推荐！

💡 作者：韩信子@ShowMeAI📘 深度学习实战系列：https://www.showmeai.tech/tutorials/42📘 TensorFlow 实战系列：https:…

人工智能 2023年5月23日
00111

2024 年 6 月
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30