【Pytorch基础教程28】浅谈torch.nn.embedding

2023年7月21日下午5:43 • 人工智能 • 阅读 48

学习总结

文章目录

学习总结
一、nn.Embedding
二、代码栗子
*
2.1 通过embedding降维
2.2 RNN中用embedding改进
2.3 deepFM模型中embedding
Reference

一、nn.Embedding

CLASStorch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, norm_type=2.0, scale_grad_by_freq=False, sparse=False, _weight=None, device=None, dtype=None)[

torch.nn.Embedding经常用来存储单词embedding，使用对应indices进行检索对应的embedding。从上面的官方参数看：

输入（最重要的还是前三个参数）：
torch.nn.Embedding(
num_embeddings, – 词典的大小尺寸，比如总共出现5000个词，那就输入5000。此时index为（0-4999
embedding_dim,– 嵌入向量的维度，即用多少维来表示一个符号。
padding_idx=None,– 填充id，比如，输入长度为100，但是每次的句子长度并不一样，后面就需要用统一的数字填充，而这里就是指定这个数字，这样，网络在遇到填充id时，就不会计算其与其它符号的相关性。（初始化为0）
（不常用）max_norm=None, – 最大范数，如果嵌入向量的范数超过了这个界限，就要进行再归一化。
（不常用）norm_type=2.0, – 指定利用什么范数计算，并用于对比max_norm，默认为2范数。
scale_grad_by_freq=False, 根据单词在mini-batch中出现的频率，对梯度进行放缩。默认为False.
sparse=False, – 若为True,则与权重矩阵相关的梯度转变为稀疏张量。
_weight=None)
输出：[规整后的句子长度，样本个数（batch_size）,词向量维度]

注：

对句子进行规整，即对长度不满足条件的句子进行填充pad（填充的值也可以自己选定），另外句子结尾的EOS也算作一个词。
可以通过 weight看对应的embedding字典矩阵对应的初始化数值，一般是通过正态分布进行初始化。

二、代码栗子

2.1 通过embedding降维

独热编码向量：维度会太高、向量系数、硬编码。
通过embedding将向量编码为低维、稠密的向量（从data中学习）。

一个1乘4维度矩阵传入10乘3的nn.embedding中，然后得到1乘4乘3矩阵：


embedding = nn.Embedding(10, 3, padding_idx=2)
print(embedding.weight, "\n")

input = torch.LongTensor([[0,2,0,5]])
print(input.shape, "\n")

ans2 = embedding(input)
ans2.shape

ans2

对应的结果如下，可以看到分别检索出对应的第0,2,0,5行embedding默认的初始权重数据：

Parameter containing:
tensor([[-0.8261,  1.9007,  1.4342],
        [ 1.6798, -0.3864, -1.0726],
        [ 0.0000,  0.0000,  0.0000],
        [-0.9938,  0.3280,  0.1925],
        [-0.2799, -0.9858, -0.7124],
        [ 0.4406,  0.3621, -0.1915],
        [-0.1846,  0.2060, -0.4933],
        [-0.4918,  0.0625, -0.5818],
        [ 0.6995,  0.6223, -1.4094],
        [ 0.3378, -1.0894, -0.7570]], requires_grad=True)

torch.Size([1, 4])

tensor([[[-0.8261,  1.9007,  1.4342],
         [ 0.0000,  0.0000,  0.0000],
         [-0.8261,  1.9007,  1.4342],
         [ 0.4406,  0.3621, -0.1915]]], grad_fn=<EmbeddingBackward0>)

如果input是对应的2乘4矩阵：


import torch
import torch.nn as nn
from torch.autograd import Variable

embedding = nn.Embedding(10, 3)

input1 = torch.LongTensor([[1, 2, 4, 5],
                           [4, 3, 2, 9]])
emb1 = embedding(input1)
print(emb1)
print(emb1.shape)

print('-' * 60)

embedding = nn.Embedding(10, 3, padding_idx = 0)
input2 = Variable(torch.LongTensor([[0, 2, 0, 5]]))
emb2 = embedding(input2)
print(emb2)
print(emb2.shape)

`python
tensor([[[ 0.3004, -0.7126, 0.8605],
[ 0.1484, -0.9476, 1.0352],
[ 2.2382, -0.3619, -1.6866],
[-0.2713, 0.3627, 0.4067]],

    [[ 2.2382, -0.3619, -1.6866],
     [ 1.2409,  0.6028,  0.0371],
     [ 0.1484, -0.9476,  1.0352],
     [-0.5018,  0.3566, -0.6405]]], grad_fn=<EmbeddingBackward>)

torch.Size([2, 4, 3])

Original: https://blog.csdn.net/qq_35812205/article/details/125303611
Author: 山顶夕景
Title: 【Pytorch基础教程28】浅谈torch.nn.embedding

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/707536/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Seaborn – 绘制不同类型的回归(Regression)曲线

读取csv数据： df = pd.read_csv(file_path) print(df.info()) 根据2个数组，绘制regplot，regplot是回归(regressi…

人工智能 2023年6月18日
0089
yolov5篇—官方ultralytics / yolov5代码复现，训练自己的数据集

文章目录官方ultralytics / yolov5代码复现，训练自己的数据集一、Requirements 二、准备自己的数据集（VOC格式） * 1、创建数据集 2、准备la…

人工智能 2023年6月24日
0071
ex1-linearRegression

在本练习中，您将实现线性回归并了解其在数据上的工作原理。在开始练习前，需要下载如下的文件进行数据上传： ex1data1.txt -单变量的线性回归数据集 ex1data2….

人工智能 2023年6月16日
0070
数字图像处理

数字图像处理 1.1数字图像与数字图像处理图像处理方法 1、数字图像处理 2、模拟图像处理（光学方法，处理的信息量大，难有判断功能） 3、光电结合处理图像处理（狭义）：输入和输…

人工智能 2023年6月20日
00101
语义分割数据集：Cityscapes的使用

本文主要介绍Cityscapes在语义分割方向上的理解和使用。 Cityscapes官网：官方网站 Cityscapes 简介 Cityscapes大致有两个数据集，分别为精细的标…

人工智能 2023年7月27日
00103
电话机器人代理怎么做

随着科学技术的发展和智能手机机器人的出现，电商行业似乎进入了一个新时代。电商机器人+电销人员的模式将会有意想不到的效果。 [En] With the development of …

人工智能 2023年5月25日
0073
使用SPACEDESK时iPad显示Connected-Display OFF解决方法

使用SPACEDESK时iPad显示Connected-Display OFF 1. SPACEDESK 概述 2. 使用SPACEDESK时iPad显示Connected-Dis…

人工智能 2023年6月30日
00262
Chapter8.2：非线性控制系统分析

此系列属于胡寿松《自动控制原理题海与考研指导》(第三版)习题精选，仅包含部分经典习题，需要完整版习题答案请自行查找，本系列属于知识点巩固部分，搭配如下几个系列进行学习，可用于期末考…

人工智能 2023年6月29日
0042
Dijkstra算法详解附完整python代码

1.定义是从一个顶点到其余各顶点的最短路径算法，解决的是有权图中最短路径问题。迪杰斯特拉算法主要特点是：从起始点开始，采用贪心算法的策略，每次遍历到始点距离最近且未访问过的顶点…

人工智能 2023年7月6日
00116
研究一下带旋转的目标检测工作

数据标注工具rolable 。需要先安装labelimg如何，安装旋转标注工具roLabelImg使用教程-python黑洞网该网址内容安装成功后执行去github clone…

人工智能 2023年7月10日
0053
人工智能内容生成元年—AI绘画原理解析

AIGC体验生成一、背景 2022年AIGC（AI生成内容）焕发出了勃勃生机，大有元年之势，技术与应用迭代都扎堆呈现。在各种新闻媒体处可以看到诸多关于学术前沿研究，以及相应落地的…

人工智能 2023年7月30日
0060
【深度学习】（五）目标检测——下篇

; 目标检测——下篇🍉 文章目录 * – 目标检测——下篇🍉* 前言🎓* 一、R-CNN回顾* 二、R-FCN* 三、YOLO系列* – 1.YOLO v1…

人工智能 2023年6月2日
0066
一文速学-时间序列分析算法之指数平滑法详解+Python代码实现

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月28日
0064
全网最详细，手把手教你树莓派安装opencv模块

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月18日
0051
ROS串口通信实验

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月2日
0075
CLIP模型的使用和训练-利用CLIP实现zero-shot的分类任务

CLIP模型文章目录 CLIP模型 * @[toc] 1 论文介绍 – 1.1 训练阶段 1.2 测试阶段 1.3 优缺点 1.4 官方给定的实验结果 2 利用CLI…

人工智能 2023年7月5日
0096

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【Pytorch基础教程28】浅谈torch.nn.embedding

文章目录

2.1 通过embedding降维

大家都在看