torch.matmul() 张量相乘

2023年5月30日下午2:05 • 人工智能 • 阅读 66

如果是二维的矩阵相乘，那就跟平时咱们做的矩阵乘法一样：

a = torch.tensor([[1,2], [3,4]])

a
Out[31]:
tensor([[1, 2],
        [3, 4]])

b = torch.tensor([[2,2], [3,4]])

b
Out[33]:
tensor([[2, 2],
        [3, 4]])

torch.matmul(a, b)
Out[34]:
tensor([[ 8, 10],
        [18, 22]])

torch.matmul(a, b).shape
Out[35]: torch.Size([2, 2])

如果维度更高呢？ 前面的维度必须要相同，然后最里面的两个维度符合矩阵相乘的形状限制：i× j， j×k。

a = torch.tensor([[[1,2], [3,4], [5,6]],[[7,8], [9,10], [11,12]]])

a
Out[37]:
tensor([[[ 1,  2],
         [ 3,  4],
         [ 5,  6]],
        [[ 7,  8],
         [ 9, 10],
         [11, 12]]])

a.shape
Out[38]: torch.Size([2, 3, 2])

b = torch.tensor([[[1,2], [3,4]],[[7,8], [9,10]]])
b
Out[40]:
tensor([[[ 1,  2],
         [ 3,  4]],
        [[ 7,  8],
         [ 9, 10]]])

b.shape
Out[41]: torch.Size([2, 2, 2])

torch.matmul(a, b)
Out[42]:
tensor([[[  7,  10],
         [ 15,  22],
         [ 23,  34]],
        [[121, 136],
         [153, 172],
         [185, 208]]])

torch.matmul(a, b).shape
Out[43]: torch.Size([2, 3, 2])

这里举一个例子，在某一篇论文的代码中，作者使用matmul的场景。

简单地说，就是用过matmul()函数实现subject 的 lookup

假设有下面这么一个矩阵，shape为[batch_size, 1, seq_len]，该矩阵的含义是，最里面的每一个[ ] s e q l e n []_{seq_len}[]s e q l e n 表示一个句子的序列，如果元素为1，则表示该下标可以作为subject的head index。并且在每一行中，只有一个1。也就是只有一个subject的head index。

现在有另外一个矩阵，shape为[batch_size, seq_len, bert_dim]。该矩阵的含义是整个batch的text（[batch_size, seq_len]）经过经过bert encoder之后得到的。

根据前面说的，二者相乘，得到的shape是[batch_size, 1, bert_dim]。

比如第一行 [ 0 , 1 , 0 , . . . . 0 , 0 ] × b e r t e n c o d e 之后的矩阵 = [ 0.3 , 0.1 , . . . , 0 ] [0,1,0,….0,0]×bert encode之后的矩阵=[0.3, 0.1, …, 0][0 ,1 ,0 ,….0 ,0 ]×b e r t e n c o d e 之后的矩阵=[0 .3 ,0 .1 ,…,0 ]

最后得到的是subject在bert encode之后的空间中look up，或者说嵌入以后的向量。

Original: https://blog.csdn.net/qq_35056292/article/details/115689909
Author: y4ung
Title: torch.matmul() 张量相乘

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/542999/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

正规蓝牙耳机一般多少钱？音质好又便宜的蓝牙耳机

蓝牙耳机以强大的性能和无线的便利性取代了有线耳机，现在已经成为人们必须购买的新电子产品。对许多人来说，听音乐是他们的爱好。蓝牙耳机的出现极大地改善了无线耳机造成的音质不佳，给人们带…

人工智能 2023年5月25日
0071
如何利用Python进行数据分析

今天我们主要的目标是：给大家介绍在所有的编程语言里，为什么Python能被广泛使用，甚至排名第一，给那些做数据分析相关工作和转行的小伙伴介绍数据分析行业里如何使用Python。首…

人工智能 2023年7月15日
0053
人工智能——归结推理

归结推理思考题归结演绎推理谓词公式的范式 * 前束型范式 Skolem范式（斯克林范式）谓词公式 G 化为 Skolem 标准型的步骤子句与子句集 * 谓词公式分别化成子…

人工智能 2023年7月28日
0072
Linux_gdb_进程概念

目录进度条学习过程自主实现： Linux的git操作 .gitignore .git git add . git commit git push git log git st…

人工智能 2023年6月26日
0057
视频会议终端的主要功能和特点

实际上，视频会议就是通过各种不同的手段和设备，实现多人在不同地点进行视频会议的目的。根据手段的不同，可以分为硬件和软件两种视频会议。硬件视频会议需要厂家搭建系统、专用设备专用带宽等…

人工智能 2023年5月27日
0051
训练CNN时Jupiter notebook内核挂掉（Tensorflow）

最近在使用keras和tensorflow学习深度学习模型，在跑CNN模型的时候jupyter notebook总是不停显示内核挂掉，翻遍了中文和英文的交流网站所有的帖子的方法都没…

人工智能 2023年5月23日
0099
神经网络之损失函数

以下是一个简单的Python代码示例，展示了如何使用卷积神经网络（CNN）训练MNIST数据集，并绘制 _损失函数_曲线： python import tensorflow as…

人工智能 2023年7月13日
0067
RuntimeError: Trying to backward through the graph a second time (or directly access saved variable

用pytorch的时候发生了这个错误，写下来避免以后再次入坑。感谢这次坑让我对预训练模型的使用有了更清楚的认识。 RuntimeError: Trying to backward …

人工智能 2023年6月23日
0065
如何用算法预测世界杯？

预测2021欧洲世界杯世界杯预测结果预测的原理是什么？ * 周易算卦原理 – 算命可以解决的问题善易者不卜人工智能预测原理 – 预测模型：逻辑回归 …

人工智能 2023年5月31日
0070
计算机视觉基础学习-图像拼接

1、基础理解首先本文介绍的图像拼接并非对尺寸相同的图片进行简单拼接，而是基于全景图的拼接普通相机拍摄图像时，无法兼顾相机视场与视场中单个物体的分辨率问题，而全景相机普遍价格昂贵…

人工智能 2023年7月25日
0064
【PyTorch深度学习实践】P9 kaggle otto商品分类作业（含注释）

《PyTorch深度学习实践》-刘二大人 Otto Group Product Classification作业将商品进行十分类，输入为93个特征10个类别的商品数据集，输出为预测…

人工智能 2023年7月14日
0075
Qt+openCV学习笔记（十一）Qt5.15.2+openCV4.5.5+MSVC2019+cuda编译动态库（使用中国源）

前言：为了测试硬件加速，笔者找了一个台N卡的机器，并尝试编译带硬件加速的openCV库，虽然中间出了不少问题，但还是成功编译出来，有需要的小伙伴可以参考下一、安装cuda 在安…

人工智能 2023年7月20日
0074
目标检测算法的分类和优缺点

随着今年来科学技术的发展，尤其是人工智能和大数据技术的不断发展，不断应用于生活中的各个领域，给人们的生活带来方便和便利，深度学习这门技术也是越来越重要，目标检测也是深度学习的一个应…

人工智能 2023年6月25日
00122
SVM支持向量机原理及代码实现（包含数学原理，超详细）

记得刚开始接触svm算法的时候是在sklearn的课程上，那时候对机器学习还处于一个出生婴儿的阶段，学了一大段时间之后，也就记得了初始化，拟合模型，输出预测结果三行代码。对这个算法…

人工智能 2023年7月6日
0041
常用的串口通讯协议有哪些

串口通讯是什么?学术解释是，通过总线在一个时间点连续发送一位数据的方法。如同弓箭手频繁射出弓箭一般，嗖、嗖、嗖…… 串口通讯协议是什么?说的大白话一点，就是…

人工智能 2023年6月6日
00102
PID增量式算法

PID基础理解：文章目录 PID基础理解： * 1.首先简单的介绍下PID 2.PID的算法实现 1.首先简单的介绍下PID 这里先提供博主的学习资源：PID算法从理论到实践…

人工智能 2023年6月15日
0062

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

torch.matmul() 张量相乘

大家都在看