【Pytorch】| Pytorch中softmax的dim的详细总结

2023年7月22日上午11:38 • 人工智能 • 阅读 55

【Pytorch】| Pytorch中softmax的dim的详细总结

关于softmax的理解
*
–

作者：刘兴禄，清华大学博士在读

欢迎关注我们的微信公众号 运小筹

; 关于softmax的理解

Softmax的公式为
softmax ( x i ) = e x i ∑ i e x i \text{softmax} (x_i) = \frac{e^{x_i}}{\sum_{i}{e^{x_i}}}softmax (x i )=∑i e x i e x i
因此，其满足下面两个条件：

0 ⩽ softmax ( x i ) ⩽ 1 0 \leqslant \text{softmax} (x_i)\leqslant 1 0 ⩽softmax (x i )⩽1;
∑ i softmax ( x i ) = 1 \sum_{i} {\text{softmax} (x_i)} =1 ∑i softmax (x i )=

这个函数是为了实现对输出向量的归一化，将其标准化为概率的形式。

首先看看官方对 tf.nn.functional.softmax(x,dim = -1)的解释：

dim (python:int) – A dimension along which Softmax will be computed (so every slice along dim will sum to 1).

也就是说，在dim的纬度上，加和为1。比如，是对行加和为1，还是列加和为1。

我们来进行测试

一维向量：dim=0和dim=-1结果相同，dim=1和dim=2会报错


a = torch.tensor([1, 2, 3], dtype=float)
soft_max_a = torch.nn.functional.softmax(a, dim = 0)

soft_max_a = torch.nn.functional.softmax(a, dim = -1)

二维张量：dim=1和dim=-1结果相同，dim=2会报错

'''
假设张量为2维张量： a = torch.tensor([[1, 2, 3],
                                    [4, 5, 6]], dtype=float)
'''

a = torch.tensor([[1, 2, 3],[4, 5, 6]], dtype=float)
soft_max_a = torch.nn.functional.softmax(a, dim = 0)
'''
soft_max_a = tensor([[0.0474, 0.0474, 0.0474],
        [0.9526, 0.9526, 0.9526]], dtype=torch.float64)
'''

soft_max_a = torch.nn.functional.softmax(a, dim = 1)
'''
soft_max_a = tensor([[0.0900, 0.2447, 0.6652],
        [0.0900, 0.2447, 0.6652]], dtype=torch.float64)
'''

soft_max_a = torch.nn.functional.softmax(a, dim = -1)
'''
soft_max_a = tensor([[0.0900, 0.2447, 0.6652],
        [0.0900, 0.2447, 0.6652]], dtype=torch.float64)
'''

最终结论

上面只是对各种情况的探索，可以理解，但是不要生搬硬套。下面的总结才是正确的理解方式，只需要看这里就好。

dim的可选值有0，1， 2， -1，其中：

dim=0: 第1个维度加和为1，也就是列
dim=1: 第2个维度加和为1，也就是行
dim=2: 第3个维度加和为1，每一个二维矩阵的对应元素加和为1
dim=-1: 最后一个维度加和为1。
– 如果输入向量是1维，则就是该维（也就是对第1维）加和为1；
– 如果输入向量是2维，则就是对列（也就是对第2维）加和为1；
– 依次类推…

欢迎关注我们的微信公众号 运小筹

公众号往期推文如下

Original: https://blog.csdn.net/HsinglukLiu/article/details/123192780
Author: 刘兴禄
Title: 【Pytorch】| Pytorch中softmax的dim的详细总结

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/708941/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

NLP 自然语言分析理解

自然语言处理(NLP，Natural Language Processing) 是研究人与计算机交互的语言问题的一门学科。按照技术实现难度的不同，这类系统可以分成简单匹配式、模糊…

人工智能 2023年5月28日
0085
二叉树的学习

目录一、二叉树的基本概念二、二叉树的性质（一）二叉树的性质（二）完全二叉树的常考性质三、二叉树的存储结构（一）二叉树的顺序存储（二）二叉树的链式存储结构四、二叉树的…

人工智能 2023年6月28日
0055
Swin Transformer 代码学习笔记(目标检测)

本文主要针对目标检测部分的代码。源码地址：GitHub – SwinTransformer/Swin-Transformer-Object-Detection: Th…

人工智能 2023年6月24日
00101
python中subprocess模块subprocess.run，subprocess.getoutput，subprocess.Popen、subprocess.call的使用

subprocess可以帮我们执行命令，获取执行结果及返回内容。 1、subprocess.run() 此方法为python3.5版本后的推荐方法，可以获取执行结果、返回内容等一些…

人工智能 2023年7月6日
0092
天鹰算法AO

3.1 第一种方法是垂直弯腰的高空翱翔，用于捕猎飞行中的鸟类，在这种情况下，天鹰座上升到地面的高处。一旦探索猎物，鹰隼就会进入一个长而低的角度滑翔，随着翅膀的进一步靠近，速度会提高…

人工智能 2023年5月31日
0082
RabbitMQ——死信队列（消息超时、达到最大长度、消费拒绝）（六）

RabbitMQ——死信队列（六）死信的概念死信：无法被消费的消息，一般情况下：生产者将消息投递到broker或者直接到queue中，消费者从queue…

人工智能 2023年6月29日
0076
机器学习强基计划4-3：详解朴素贝叶斯分类原理(附例题+Python实现)

目录 0 写在前面 1 贝叶斯方法 2 贝叶斯风险 3 从例子出发 4 朴素贝叶斯分类 * 4.1 核心原理 4.2 拉普拉斯平滑 5 Python实现 * 5.1 计算类先验概率…

人工智能 2023年7月1日
0063
山东大学nlp实验–词向量

1.1基础知识介绍 class sklearn.preprocessing.OneHotEncoder(*, categories=’auto’, drop=None, spars…

人工智能 2023年5月31日
0093
【ZED】从零开始使用ZED相机（二）：打开相机+捕获图像

百度云盘分享简介笔者当初为了学习JAVA，收集了很多经典源码，源码难易程度分为初级、中级、高级等，详情看源码列表，需要的可以直接下载！这些源码反映了那时那景笔者对未来的盲目，…

人工智能 2023年7月28日
0072
使用OpenCV、ONNXRuntime部署YOLOV7目标检测——记录贴

这两天想实现yolov5的tensort加速，小白一枚，领悟甚浅，只能记录一下，防止遗忘了。先记录一下yolov7： yolov7的OpenCV、ONNXRuntime部署分享…

人工智能 2023年5月26日
00116
Sklearn机器学习——预测明天是否会下雨

目录 1 案例介绍 1.1 案例目的 1.2 案例数据 2 代码实现 2.1 导库导数据、探索特征 2.1.1 导入需要的库 2.1.2 导入数据、探索数据 2.2 分集，优先探索…

人工智能 2023年7月26日
00100
知识图谱 — pyhanlp实现命名体识别（附命名体识别代码）

上篇文章将到了使用jieba、pyhanlp、smoothnlp工具进行文本分词，这篇文章在上篇分词的基础上接着讲解命名体识别，感兴趣的朋友请点我进入到上篇文章查看分词工具的使用。…

人工智能 2023年6月1日
0086
嵩天《Python网络爬虫与信息提取》实例4：股票数据定向爬虫

这一部分将结合嵩天老师在网络爬虫专题课程讲解的requests库和re库的知识进行股票数据定向爬虫代码编写，同时运用json库和csv库对爬取的股票信息数据进行处理与保存。说明：…

人工智能 2023年6月19日
00142
【软件工程】作业3

文章目录 “图书”数据字典形式化方法 * 形式化方法的概念软件工程领域的形式化方法形式化方法的分类应用场景优缺点分析 – 优点缺点 …

人工智能 2023年6月20日
0071
网球目标检测——基于Python-OpenCV

1.问题描述本文章实现了通过读取摄像头所拍摄的图像，实时检测图像中的网球并推算其距离、确定其方位。核心问题是如何从摄像头拍摄的画面中检测出网球，并排除干扰项。此外，为了将该方法…

人工智能 2023年7月10日
0068
数据分析一、 pandas库基础知识

pandas库基础知识一、jupyter 代码编辑器概述：Python 数据分析库介绍二、pandas 库基础知识 * （1）常用的Series属性与方法：（2） Data…

人工智能 2023年7月6日
0070

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【Pytorch】| Pytorch中softmax的dim的详细总结

【Pytorch】| Pytorch中softmax的dim的详细总结

一维向量：dim=0和dim=-1结果相同，dim=1和dim=2会报错

二维张量：dim=1和dim=-1结果相同，dim=2会报错

最终结论

大家都在看