多分类神经网络：Softmax回归

2023年7月1日上午11:08 • 人工智能 • 阅读 75

在机器学习中，我们会使用二分类算法的Many-vs-Many（多对多）和One-vs-Rest（一对多）模式来进行多分类。其中，OvR是指将多个标签类别中的一类作为类别1，其他所有类别作为类别0，分别建立多个二分类模型，综合得出多分类结果的方法。MvM是指把好几个标签类作为1，剩下的几个标签类别作为0，同样分别建立多个二分类模型来得出多分类结果的方法。这两种方法非常有效，尤其是在逻辑回归做多分类的问题上能够解决很多问题，但是在深度学习世界却完全不奏效。理由非常简单：

逻辑回归是一个单层神经网络，计算非常快速，在使用OvR和MvM这样需要同时建立多个模型的方法时，运算速度不会成为太大的问题。但真实使用的神经网络往往是一个庞大的算法，建立一个模型就会耗费很多时间，因此必须建立很多个模型来求解的方法对神经网络来说就不够高效。
我们有更好的方法来解决这个问题，那就是softmax回归。

那每个概率是如何计算出来的呢？来看Softmax函数的公式：

其中e为自然常数（约为2.71828),z与sigmoid函数中的z一样，表示回归类算法（如线性回归）的结果。K表示该数据的标签中总共有K个标签类别，如三分类时K=3，四分类时K=4。k表示标签类别k类。很容易可以看出,Softmax函数的分子是多分类状况下某一个标签类别的回归结果的指数函数,分母是多分类状况下所有标签类别的回归结果的指数函数之和，因此 Softmax函数的结果代表了样本的结果为类别k的概率。

torch中的softmax函数有两个参数，第一个参数是我们输入的用来进行计算的张量z，另一个参数则是 希望运行softmax计算的维度的索引。softmax函数只能对单一维度进行计算，它只能够识别单一维度上的不同类别，但我们输入softmax的张量却可能是一个很高维的张量。所以softmax函数中需要我们输入的，就是我们希望在哪个维度上进行softmax运算。比如：

对于s而言，我们现在有三个维度——最外层代表了”2个二维张量”，3则代表每个二维张量中有3行，最后的2则代表每个二维张量中有2列。此时，我们可以从外向内索引我们的维度，索引0对应的就是最外层，索引2对应的就是最里层，相似的，我们也可以反向索引，-1对应的就是最里层，-3对应的就是最外层。

torch.softmax(s,dim=0)

在整个张量中，有2个张量，一个二维张量就是一类

torch.softmax(s,dim=1)

在一个二维张量中，有3行数据，每一行是一种类别

torch.softmax(s,dim=2)

在每一行中，有4个数据，每个数据是一种类别

代码如下：

在实际中，训练神经网络时往往会使用softmax函数，但在预测时就不再使用softmax函数，而是直接读取结果最大的z对应的类别了。但无论如何，了解softmax是必要的，也是非常有用的。

Original: https://blog.csdn.net/qq_44289607/article/details/122754433
Author: L_bloomer
Title: 多分类神经网络：Softmax回归

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/663247/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pandas 读取excel文件

pandas 读取excel文件 * – 一 read_excel() 的基本用法 – 二 read_excel() 的常用的参数: – 三示…

人工智能 2023年7月6日
0070
python 针对二分类问题画roc曲线

代码详解： import numpy as np import matplotlib.pyplot as plt from sklearn.preprocessing import…

人工智能 2023年7月2日
0087
PDAF原理简介

1.PDAF原理原理：是在感光芯片上预留出一些规律性对称的遮蔽像素点，专门用来进行相位检测，通过像素之间的距离及变化来决定对焦的偏移量即相位差（PD值）从而实现快速对焦。 1.1…

人工智能 2023年7月27日
00112
基于粒子群优化算法的UAV三维路径规划研究付Matlab代码

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月30日
0097
Text to image论文精读SSA-GAN：基于语义空间感知的文本图像生成 Text to Image Generation with Semantic-Spatial Aware GAN

目录一、原文摘要二、为什么提出SSA-GAN 三、SSA-GAN * 3.1、文本编码器 3.2、SSACN 块 – 3.2.1、上采样块 3.2.2、掩码预测器 …

人工智能 2023年5月28日
0084
Mx-yolov3+Maixpy+ K210进行本地模型训练和目标检测

我接触K210同样也是因为一次比赛，需要进行目标检测并对垃圾进行分类，在接触到K210之前我一直使用各种YOLO版本检测，并部署到树莓派和nano上，一次偶然的机会，我发现了K21…

人工智能 2023年6月17日
0079
tensorflow 2.X官网、keras官网介绍

@创建于：2022.03.26@修改于：2022.03.26 文章目录 * – 1、官网 – + 1.1 查看版本 + 1.2 查看keras &#8211…

人工智能 2023年5月25日
00100
自动驾驶仿真 (三)—— 基于PreScan与Simulink的AEB系统仿真

自动驾驶仿真三—— 基于PreScan与Simulink的AEB系统仿真 1. AEB自动紧急制动系统 * 1. 1 TTC碰撞时间模型 1. 2 C-NCAP法规部分术语与定义 …

人工智能 2023年6月10日
0094
R语言使用pairs函数可视化散点图矩阵（scatter plot matrix）

R语言使用pairs函数可视化散点图矩阵（scatter plot matrix）目录 R语言使用pairs函数可视化散点图矩阵（scatter plot matrix） Ori…

人工智能 2023年6月19日
0065
PyTorch环境搭建、安装过程以及卸载(anaconda+清华镜像+安装pyTorch）

本文介绍基于Anaconda环境以及PyCharm软件结合，安装PyTorch深度学习框架。一. 安装anaconda 此处默认已经安装好了anaconda.(也可以去anaco…

人工智能 2023年7月21日
0067
基于MCRA-OMLSA的语音降噪(一)：原理

前面的几篇文章讲了webRTC中的语音降噪。最近又用到了基于MCRA-OMLSA的语音降噪，就学习了原理并且软件实现了它。MCRA主要用于噪声估计，OMLSA是基于估计出来的噪声去…

人工智能 2023年5月27日
0053
2022年10个特别优秀的AI应用程序，你知道几个？

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月27日
0072
【深度学习】（三）图像分类

; 图像分类🍉 文章目录 * – 图像分类🍉* 前言🎠* 一、ILSVRC竞赛* 二、卷积神经网络（CNN）发展* – 1.网络进化 – 2.A…

人工智能 2023年6月23日
0067
基于Pandas的数据清洗

源数据中会存在缺失值（空值）重复值异常值处理丢失处理有两种丢失数据： None np.nan(NaN) import numpy as np type(None)#None…

人工智能 2023年7月9日
0072
安装完tensorflow后还提示“no moudle named tensorflow”

问题：一般当成功安装好tensorflow后，会有如下提示：但是，当你进入python界面对tensorflow版本进行验证时还会出现：”no moudle nam…

人工智能 2023年5月23日
0099
【目标检测】Flask+Docker在服务器部署YOLOv5应用

前言看到不少文章讲解用Flask部署YOLOv5的，不过基本都在本地上能够运行而戛然而止。因此，我打算再进一步，利用Docker在云服务器上部署YOLOv5，这样就能够开放给别人…

人工智能 2023年7月11日
00153

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

多分类神经网络：Softmax回归

在整个张量中，有2个张量，一个二维张量就是一类

在一个二维张量中，有3行数据，每一行是一种类别

在每一行中，有4个数据，每个数据是一种类别

大家都在看