神经网络最后一层处理

2023年6月16日上午10:28 • 人工智能 • 阅读 91

神经网络最后一层处理

回归任务
分类任务
*
二分类
多分类

通常，根据目标任务的不同，神经网络的最后一层处理方式也会不同。这篇文章将根据任务类型分别讨论。

回归任务

如果目标任务的预测值在 ( − ∞ , + ∞ ) (-\infty,+\infty)(−∞,+∞)，一般默认不使用激活函数，意味着神经网络的输入和输出是线性关系。不过，以这种目标为任务的神经网络，一般在隐藏层使用非线性激活函数，在输出层不使用激活函数。
如果目标任务的预测值在 [ 0 , + ∞ ) [0,+\infty)[0 ,+∞)，一般使用ReLU，例如房价预测的回归任务。和上面一样，在隐藏层一般可以使用非线性激活函数，输出层使用ReLU函数。

分类任务

二分类

二分类任务一般使用 Sigmoid，使输出的值集中在 ( 0 , 1 ) (0,1)(0 ,1 ) 之间，也就是一个概率值，通常还需要搭配二分类交叉熵。作二分类时，输出的值一般用向量表示，含两个数值（也就是两个神经元），分别对应两个类别。其中一个大于0.5，则认为神经网络的结果属于对应0.5位置的类别。

多分类

多分类任务一般使用softmax，使输出的值集中在 ( 0 , 1 ) (0,1)(0 ,1 ) 之间，与二分类相似。多分类的最后一层通常由全连接层+Softmax（分类网络）组成，如下图所示：

由于Softmax常常会搭配one-hot的标签使用，所以经过Softmax的最后一层，往往会选择最后一层的神经元输出中最大的值对应的索引，作为整层神经元最后的结果。
全连接层将倒数第二层的神经元个数压缩/扩张到分类的数量K（如八分类对应的分类数为8），每个神经元为一个实数，经过softmax，将这K个数映射到 ( 0 , 1 ) (0,1)(0 ,1 ) 之间的实数，也就是概率，而且这K个实数之和为1。

推荐阅读：神经网络最后一层需要激活函数吗？

Original: https://blog.csdn.net/Frank_LJiang/article/details/123480116
Author: lijfrank
Title: 神经网络最后一层处理

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/623373/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Logistic回归——二分类 —— matlab

目录 1.简介 2.应用范围 3.分类 3.应用条件 4.原理详解 4.1 sigmod分类函数 4.2 建立目标函数 4.3 求解相关参数 5.实列分析 5.1 读取数据（exc…

人工智能 2023年6月17日
0099
【Python与数据分析实验报告】Pandas数据分析基础应用

目录任务内容 * (1)将数据进行转置，转置后型如eg.csv, 缺失值用NAN代替。 (2) 对数据中的异常值进行识别并用NA代替。 (3) 计算每个用户用电数据的基本统计量，…

人工智能 2023年7月15日
0073
Pycharm的安装并且连接已有的Python环境实现自由编译（附中文配置）｜并通过Pycharm实现增加网站访问

🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🥇博主昵称：Jovy. 🍟博客主页：Jovy.的博客🥗 感谢点赞👍评论🃌⚇很方便的在线编辑器： Lightly 目录今日热点 Python环境的配置…

人工智能 2023年7月4日
0083
[ 可视化 ] 经典网络模型 —— Grad-CAM 详解与复现

🤵 Author ：Horizon Max ✨ 编程技巧篇：各种操作小结 🎇 机器视觉篇：会变魔术 OpenCV 💥 深度学习篇：简单入门 PyTorch 🏆 神经网络篇：经典网络…

人工智能 2023年6月16日
00111
一文带你读懂DETR模型

论文地址： End-to-End Object Detection with Transformers Detr是Facebook提出来的一种目标检测结构，使用了一种基于trans…

人工智能 2023年6月24日
0076
数据清洗：异常值识别和处理方法

异常数据识别异常数据是数据分布的常态，处于特定分布区域之外的数据通常会被定义为异常或”噪音”。产生数据”噪音”的原因很多，例如业务…

人工智能 2023年6月11日
00120
欧式距离_一点注意

参考： OpenCV探索之路（二十八）：Bag of Features(BoF)图像分类实践图像检索(2):均值聚类-构建BoF [Python从零到壹] 十三.机器学习之聚类算…

人工智能 2023年5月31日
0068
Pytorch保存和加载模型(load和load_state_dict)

Pytorch目前成为学术界最流行的DL框架，没有之一。很大程度上，简洁直观地操作有关。模型的保存和加载，于pytorch而言，也是很简单的。本文做了一个比较实验，方便大家理解。首…

人工智能 2023年7月22日
0058
NVIDIA显卡驱动+CUDA+CUDNN+Tensorflow+Keras之间的关系（含各版本对应关系表）

基础介绍 Driver 与键盘驱动、鼠标驱动、打印机驱动没本质区别，硬件统一CPU和外设通信的接口，以驱动程序的形式呈现可使用nvidia-smi命令查看，需要注意的是，显卡支…

人工智能 2023年5月24日
0075
BladeX——精心设计的微服务架构

采用前后端分离模式，前端提供两套架构，Sword 基于React，Saber基于 Vue 提供两套后端架构，基于 SpringCloud的分布式架构以及基于SpringBoot…

人工智能 2023年5月30日
0061
改进YOLOv5系列：10.最新HorNet结合YOLO应用首发！ | 多种搭配，即插即用 | Backbone主干、递归门控卷积的高效高阶空间交互

💡统一使用 YOLOv5 代码框架，结合不同模块来构建不同的YOLO目标检测模型。 🌟本项目包含大量的改进方式,降低改进难度,改进点包含 【Backbone…

人工智能 2023年6月16日
0072
简单粗暴提升yolov5小目标检测能力

论文地址：https://arxiv.org/abs/2208.03641代码地址：GitHub – LabSAINT/SPD-Conv: Code for ECML …

人工智能 2023年6月16日
0083
YOLOX自定义数据集训练（抢先踩坑）

序言昨天被YOLOX刷屏了，各大公众号强推：性能超yolov5！！吊打一切yolo！！看麻了我，标题还能再夸张点嘛？出于对前沿技术的渴望，还是要去学习学习，论文中改进了很多地…

人工智能 2023年6月16日
00115
【C++天梯计划】1.5 深搜(DFS deep search)

文章目录 * – 什么是深搜？ – 模拟深搜 – 例题1：卒的遍历 – + * 题目描述 * 输入 * 输出 * 输入输出样例 * …

人工智能 2023年6月29日
0058
【Pytorch】| Pytorch中softmax的dim的详细总结

【Pytorch】| Pytorch中softmax的dim的详细总结关于softmax的理解 * – 一维向量：dim=0和dim=-1结果相同，dim=1和dim…

人工智能 2023年7月22日
0046
Additive Angular Margin Loss (ArcFace) 附加角裕度损失的进阶之路

ArcFace: Additive Angular Margin Loss for Deep Face Recognition 本文目的是梳理loss函数由欧式空间（Euclide…

人工智能 2023年7月1日
00101

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

神经网络最后一层处理

神经网络最后一层处理

二分类

多分类

大家都在看