深度学习理论：Categorical crossentropy 损失函数

2023年7月27日上午8:18 • 人工智能 • 阅读 62

分类交叉熵是一种用于多类分类任务的损失函数。在这些任务中，一个示例只能属于许多可能类别中的一个，模型必须决定哪个类别。

形式上，它旨在量化两种概率分布之间的差异。

分类交叉熵的数学计算方式：

交叉熵损失函数通过计算以下和来计算示例的损失：

根据公式我们可以发现，因为 yi,要么是0，要么是1。而当 yi等于0时，结果就是0，当且仅当 yi等于1时，才会有结果。也就是说 categorical_crossentropy只专注与一个结果，因而它一般配合softmax做单标签分类。

分类交叉熵的使用方法：

分类交叉熵非常适合分类任务，因为一个示例可以被视为属于概率为1的特定类别和其他概率为0的类别。

示例：MNIST数字识别教程，其中有数字0、1、2、3、4、5、6、7、8和9的图像。

该模型使用绝对交叉熵来学习给正确的数字高概率，给其他数字低概率。

搭配的激活函数：

Softmax是唯一建议与类别交叉熵损失函数一起使用的激活函数。
严格来说，模型的输出只需要是正的，这样每个输出值的对数存在。
然而，这种损失函数的主要吸引力在于比较两种概率分布。Softmax激活重新缩放模型输出，使其具有正确的属性。

目标特征：

使用单个类别功能作为目标。

这将自动从数据集中确定的所有类别中创建一个单热向量。每个单热向量都可以被认为是一个概率分布，这就是为什么通过学习预测它，模型将输出一个示例属于任何类别的概率。

分类特征是在引擎盖下编码的。这使得它们直接适合与绝对的交叉熵损失函数一起使用。

或者，可以使用Numpy数组的数字功能来指定任何概率分布。
当希望模型预测任意概率分布，或者想实现标签平滑，这会很有用

Original: https://blog.csdn.net/m0_54689021/article/details/126546767
Author: 正在黑化的KS
Title: 深度学习理论：Categorical crossentropy 损失函数

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/718075/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python 数据清洗难度_Python数据清洗

检测与处理重复值 pandas提供了一个名为drop_duplicates的去重方法。该方法只对DataFrame或者Series类型有效。这种方法不会改变数据原始排列，并且兼具代…

人工智能 2023年7月9日
0041
立体视觉入门指南（7）：立体匹配

关于立体匹配，我之前写了很多博客，重复去写就没有必要，学习的朋友请阅读如下链接。本文我们随便聊聊立体匹配的方法论和弱纹理恢复问题。立体匹配系列理论恒叨系列码上实战系列理论恒叨…

人工智能 2023年5月26日
0062
计算机视觉(YOLO算法系类)—集合版本

前言： ✌ 作者简介：CC++Edge淇，大家可以叫我– 斯淇。(CSDN优质博主建议加这一条！) 📑 个人主页： CC++Edge淇主页 📫 如果文章知识点有错误的…

人工智能 2023年5月28日
0092
Tensorflow】：could not load dynamic library ‘libcudart.so.11.0‘；dlerror:libcudart.so.11.0的解决方法

一、问题描述 import tensorflow报错如下图测试：tf.test.is_built_with_cuda()显示Truetf.test.is_gpu_available…

人工智能 2023年5月23日
0058
知识图谱学习笔记（二）

仅记录自身学习历程，内容来源于书籍、网络，侵删。知识图谱主要分为通用知识图谱和领域知识图谱两大类，两类知识图谱本质上相同，主要区别在于覆盖范围和使用方式。通用知识图谱可…

人工智能 2023年6月1日
0067
markdown常用到的语法

后加文字，几个#代表几级标题，最高为6 ，标准语法一般在#后跟个空格再写文字。三个或者三个以上的 – 或者 * 格式: ![A](B “C”) A:显示在下方的图片内…

人工智能 2023年6月4日
0087
【JavaScript】巩固JS开发中十个常用功能/案例（21-30）（牛客题解）

🖥️ NodeJS专栏：Node.js从入门到精通🖥️ 蓝桥杯真题解析：蓝桥杯Web国赛真题解析🧧 加入社区领红包：海底烧烤店ai（从前端到全栈）[TencentCloudSDKE…

人工智能 2023年6月2日
00100
技术前言 – AI相关公司简介

【免费下载】【行业报告】2018人工智能标准化白皮书(中国电子技术_标准化研究院) 目录 1 _前言 ……………&#8…

人工智能 2023年6月22日
0080
pandas用均值填充nan_pandas DataFrame：用列的平均值替换nan值

小编典典你可以直接使用DataFrame.fillna来nan直接填充： In [27]: df Out[27]: A B C 0 -0.166919 0.979728 -0.6…

人工智能 2023年7月8日
0062
【leetcode】两数之和

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月28日
0086
《Neo4J 权威指南》知识点总结

目录 * – Neo4j – Neo4j 权威指南 – 知识点梳理 Neo4j Neo4j 是目前图数据库领域最流行的数据库，在知识图谱等应用上…

人工智能 2023年6月1日
0053
预积分的理解

常见的视惯解算系统中应用到的两种传感器是相机和IMU惯性测量单元，IMU频率很高，可能有200Hz的频率，而相机的频率明显要低很多，可能只有大约30Hz。而且视觉图像帧常常会采用关…

人工智能 2023年6月10日
0075
2021-11-09

## 智能家居改造。&am…

人工智能 2023年5月25日
0071
AI大视觉（十八） | Yolo v5的改进思想

本文来自公众号”AI大道理”。这里既有AI，又有生活大道理，无数渺小的思考填满了一生。 Yolo v5一共有四个模型，分别为Yolov5s、Yolov…

人工智能 2023年6月23日
00654
C++ Reference: Standard C++ Library reference: Containers

库Containers标准容器容器是一个持有者对象，它存储了其他对象（其元素）的集合。它们被实现为类模板，这使得作为元素支持的类型具有很大的灵活性。容器管理其元素的存储空间，并提供…

人工智能 2023年6月30日
0075
Scikit-learn库中，回归性能评估所用的score函数含义详解

一.LinearRegression().score方法关于LinearRegression().score(self, X, y, sample_weight=None)方法，…

人工智能 2023年6月16日
00116

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习理论：Categorical crossentropy 损失函数

分类交叉熵的数学计算方式：

分类交叉熵的使用方法：

搭配的激活函数：

目标特征：

大家都在看