Keras/TensorFlow 交叉熵损失函数中的 from_logits 参数

2023年5月23日下午6:23 • 人工智能 • 阅读 101

文章目录

1. from_logits 的两种使用方法。
2. 交叉熵的底层操作。
3. logit 与 sigmoid 互为反函数。
from_logits 的两种使用方法。

在 Keras 的二元交叉熵损失函数（tf.keras.losses.BinaryCrossentropy，下面简称为 bce）中，有 from_logits 这个参数。在使用时需要分下面 2 种情况：

如果输入给 bce 的是一个 logit 值（值域范围 [-∞, +∞] ），则应该设置 from_logits=True 。
如果输入给 bce 的是一个概率值 probability （值域范围 [0, 1] ），则应该设置为 from_logits=False 。

这两种方法的比较如下图所示。

[En]

The comparison of the two methods is shown in the following figure.

Keras/TensorFlow 交叉熵损失函数中的 from_logits 参数

从上面的对比图可以看出，from_logits=True 是一个简便操作，它让使用者省去了转换概率这个步骤。

; 2. 交叉熵的底层操作。

在计算交叉熵时，实际上经历了两个步骤：1.将数值转换为概率值。二.取这个概率值的对数，得到交叉熵。如下图所示。

[En]

When calculating the cross entropy, it actually goes through two steps: 1. Convert a numerical value to a probability value. two。 Take the logarithm of this probability value and get the cross entropy. As shown in the following picture.

logit 与 sigmoid 互为反函数。

实际上，logit 是一个函数，并且它和 sigmoid 互为反函数。sigmoid 会把 logit 值转换为 [0, 1] 之间的概率值，而 logit 则会把概率值转换为 [-∞, +∞] 之间的 logit 值。
在 Scipy 中，sigmoid 函数也叫做 expit 函数。下图是 sigmoid 和 logit 函数的对比。关于 sigmoid 函数的更多内容，详见 Scipy 链接 → Scipy 的 sigmoid 函数页面链接

最后，Keras 中的多类别交叉熵损失函数 Categorical Crossentropy，也有 from_logits 这个参数，其使用方法和二元交叉熵损失函数相同。不过因为它处理的是多分类问题，在计算概率时，要用 softmax 函数。

Original: https://blog.csdn.net/drin201312/article/details/123247057
Author: 杭州的平湖秋月
Title: Keras/TensorFlow 交叉熵损失函数中的 from_logits 参数

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/497209/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

[摘要生成]Knowledge Graph-Augmented Abstractive Summarization with Semantic-Driven Cloze Reward

arxiv 2020论文链接：https://arxiv.org/pdf/2005.01159.pdfgithub链接：https://github.com/luyang-huan…

人工智能 2023年6月1日
00115
欧空局（ESA）开源了众多软件与数据资源

近日，欧空局（ESA）为发展测绘、遥感、地信等地球空间下游应用，开源了大量的软件与数据，具体分为下述几类： Universitat Politecnica de Catalunya…

人工智能 2023年6月20日
0095
干货！基于神经网络的多粒度图表征学习

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入！图是建模实体与实体之间关系的常用数据结构。近年来，图数据挖掘引起了学术界和工业界广泛的关注，如分类、聚类等等。然而图…

人工智能 2023年7月17日
0073
[Tensorflow] TensorBoard介绍以及使用

TensorBoard简介：相信很多人都听说过神经网络，但对大多数人来说，神经网络很神秘。当我们第一次接触网络文件时，我们不知道网络的内部结构和节点的结构。对于我们学习科研，甚至…

人工智能 2023年5月23日
00175
详细解读nn.BatchNorm2d——批量标准化操作

目录一、参数解读 1、BatchNorm2d的作用 2、BatchNorm2d的参数二、解释模型存储的均值和方差是如何更新 1、文字描述 2、程序验证训练阶段：trainni…

人工智能 2023年7月23日
00128
视觉机器学习20讲-MATLAB源码示例（7）-EM算法

视觉机器学习20讲-MATLAB源码示例（7）-EM算法 1. EM算法 2. Matlab仿真 3. 仿真结果 4. 小结 ; 1. EM算法最大期望算法（Expectatio…

人工智能 2023年6月16日
00103
VS Code摸鱼神器，让你快速开发AI模型

摘要：ModelArts VS Code插件一键接入云上开发环境介绍及操作指导对于习惯于使用本地VS Code IDE的开发者，受限于本地资源，采用本地开发加云上调测的远程开发…

人工智能 2023年5月31日
00117
【语音信号处理】短时傅立叶变换的频谱图详细教程

文章目录 * – 一.语法与参数介绍 – 二.频谱图的默认值 – 三.沿 x 轴的频率 – 四.频谱图和瞬时频率一.语法与参数介绍…

人工智能 2023年5月25日
00222
CUDA、cuDNN以及pytorch的版本选择和下载

CUDA、cuDNN以及pytorch的版本选择和下载安装前言一、CUDA * – 1、查看当前可支持的最高CUDA版本 2、CUDA下载 3、更高版本CUDA 二…

人工智能 2023年7月21日
00115
神经网络和数据集的思考：数据集越大，性能越好？

一般来说，神经网络和大数据的关系十分复杂，影响因素包括：模型的大小，数据集的大小，计算性能，还有其他因素，如：人力、时间等。下面对现有的内容做了一个整理：一、数据量VS网络…

人工智能 2023年6月17日
00104
Paper Reading – 基础系列 – Rethinking ImageNet Pre-training

论文链接 Kaiming He 大神不用多说更多可见计算机视觉-Paper&Code – 知乎 Abstract 首先，我想总结一下本文的几个要点。果然，丹尼…

人工智能 2023年5月24日
00140
机器学习 K-Means(++)算法

文章目录聚类概念聚类与Kmeans * K-Means算法步骤：优缺点 K-Means++算法 * K-Means++算法的基本思路二分K-Means算法 Mini Bat…

人工智能 2023年6月13日
00145
AI艺术的背后：详解文本生成图像模型【基于 Diffusion Model】

系列文章链接： AI艺术的背后：详解文本生成图像模型【基于 VQ-VAE】AI艺术的背后：详解文本生成图像模型【基于GAN】AI艺术的背后：详解文本生成图像模型【基于Diffusi…

人工智能 2023年7月26日
00105
人工智能导论(4)——不确定性推理(Uncertainty Reasoning)

文章目录一、概述二、重点内容三、思维导图四、重点知识笔记 * 1. 不确定性推理概述 – 1.1 概念 1.2 分类 1.3 基本问题 2. 概率方法 …

人工智能 2023年7月28日
0091
单目相机测距-图像处理中的四大坐标系

图像处理中的四大坐标系图像处理中的四大坐标系是什么？ * 像素坐标系图像坐标系相机坐标系世界坐标系为什么要有四大坐标系？ * 转换过程四大坐标系之间是如何相互转换的？ …

人工智能 2023年6月20日
00123
C++构造函数

类的6个默认的成员函数: 类中如果什么都没有定义:—有六个默认的成员函数: 构造函数:主要完成对象的初始化工作析构函数:主要完成对象中资源的清理工作拷贝构造函数:拷…

人工智能 2023年6月28日
0089

2024 年 6 月
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

Keras/TensorFlow 交叉熵损失函数中的 from_logits 参数

文章目录

大家都在看