多分类loss、softmax loss与交叉熵的关系

2023年7月1日下午9:46 • 人工智能 • 阅读 72

0、引子：

多分类loss采用的是softmax loss，也可称之为softmax交叉熵loss，这个loss中的q就使用的是模型的softmax输出，它就是用来拟合真正的§编码长度的期望

交叉熵越低，这个策略就越好，最低的交叉熵也就是使用了真实分布所计算出来的信息熵，因为此时，交叉熵 = 信息熵。这也是为什么在机器学习中的分类算法中，我们总是最小化交叉熵，因为交叉熵越低，就证明由算法所产生的策略最接近最优策略，也间接证明我们算法所算出的非真实分布越接近真实分布。

参见：https://www.cnblogs.com/smartwhite/p/8601477.html

1、为什么在机器学习中的分类算法中，我们总是最小化交叉熵？

交叉熵，见：https://blog.csdn.net/u010212101/article/details/125040853
softmax如下：

2、softmax loss

; 3、max vs. softmax

4.weighted loss

参见：http://sofasofa.io/forum_main_post.php?postid=1002038

; 5.focal loss

https://zhuanlan.zhihu.com/p/113716961

r越大，容易分的loss越小

调参技巧：

; 其他：

https://www.cnblogs.com/ChrisInsistPy/p/9673608.html

Original: https://blog.csdn.net/u010212101/article/details/125040703
Author: 艾鹤
Title: 多分类loss、softmax loss与交叉熵的关系

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/664118/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

人工智能导论——逻辑推理

; 比比叨叨复习起来比想象的慢啊啊啊啊！挺住！一定要好好复习完。突然想到霸王别姬里的这句话，帆神如是，陈老如是，我也要加油啊！ 0. 逻辑推理概述逻辑推理这章的重要考点必然是归…

人工智能 2023年6月1日
0079
【项目实战课】从零掌握安卓端Pytorch原生深度学习模型部署

欢迎大家来到我们的项目实战课，本期内容是《从零掌握安卓端Pytorch原生深度学习模型部署》。所谓项目课，就是以简单的原理回顾+详细的项目实战的模式，针对具体的某一个主题，进行代…

人工智能 2023年6月16日
0097
【NLP屠夫系列】- NER之实战BILSTM

文章目录本文学习目标一. NER * 1.1 什么是命名实体识别: 1.2 命名实体识别的作用: 1.3 命名实体识别常用方法: 1.4 医学文本特征: 二、 BiLSTM *…

人工智能 2023年7月25日
0075
基于OpenCV的车道偏离预警系统

车道偏离预警开发环境 Ubuntu 16.04 OpenCV C++ 车道偏离预警概念解释车道偏离预警系统，其英文全称为Lane Departure Warning Syste…

人工智能 2023年6月20日
0087
多视图聚类（矩阵分解篇）

1.《基于稀疏表示和自适应加权合作学习》 paper:Multi-view subspace clustering with intactness-aware similarity…

人工智能 2023年6月2日
00100
sqlserver字符串转日期_关于日期特征，你想知道操作都在这儿

来源：SAMshare 今日锦囊特征锦囊：关于日期特征，你想知道操作都在这儿～ ? Index 字符串转日期日期转字符串 13位的时间戳转日期格式str 13位的时间戳转da…

人工智能 2023年7月7日
0068
微信支付服务商，可视化进件特约商户

服务商拓展特约商户（子商户），可能出现如下问题： 1、人工录入大量商户资料，耗时耗力。 2、商户对标准费率不满意，无法说服商户先签约再帮其调整费率。针对以上问题，微信支付面向服务…

人工智能 2023年6月29日
0092
《神经网络与深度学习》算法伪代码汇总

目录第三章线性模型算法3.1 两类感知器的参数学习算法算法3.2 一种改进的平均感知器参数学习算法算法3.3 广义感知器参数学习算法第四章前反馈神经网络算法4.1 …

人工智能 2023年6月24日
0057
自编码器(Auto-Encoder)

一、自编码器原理自编码器算法属于自监督学习范畴，如果算法把x作为监督信号来学习，这里算法称为自监督学习(Self-supervised Learning) 在监督学习中神经网络的…

人工智能 2023年7月25日
0063
Nebula Graph & 数仓血缘关系数据的存储与读写

本文首发于 Nebula Graph Community 公众号一、选择 Nebula 的原因性能优越查询速度极快架构分离，易扩展（目前的机器配置低，后续可能扩展）高可用…

人工智能 2023年6月1日
0080
逻辑推理篇：数据分析中违背常理的悖论：辛普森悖论

在现实生活中，我们常常会遇到这样一种现象，当尝试研究两个变量是否具有相关性的时候，会分别对此进行分组研究。然而，在分组比较中都显示非常有优势的一方，在总评时却成了失势的一方。直到…

人工智能 2023年7月16日
00114
「深度学习一遍过」必修17：基于Pytorch细粒度分类实战

本专栏用于记录关于深度学习的笔记，不光方便自己复习与查阅，同时也希望能给您解决一些关于深度学习的相关问题，并提供一些微不足道的人工神经网络模型设计思路。专栏地址：「深度学习一遍过」…

人工智能 2023年7月2日
0070
由浅入深讲解显示存储计算机基础原理

计算机存储原理计算机在内存中一般都是以1010101二进制的方式计算机存储的方式一般分为三种 CPU 内存磁盘机械盘固态盘其中CPU和内存都是断电之后数据就会消失，而磁盘…

人工智能 2023年5月28日
0057
pytorch神经网络因素预测_pytorch 神经网络关系拟合 (回归)

要点这次会来见证神经网络是如何通过简单的形式将一群数据用一条线条来表示. 或者说, 是如何在数据当中找到他们的关系, 然后用神经网络模型来建立一个可以代表他们关系的线条. 建立数…

人工智能 2023年6月18日
0078
【数字图像处理】实验一图像基本变换（MATLAB实现）

目录一、实验意义及目的二、实验内容三、Matlab 相关函数介绍四、参考代码五、运行结果六、实验要求（1）将彩色图像采用不同的灰度化方法实现灰度化；（2）将彩色图像…

人工智能 2023年6月22日
00174
数模笔记4 数据分析

wps2019 数据分析_加载项数据分析_的思维和⽅法⼈⽣/⼯作的结果=思维⽅式热情能⼒ _数据分析_常⽤的⼯具技能：统计学、sql数据库、python、R、Excel、PPT…

人工智能 2023年7月17日
0051

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30