Expected Calibration Error (ECE)模型校准原理解析

2023年5月30日下午8:43 • 人工智能 • 阅读 153

对于高风险应用来说，机器学习模型对其预测的置信度是至关重要的。 model calibration（模型校准）就是要让模型结果预测概率和真实的经验概率保持一致。模型校准这个话题比较小众，博主也是在看一篇Self-KD的论文时才看到的。模型校准的metrics有很多，这里博主仅仅讨论 Expected Calibration Error (ECE)这一个比较经典的模型校准metric。

参考资料

1. 什么是模型校准？

模型校准就是要让模型结果预测概率和真实的经验概率保持一致。说人话也就是，在一个二分类任务中取出大量（M个）模型预测概率为0.6的样本，其中有0.6M个样本真实的标签是1。总结一下，就是模型在预测的时候说某一个样本的概率为0.6，这个样本就真的有0.6的概率是标签为1。

上面是一个正面的例子，下面我再来举一个反面的例子说明模型校准的重要性。还是在一个二分类任务中取出大量（M个）模型预测概率为0.6的样本，而这些样本的真实标签全部都是1。 虽然从accuracy的角度来考察，模型预测样本概率为0.6最后输出时会被赋予的标签就是1，即accuracy是100%。 但是从置信度的角度来考察，这个模型明显不够自信，本来这些全部都是标签为1的样本，我们肯定希望这个模型自信一点，输出预测概率的时候也是1。

2. Expected Calibration Error (ECE)

有了前面对模型置信度的感性了解，我们接下来看看该怎么用Expected Calibration Error去定量度量。首先来一张原论文On Calibration of Modern Neural Networks的图：

Expected Calibration Error (ECE)模型校准原理解析

为了能够定量地度量置信度，作者将[0, 1]区间划分为多个bin（这里划分为了5个bin），所有的二分类样本都将根据模型对其预测的结果分别落入这5个bin之中的1个。在每个bin之中计算平均的模型confidence，再与该bin中样本真实标签的平均accuracy进行对比，两者之差的绝对值就能度量模型的置信度，差距越大代表模型置信度越小。公式如下：
E C E = ∑ b = 1 B n b N ∣ a c c ( b ) − c o n f ( b ) ∣ (1) ECE = \sum_{b=1}^B \frac{n_b}{N} |acc(b) – conf(b) | \tag{1}E C E =b =1 ∑B N n b ∣a c c (b )−c o n f (b )∣(1 )

其中，b代表第b个bin，B代表bin的总数，n b n_b n b 代表第b个bin中样本的总数，acc(b)代表第b个bin中样本真实标签的平均值，conf(b)代表第b个bin中模型预测概率的平均值。

Original: https://blog.csdn.net/qq_42718887/article/details/113695473
Author: PyBigStar
Title: Expected Calibration Error (ECE)模型校准原理解析

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/544990/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

2022年系统集成项目管理工程师考试知识点：企业信息化

很多考生在备考2022年系统集成项目管理工程师考试，为大家整理了2022年系统集成项目管理工程师考试知识点：企业信息化，供大家备考复习。企业信息化是指企业以业务流程的优化和重构为…

人工智能 2023年7月17日
0064
python读取excel丨换一种存储格式, 读取速度提升几倍

您好, 本博客将持续更新python数据分析技巧, 一次解决一个问题，欢迎关注订阅! 本次介绍提升excel文件读取速度问题工作中我们会有一些大文件(excel, csv等), 作…

人工智能 2023年7月8日
0058
2022版的IDEA创建一个maven项目（超详细）

一.设置idea中指定的maven的位置以及本地存储仓库开发中一般我们使用自己下载的maven，不使用IDEA工具自带的，这就需要将我们下载的maven配置到IDEA工具中，配置…

人工智能 2023年7月31日
00246
MySQL修改安全策略时报错：ERROR 1193 (HY000): Unknown system variable ‘validate_password_policy‘的解决方法

我使用的版本是MySQL5.73，环境是Linux CentOS7，其他版本不知道是否可行，望谅解。当我们想设置简单的密码的时候，看了别人发的如何修改安全策略的代码，如下： se…

人工智能 2023年7月30日
0079
Swin-Transformer图像分类

文章目录 * – + 1. 准备数据集 + * 1.1 数据集存放格式 * 1.2 config配置文件 + 2. 训练 + * 2.1 代码中调整了的部分 * 2.2…

人工智能 2023年7月2日
0088
Pandas库的使用

pandas 是基于NumPy 的一种工具，是为了解决数据分析任务而创建的，提供了很多进行数据分析处理的函数。 Series类型数据是一维数组型，除了数据之外还有一组索引。Data…

人工智能 2023年7月9日
0065
delf配置：基础环境（一）

windows下delf配置：delf环境（二）windows下delf配置：delf测试（三）一、版本 github配置源码的时候一定要看文档！！！！一定要注意版本要求，否则…

人工智能 2023年5月26日
00126
山东大学2019级机器学习实验一思路分析

山东大学2019级机器学习实验一思路分析实验说明中间的字段说明就不再写上了 ; 实验分析前提说明，默认大家已经掌握了贝叶斯模型是什么，怎么使用贝叶斯模型，不知道的可以点击链接…

人工智能 2023年6月15日
0089
Python备忘录（自用）

师兄之前整理的python备忘录，上传防丢 1. Anaconda Prompt 怎么切换工作路径到E盘以及更改默认打开路径？链接: https://blog.csdn.net…

人工智能 2023年5月25日
0095
【计量经济学】时间序列回归中序列相关

【计量经济学】时间序列回归中序列相关 –潘登同学的计量经济学笔记理清这一篇的目的，第一篇时间序列在TS.1-TS.3下证明了OLS的无偏性(但是TS.3的严格外生条件…

人工智能 2023年6月18日
00120
ImageNet 数据集下载与处理（亲测实用有效无坑版）

下载通常下载方式有两种，官网下载和第三方网站上传的资源下载。这里推荐第三方下载，因为官网可能会存在注册麻烦，网页卡顿的情况。第三方下载方式如下：里面包含几乎所有常用的Image…

人工智能 2023年6月16日
0090
scipy之傅里叶变换

导读关于 傅里叶变换想必大家应该都不陌生吧？在 &#x4FE…

人工智能 2023年5月23日
0075
从零搭建完整python自动化测试框架（UI自动化和接口自动化）——持续更新

本自动化测试框架采用python + unittest 的基础来搭建，采用PO模式、数据驱动的思想，通过selenium来实现WEB UI自动化，通过request来实现接口自动化…

人工智能 2023年7月3日
00101
语音合成论文优选：多模态Text2Video: Text-driven Talking-head Video Synthesis with Phonetic Dictionary

免责声明：首选系列演讲合成论文以分享论文为主，分享论文不直接翻译，内容主要是我对论文内容的总结和个人观点。如果是转载，请注明出处。 [En] Disclaimer: the pre…

人工智能 2023年5月27日
00100
entity什么类型_细粒度实体分类（1）——什么是细粒度实体分类

研究生期间其实关注了实体链接（Entity Linking）、共指消解（Coreference Resolution）、细粒度实体分类（Fine-grained Entity Ty…

人工智能 2023年6月10日
0090
Fashion MNIST数据集的处理——“…-idx3-ubyte”文件解析

MNIST数据集可能是计算机视觉所接触的第一个图片数据集。而 Fashion MNIST 是在遵循 MNIST 的格式和大小的基础上，提升了一定的难度，在比较算法的性能时可以有更好…

人工智能 2023年7月21日
0078

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Expected Calibration Error (ECE)模型校准原理解析

1. 什么是模型校准？

2. Expected Calibration Error (ECE)

大家都在看