多分类条件下分类指标：Macro-average和Micro-average，以及Weighted-average

2023年7月2日下午2:21 • 人工智能 • 阅读 82

在二分类条件下，我们可以很轻易的在混淆矩阵的基础上定义出各种指标（例如Accurarcy, precision, F 1 F_1 F 1 , recall），其定义方法如下：

多分类条件下分类指标：Macro-average和Micro-average，以及Weighted-average

true positive: TP，真实情况为True,预测也为正的样本数。
false positive:FP，真实情况为False，预测为正的样本数。
false negative:FN，真实情况为True，预测为负的样本数。
true negative: TN，真实情况为False，预测为负的样本数。
对于这四个指标，在英文的取名是是两个形容词【A 1 A_1 A 1 ,A 2 A_2 A 2 】，其中第二个形容词是主体，表示预测的结果（预测目标的是正样本，还是负样本），它其实对应着一个命题：预测该样本为正或负样本。第一个形容词是对这个命题的判断结果，表示这个命题的正确与否。
例如： false negative： negative表示”分类器预测该样本为负样本”这个命题。 false则表示这个命题（”分类器预测该样本为负样本”）是错误的，既然命题是错误的，说明这个样本的实际情况是正样本。
在这些指标下，acc,recall，precision的值定义如下：
A c c u r a c y = T P + T N T P + F P + F N + T N Accuracy=\frac{TP+TN}{TP+FP+FN+TN}A c c u r a c y =T P +F P +F N +T N T P +T N
R e c a l l = T P T P + F N Recall=\frac{TP}{TP+FN}R e c a l l =T P +F N T P
P r e c i s i o n = T P T P + F P Precision=\frac{TP}{TP+FP}P r e c i s i o n =T P +F P T P

那么对于多分类，如何定义混淆矩阵的TP,FP,FN,TN？
一般的做法是，对于多分类里面的每个类别，将自身类作为正类，其他所有类作为反类，然后定义出各自的T P i , F P i , F N i , T N i TP_i,FP_i,FN_i,TN_i T P i ,F P i ,F N i ,T N i ，然后再去计算各个类别的a c c u r a c y i accuracy_i a c c u r a c y i ，r e c a l l i recall_i r e c a l l i 和F 1 i F_{1i}F 1 i ，其中i i i 表示第i个类别。
如果要计算出分类器对于所有类别的acc和recall，需要把所有类别的结果都汇聚起来，而Macro-average，Micro-average和Weighted-average就是三种汇聚所有类的指标的方式。
具体来说：
Macro-average下的accuracy的计算方式是：
A c c u r a c y m a c r o _ a v g = ∑ i = 1 N 1 N × a c c u r a c y i = ∑ i = 1 N 1 N × T P i + T N i T P i + T N i + F P i + F N i Accuracy_{macro_avg}=\sum^{N}{i=1}\frac{1}{N} \times accuracy_i=\sum^{N}{i=1}\frac{1}{N}\times \frac{TP_i+TN_i}{TP_i+TN_i+FP_i+FN_i}A c c u r a c y m a c r o a v g =i =1 ∑N N 1 ×a c c u r a c y i =i =1 ∑N N 1 ×T P i +T N i +F P i +F N i T P i +T N i
这相当于把所有类别的权重都是设置为一致，这种方式在测试样本的类别在数量上极端不均衡的时候极端的不合理。
因此，为了考虑到不同类别的样本不均衡，就有所谓的Weighted-average计算方式：
A c c u r a c y w e i g h t _ a v g = ∑ i = 1 N T P i + F N i ∑ j = 1 N T P i + F N i × a c c u r a c y i Accuracy{weight_avg}=\sum^{N}{i=1}\frac{TP_i+FN_i}{\sum^{N}{j=1} TP_i+FN_i}\times accuracy_i A c c u r a c y w e i g h t _a v g =i =1 ∑N ∑j =1 N T P i +F N i T P i +F N i ×a c c u r a c y i
这是把第i个类别的权重设置为了第i类样本占所有类别样本的比例了。

而Micro-average下的Precision和recall的计算方式和accuracy的计算方式还不太一样：
R e c a l l = ∑ i = 1 N T P i ∑ j = 1 N T P j + F N j Recall=\frac{\sum_{i=1}^{N}TPi}{\sum_{j=1}^N TP_j+FN_j}R e c a l l =∑j =1 N T P j +F N j ∑i =1 N T P i
P r e c i s i o n = ∑ i = 1 N T P i ∑ j = 1 N T P j + F P j Precision=\frac{\sum_{i=1}^{N}TPi}{\sum_{j=1}^N TP_j+FP_j}P r e c i s i o n =∑j =1 N T P j +F P j ∑i =1 N T P i
而Accuracy是说，所有这些样本里面，有多少个样本是识别正确的，因此它的计算方式为：
A c c u r a c y = ∑ i = 1 N T P i 总样本数 Accuracy=\frac{\sum_{i=1}^{N}TPi}{总样本数}A c c u r a c y =总样本数∑i =1 N T P i

; 举例说明

我们举个三分类的例子加以说明。
如下图所示的混淆矩阵：

对猫，鱼，鸡，我们可以分别求出各自的TP,TN,FP,FN:
T P 猫 = 4 TP_{猫}=4 T P 猫=4,T P 鱼 = 2 TP_{鱼}=2 T P 鱼=2，T P 鸡 = 6 TP_{鸡}=6 T P 鸡=6
T N 猫 = 2 + 2 + 0 + 6 = 10 TN_{猫}=2+2+0+6=10 T N 猫=2 +2 +0 +6 =1 0,T N 鱼 = 4 + 3 + 1 + 6 = 14 TN_{鱼}=4+3+1+6=14 T N 鱼=4 +3 +1 +6 =1 4，T N 鸡 = 4 + 6 + 1 + 2 = 13 TN_{鸡}=4+6+1+2=13 T N 鸡=4 +6 +1 +2 =1 3
F P 猫 = 6 + 3 = 9 , F P 鱼 = 1 + 0 = 1 , F P 鸡 = 1 + 2 = 3 FP_{猫}=6+3=9,FP_{鱼}=1+0=1,FP_{鸡}=1+2=3 F P 猫=6 +3 =9 ,F P 鱼=1 +0 =1 ,F P 鸡=1 +2 =3
F N 猫 = 1 + 1 = 2 , F N 鱼 = 6 + 2 = 8 , F N 鸡 = 3 + 0 = 3 FN_{猫}=1+1=2,FN_{鱼}=6+2=8,FN_{鸡}=3+0=3 F N 猫=1 +1 =2 ,F N 鱼=6 +2 =8 ,F N 鸡=3 +0 =3
于是对于猫来说：
A c c u r a c y 猫 = 4 + 10 4 + 10 + 9 + 2 = 0.56 Accuracy_{猫}=\frac{4+10}{4+10+9+2}=0.56 A c c u r a c y 猫=4 +1 0 +9 +2 4 +1 0 =0 .5 6
r e c a l l 猫 = 4 6 = 0.66 recall_{猫}=\frac{4}{6}=0.66 r e c a l l 猫=6 4 =0 .6 6
p r e c i s i o n 猫 = T P 猫 T P 猫 + F P 猫 = 4 4 + 9 = 0.3076 precision_{猫}=\frac{TP_{猫}}{TP_{猫}+FP_{猫}}=\frac{4}{4+9}=0.3076 p r e c i s i o n 猫=T P 猫+F P 猫T P 猫=4 +9 4 =0 .3 0 7 6

对于鱼来说：
A c c u r a c y 鱼 = 2 + 14 2 + 14 + 1 + 8 = 0.64 Accuracy_{鱼}=\frac{2+14}{2+14+1+8}=0.64 A c c u r a c y 鱼=2 +1 4 +1 +8 2 +1 4 =0 .6 4
r e c a l l 鱼 = 2 2 + 8 = 0.20 recall_{鱼}=\frac{2}{2+8}=0.20 r e c a l l 鱼=2 +8 2 =0 .2 0
p r e c i s i o n 鱼 = T P 鱼 T P 鱼 + F P 鱼 = 2 2 + 1 = 0.66 precision_{鱼}=\frac{TP_{鱼}}{TP_{鱼}+FP_{鱼}}=\frac{2}{2+1}=0.66 p r e c i s i o n 鱼=T P 鱼+F P 鱼T P 鱼=2 +1 2 =0 .6 6

对于鸡来说：
A c c u r a c y 鸡 = 6 + 13 6 + 13 + 3 + 3 = 0.76 Accuracy_{鸡}=\frac{6+13}{6+13+3+3}=0.76 A c c u r a c y 鸡=6 +1 3 +3 +3 6 +1 3 =0 .7 6
r e c a l l 鸡 = 6 6 + 3 = 0.66 recall_{鸡}=\frac{6}{6+3}=0.66 r e c a l l 鸡=6 +3 6 =0 .6 6
p r e c i s i o n 鸡 = T P 鸡 T P 鸡 + F P 鸡 = 6 6 + 3 = 0.66 precision_{鸡}=\frac{TP_{鸡}}{TP_{鸡}+FP_{鸡}}=\frac{6}{6+3}=0.66 p r e c i s i o n 鸡=T P 鸡+F P 鸡T P 鸡=6 +3 6 =0 .6 6

接下来，我们分别计算Macro-average，Micro-average和Weighted-average下的三种指标：
Macro-average 情况下 :
a c c = 0.56 + 0.64 + 0.76 3 acc=\frac{0.56+0.64+0.76}{3}a c c =3 0 .5 6 +0 .6 4 +0 .7 6

r e c a l l = 0.66 + 0.66 + 0.20 3 recall=\frac{0.66+0.66+0.20}{3}r e c a l l =3 0 .6 6 +0 .6 6 +0 .2 0

p r e c i s i o n = 0.3076 + 0.66 + 0.66 3 precision=\frac{0.3076+0.66+0.66}{3}p r e c i s i o n =3 0 .3 0 7 6 +0 .6 6 +0 .6 6

Micro-average 情况下:
a c c = 4 + 2 + 6 6 + 4 + 9 = 12 25 = 0.48 acc=\frac{4+2+6}{6+4+9}=\frac{12}{25}=0.48 a c c =6 +4 +9 4 +2 +6 =2 5 1 2 =0 .4 8

r e c a l l = 4 + 2 + 6 4 + 2 + 6 + 2 + 8 + 3 = 12 25 = 0.48 recall=\frac{4+2+6}{4+2+6+2+8+3}=\frac{12}{25}=0.48 r e c a l l =4 +2 +6 +2 +8 +3 4 +2 +6 =2 5 1 2 =0 .4 8

p r e c i s i o n = 4 + 2 + 6 4 + 2 + 6 + 9 + 1 + 3 = 12 25 = 0.48 precision=\frac{4+2+6}{4+2+6+9+1+3}=\frac{12}{25}=0.48 p r e c i s i o n =4 +2 +6 +9 +1 +3 4 +2 +6 =2 5 1 2 =0 .4 8

以及Weighted情况下：
我们首先计算出三个类别的样本比例：
样本总数目：T P 猫 + F N 猫 + T P 鱼 + F N 鱼 + T P 鸡 + F N 鸡 TP_{猫}+FN_{猫}+TP_{鱼}+FN_{鱼}+TP_{鸡}+FN_{鸡}T P 猫+F N 猫+T P 鱼+F N 鱼+T P 鸡+F N 鸡=4+2+2+8+6+3=25

猫占比 r 猫 r_猫r 猫：T P 猫 + F N 猫 T P 猫 + F N 猫 + T P 鱼 + F N 鱼 + T P 鸡 + F N 鸡 = 6 25 = 0.24 \frac{TP_{猫}+FN_{猫}}{TP_{猫}+FN_{猫}+TP_{鱼}+FN_{鱼}+TP_{鸡}+FN_{鸡}}=\frac{6}{25}=0.24 T P 猫+F N 猫+T P 鱼+F N 鱼+T P 鸡+F N 鸡T P 猫+F N 猫=2 5 6 =0 .2 4

鱼占比 r 鱼 r_鱼r 鱼：T P 鱼 + F N 鱼 T P 猫 + F N 猫 + T P 鱼 + F N 鱼 + T P 鸡 + F N 鸡 = 10 25 = 0.4 \frac{TP_{鱼}+FN_{鱼}}{TP_{猫}+FN_{猫}+TP_{鱼}+FN_{鱼}+TP_{鸡}+FN_{鸡}}=\frac{10}{25}=0.4 T P 猫+F N 猫+T P 鱼+F N 鱼+T P 鸡+F N 鸡T P 鱼+F N 鱼=2 5 1 0 =0 .4

鸡占比 r 鸡 r_鸡r 鸡：T P 鸡 + F N 鸡 T P 猫 + F N 猫 + T P 鱼 + F N 鱼 + T P 鸡 + F N 鸡 = 9 25 = 0.36 \frac{TP_{鸡}+FN_{鸡}}{TP_{猫}+FN_{猫}+TP_{鱼}+FN_{鱼}+TP_{鸡}+FN_{鸡}}=\frac{9}{25}=0.36 T P 猫+F N 猫+T P 鱼+F N 鱼+T P 鸡+F N 鸡T P 鸡+F N 鸡=2 5 9 =0 .3 6
于是各个指标就是加权求和了：
a c c = a c c 猫 × r 猫 + a c c 鱼 × r 鱼 + a c c 鸡 × r 鸡 acc=acc_猫\times r_猫+ acc_鱼 \times r_鱼+ acc_鸡 \times r_鸡a c c =a c c 猫×r 猫+a c c 鱼×r 鱼+a c c 鸡×r 鸡=0.56 _0.24+0.64_0.4+0.76*0.36=0.664

r e c a l l = r e c a l l 猫 × r 猫 + r e c a l l 鱼 × r 鱼 + r e c a l l 鸡 × r 鸡 recall=recall_猫\times r_猫+recall_鱼 \times r_鱼+ recall_鸡 \times r_鸡r e c a l l =r e c a l l 猫×r 猫+r e c a l l 鱼×r 鱼+r e c a l l 鸡×r 鸡=0.66 _0.24+0.20_0.4+0.66*0.36=0.476

p r e c i s i o n = p r e c i s i o n 猫 × r 猫 + p r e c i s i o n 鱼 × r 鱼 + p r e c i s i o n 鸡 × r 鸡 precision=precision_猫\times r_猫+ precision_鱼 \times r_鱼+ precision_鸡 \times r_鸡p r e c i s i o n =p r e c i s i o n 猫×r 猫+p r e c i s i o n 鱼×r 鱼+p r e c i s i o n 鸡×r 鸡=0.3076 _0.24+0.66_0.4+0.66*0.36=0.5754

其它

我们会看到上面这个例子里面，Micro-average下，多分类的accuracy，recall和precision会相同。这不是个例，而是多分类任务下，micro-average指标的常态。

这是因为在多分类里面，micro-average情况下，recall和precision的计算公式为：
R e c a l l = ∑ i = 1 N T P i ∑ j = 1 N T P j + F N j Recall=\frac{\sum_{i=1}^{N}TPi}{\sum_{j=1}^N TP_j+FN_j}R e c a l l =∑j =1 N T P j +F N j ∑i =1 N T P i
P r e c i s i o n = ∑ i = 1 N T P i ∑ j = 1 N T P j + F P j Precision=\frac{\sum_{i=1}^{N}TPi}{\sum_{j=1}^N TP_j+FP_j}P r e c i s i o n =∑j =1 N T P j +F P j ∑i =1 N T P i
其中∑ j = 1 N F N j \sum^N_{j=1}FN_j ∑j =1 N F N j 含义为所有类别里面，把【本属于自己类】的样本错误的识别为其他类别的样本数之和；∑ j = 1 N F P j \sum^N_{j=1}FP_j ∑j =1 N F P j 含义为所有类别里面，把【不属于自己类】的样本错误的识别为本类的样本数之和。

假设样本x x x的正确类别为y r y_r y r ，但是预测的类别为y p y_p y p ，且y r ≠ y p y_r\neq y_p y r =y p 。
毫无疑问，对于类别y r y_r y r 来说，它被错误的识别为其他类了，因此这个样本会被统计到∑ j = 1 N F N j \sum^N_{j=1}FN_j ∑j =1 N F N j 里面去。
同时对于类别y p y_p y p 来说，这个样本也会一样统计到∑ j = 1 N F P j \sum^N_{j=1}FP_j ∑j =1 N F P j ，因为它是属于把本不是y p y_p y p 类的样本错误的识别为y p y_p y p 类了。
因此对所有类别求和以后，即有：∑ j = 1 N F N j \sum^N_{j=1}FN_j ∑j =1 N F N j =∑ j = 1 N F P j \sum^N_{j=1}FP_j ∑j =1 N F P j 。

同时注意到，对于每个样本x x x，其预测结果与真实标签之间只存在相等于不相等的关系。如果y r ≠ y p y_r\neq y_p y r =y p 那么这个样本会被统计进∑ j = 1 N F P j \sum^N_{j=1}FP_j ∑j =1 N F P j 或者∑ j = 1 N F N j \sum^N_{j=1}FN_j ∑j =1 N F N j ；如果y r = y p y_r=y_p y r =y p ，那么这个样本会被统计进 ∑ j = 1 N T P j \sum^N_{j=1}TP_j ∑j =1 N T P j ，因此统计量∑ j = 1 N T P j + F N j \sum^N_{j=1}TP_j+ FN_j ∑j =1 N T P j +F N j 其实也等于样本总数；

而a c c u r a c y = ∑ i = 1 N T P i 总样本数 accuracy=\frac{\sum_{i=1}^{N}TPi}{总样本数}a c c u r a c y =总样本数∑i =1 N T P i 。因此，Micro-average平均下，多分类的accuracy,recall和precision其实是一致的。而这也是为什么sklearn里面classification_report在输出的时候，没有micro-average，只有accuracy，macro-average和weighted-average的结果。其实，第一行的accuracy就把micro-average下的三个值都显示出来了，因为precision，recall都是和accuracy相等的。

Original: https://blog.csdn.net/jmh1996/article/details/114935105
Author: Icoding_F2014
Title: 多分类条件下分类指标：Macro-average和Micro-average，以及Weighted-average

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/665609/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

NanoDet代码逐行精读与修改（一）Backbone

–neozng1@hnu.edu.cn 笔者已经为nanodet增加了非常详细的注释，代码请戳此仓库：nanodet_detail_notes: detail ever…

人工智能 2023年7月10日
0066
Matlab 常用的图像处理方法

文章目录 Matlab 常用的图像处理方法 * RGB转灰度噪声添加滤波 – 中值滤波均值滤波 sobel算子处理图像形态学运算 Reference Matla…

人工智能 2023年6月18日
0088
filp_open

/* filp_open – open file and return file pointer* @filename: path to open* @flags: o…

人工智能 2023年6月26日
0073
MVSNet代码复现问题解决、cuBlas call failed status=13问题

简介这篇文章记录复现MVSNet中遇到的一些问题。最近在复现 MVSNet 的代码，是一篇2018年的论文，使用的是tensorflow-gpu>=1.5的代码源码中是…

人工智能 2023年5月25日
0078
Yolov7：最新最快的实时检测框架，最详细分析解释（附源代码）

关注并星标从此不迷路计算机视觉研究院公众号ID｜ ComputerVisionGzq 学习群｜扫码在主页获取加入方式论文地址：https://arxiv.org/pdf/…

人工智能 2023年6月12日
0079
simcse实践使用

实践目标：跑通simcse，看看和传统bert比，是否表征能力更强，是否相似句的相似度更高，非相似句的相似度更低。 github地址： https://github.com/pr…

人工智能 2023年5月28日
0084
最清楚的-列生成算法简介

本文尽量避免数学公式，使用文字解释列生成算法的原理，争取让读者能形成直观上的理解。为什么需要了解列生成算法的原理列生成算法无法简单地调用第三方库来使用，必须根据具体问题，构造不…

人工智能 2023年6月15日
0046
《机器学习》周志华第三章课后习题

3.1 试析在什么情形下式(3.2) 中不必考虑偏置项 b. 参考网上的各种版本：不考虑偏置项b，那么函数过原点，只需要将训练集的每个样本减去第一个样本，就可以消去b，不必考虑b。…

人工智能 2023年6月15日
0082
2021年“泰迪杯”数据分析技能赛A题

2021年”泰迪杯”数据分析技能赛A题通讯产品销售和盈利能力分析摘要进入本世纪以来，我国通讯产品得到了飞速发展，其技术先进，价格便宜，深受世界各国和地…

人工智能 2023年6月23日
0087
企业微信群机器人应用

现在很多企业都在使用企业微信进行工作交流，自从企业微信推出群机器人之后，使用企业微信的小伙伴一般都会用机器人来推送定时消息或者提醒等，这样能够为企业工作群的管理提升效率，能很好的帮…

人工智能 2023年7月6日
0063
数学建模（三）：预测

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月25日
0056
移动目标轨迹预测方法——概述

可分为两类： 1. 基于数据驱动的方法通过海量的历史数据来挖掘移动目标的行为特征，结合目标的当前位置，预判目标的运动趋势。强调历史行为在时间和空间上的可重复性。概率统计：卡尔…

人工智能 2023年6月15日
0075
应用时间序列分析——有季节效应的非平稳序列分析-R语言

因素分解理论： 1919年统计学家沃伦·珀森斯(Warren Persons)在他的论文《商业环境的指标》中首次提出了确定性因素分解(time series decompositi…

人工智能 2023年7月26日
0069
pytorch载入数据与对应的标签，使用torch.utils.data详解，DataLoader的使用

在进行深度学习处理的时候，我们需要将数据输入到神经网络中进行训练，训练网络的学习能力，其实是根据一定的规则更新网络节点中的参数，而这个规则的来源就是依赖于数据与标签。我们需要将数据…

人工智能 2023年6月19日
0088
计算机视觉-OpenCV入门讲解

🎉 作者简介：在读计算机研究生，目前研二。主要研究方向是人工智能和群智能算法方向。目前熟悉python网页爬虫、机器学习、计算机视觉（OpenCV）、群智能算法目前正在学习深度学习…

人工智能 2023年5月26日
0054
利用CNN实现图像和数值数据融合

利用CNN实现图像（MRI）和数值数据融合一、背景在很多实际任务当中，模型构建数据类型多样，有数值型、图像、音频等各式各样的数据，如果单纯利用某种类型的数据构建分类或回归模型，…

人工智能 2023年7月13日
0045

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

多分类条件下分类指标：Macro-average和Micro-average，以及Weighted-average

大家都在看