常见的图像分类指标(二分类以及多分类)

一、混淆矩阵

TP、True Positive 真阳性:预测为正,实际为正。

FP、False Positive 假阳性:预测为正,实际为负。

FN、False Negative 假阴性:预测为负、实际为正。

TN、True Negative 真阴性:预测为负、实际为负。

T、F代表的是预测的准确与否;P、N代表的是预测的阳性以及阴性。

预测为正样本(Positive)预测为负样本(Negative)
标签为正样本 TP (True Positive) FN (false Negative) 标签为负样本 FP (False Positive) TN (true Negative)

二、常见的二分类指标

  • Accuracy(准确率/精度):分类正确的样本个数占所有样本个数的比例。
    Accuracy = T N + T P F P + T N + T P + F N \text { Accuracy }=\frac{T N+T P}{F P+T N+T P+F N}Accuracy =FP +TN +TP +FN TN +TP ​
  • Precision(精确率/查准率):分类正确的正样本个数占分类器所有的【预测】正样本个数的比例。

Precisoin = T P T P + F P \text { Precisoin }=\frac{T P}{T P+F P}Precisoin =TP +FP TP ​

  • Recall(召回率/查全率)/Sensitivity(灵敏度/敏感性):分类正确的正样本个数占实际正样本个数的比例。

Recall ⁡ = T P T P + F N \operatorname{Recall}=\frac{T P}{T P+F N}Recall =TP +FN TP ​

  • Specificity(特异性):分类正确的负样本个数占实际负样本个数的比例。

Specificity = T N T N + F P \text { Specificity }=\frac{T N}{T N+F P}Specificity =TN +FP TN ​

  • F1-score:当类别不均衡,它或许是一个比单纯Accuracy更好的指标。

F 1 = 2 ∗ precision ∗ recall precision + recall F 1=\frac{2 * \text { precision } * \text { recall }}{\text { precision }+\text { recall }}F 1 =precision +recall 2 ∗precision ∗recall ​

医学疾病二分类中,一般0、neg代表正常/良性;1、pos代表恶性/癌症。

三、多分类中各个类别的Precision和Recall计算。

这里举一个五分类的例子,看一下下面的混淆矩阵。

常见的图像分类指标(二分类以及多分类)

首先理解混淆矩阵的元素含义,例如第一行第二个的”3″表示实际标签为类别0的预测成类别1的有3个样本。如何绘制混淆矩阵,参考利用python绘制混淆矩阵

每个类别的 precision分别是 对角线元素除以该元素所在的 列元素之和;而 recall则是除以该类别所在 行元素之和。如:类别2的Precision_2=121/(9+6+121+3+8);Recall_2=121/(4+13+121+3+12)。

from sklearn.metrics import confusion_matrix

C=confusion_matrix(y_true, y_pred, labels=['0','1','2','3','4'])

for i in range(5):
    print(C[i][i]/sum(C[i]))

四、多类别分类任务的指标kappa

kappa系数的计算是基于混淆矩阵的,取值为-1到1之间,通常大于0。基于混淆矩阵的kappa系数计算公式如下:
κ = p 0 − p e 1 − p e \kappa=\frac{p_{0}-p_{e}}{1-p_{e}}κ=1 −p e ​p 0 ​−p e ​​
其中,
p 0 = 混浠矩阵对角线元素之和 整个矩阵元素之和 p_{0}=\frac{\text { 混浠矩阵对角线元素之和 }}{\text { 整个矩阵元素之和 }}p 0 ​=整个矩阵元素之和混浠矩阵对角线元素之和​
即Accuracy。
p e = ∑ i 第 i 行元素之和 ∗ 第 i 列元素之和 ∑ 矩阵所有元素之和 2 p_{e}=\frac{\sum_{i} \text {第} i \text {行元素之和} * \text {第} i \text {列元素之和 }}{\sum \text { 矩阵所有元素之和 }^{2}}p e ​=∑矩阵所有元素之和2 ∑i ​第i 行元素之和∗第i 列元素之和​
即所有类别分别对应的实际与预测数量的乘积的总和,除以样本总数的平方。

假设每一类的真实样本个数分别为a1,a2,…,aC,而预测出来的每一类的样本个数分别为b1,b2,…,bC

总样本个数为n,则有
p e = a 1 × b 1 + a 2 × b 2 + … + a C × b C n × n p_{e}=\frac{\mathrm{a} 1 \times \mathrm{b} 1+\mathrm{a} 2 \times \mathrm{b} 2+\ldots+\mathrm{aC} \times \mathrm{bC}}{\mathrm{n} \times \mathrm{n}}p e ​=n ×n a 1 ×b 1 +a 2 ×b 2 +…+aC ×bC ​

五、AUC和ROC待补充

。。。

推荐更详细系列:
回顾及总结–评价指标(分类指标)
机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱
机器学习评估指标–知乎

Original: https://blog.csdn.net/weixin_43818631/article/details/119281537
Author: 诸神黄昏的幸存者
Title: 常见的图像分类指标(二分类以及多分类)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/664433/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球