如何用python计算分类模型的混淆矩阵

2023年6月26日上午2:28 • 人工智能 • 阅读 73

一、混淆矩阵的定义

混淆矩阵也称误差矩阵，是表示精度评价的一种标准格式，用n行n列的矩阵形式来表示。具体评价指标有总体精度、制图精度、用户精度等，这些精度指标从不同的侧面反映了图像分类的精度。

在人工智能中，混淆矩阵（confusion matrix）是可视化工具，特别用于监督学习，在无监督学习中一般叫做匹配矩阵。

在图像精度评价中，主要用于比较分类结果和实际测得值，可以把分类结果的精度显示在一个混淆矩阵里面。混淆矩阵是通过将每个实测像元的位置和分类与分类图像中的相应位置和分类相比较计算的。

二、混淆矩阵表达的含义

1.混淆矩阵的每一列代表了预测类别，每一列的总数表示预测为该类别的数据的数目；

2.每一行代表了数据的真实归属类别，每一行的数据总数表示该类别的数据实例的数目；每一列中的数值表示真实数据被预测为该类的数目。

三、混淆矩阵的表现方式

混淆矩阵真实值PositiveNegative预测值PositiveTPFPNegativeFNTN

真实值=Positive，预测值=Positive (TP=True Positive)

(真阳性)样本的真实类别是正类，并且模型识别的结果也是正类。

真实值=Positive，预测值=Negative (FN=False Negative)

(假阳性)样本的真实类别是正类，但是模型将其识别为负类。

真实值=Negative，预测值=Positive (FP=True Positive)

(假阴性)样本的真实类别是负类，但是模型将其识别为正类。

真实值=Negative，预测值=Negative (TN=True Positive)

(真阴性)样本的真实类别是负类，并且模型将其识别为负类。

四、混淆矩阵的指标

（1）基本的统计结果

预测性分类模型，目的是预测结果的准确率越高越好。对应到混淆矩阵中，表现得方式就是TP(真阳性)与TN(真阴性)的数量大，而FP(假阳性)与FN(假阴性)的数量小。

（2）二级指标

在混淆矩阵里面统计的是个数，在大量数据前，TP、FN、TP、TN的个数不是能很好的体现出模型预测结果的好坏，从而无法对比模型的优劣程度。因此，混淆矩阵在基本结果上延伸出以下4个指标，又被称为二级指标。它们计算公式如下：

主要代码

import os
import math
import json
import matplotlib.pyplot as plt
import numpy as np
from tqdm import tqdm

class ConfusionMatrix(object):

    def __init__(self, num_classes: int, labels: list):
        self.matrix = np.zeros((num_classes, num_classes))
        self.num_classes = num_classes
        self.labels = labels

    def update(self, preds, labels):
        for p, t in zip(preds, labels):
            self.matrix[p, t] += 1

    def summary(self):
        # calculate accuracy
        sum_TP = 0
        for i in range(self.num_classes):
            sum_TP += self.matrix[i, i]
        acc = sum_TP / np.sum(self.matrix)
        print("the model accuracy is ", acc)

        # precision, recall, specificity
        table = PrettyTable()
        table.field_names = ["", "Precision", "Recall", "Specificity"]
        for i in range(self.num_classes):
            TP = self.matrix[i, i]
            FP = np.sum(self.matrix[i, :]) - TP
            FN = np.sum(self.matrix[:, i]) - TP
            TN = np.sum(self.matrix) - TP - FP - FN
            Precision = round(TP / (TP + FP), 3) if TP + FP != 0 else 0.

            Recall = round(TP / (TP + FN), 3) if TP + FN != 0 else 0.

            Specificity = round(TN / (TN + FP), 3) if TN + FP != 0 else 0.

            # &#x5C0F;&#x6570;&#x70B9;&#x53D6;&#x540E;&#x4E09;&#x4F4D;
            table.add_row([self.labels[i], Precision, Recall, Specificity])
        print(table)

    def plot(self):
        # &#x7ED8;&#x5236;&#x6DF7;&#x6DC6;&#x77E9;&#x9635;
        matrix = self.matrix
        print(matrix)
        plt.imshow(matrix, cmap=plt.cm.Blues)

        # &#x8BBE;&#x7F6E;x&#x8F74;&#x5750;&#x6807;label
        plt.xticks(range(self.num_classes), self.labels, rotation=45)
        # &#x8BBE;&#x7F6E;y&#x8F74;&#x5750;&#x6807;label
        plt.yticks(range(self.num_classes), self.labels)
        # &#x53F3;&#x4FA7;&#x663E;&#x793A;&#x8272;&#x8C31;
        plt.colorbar()
        plt.xlabel('True Labels')
        plt.ylabel('Predicted Labels')
        plt.title('Confusion matrix')

        # &#x5728;&#x56FE;&#x4E2D;&#x6807;&#x6CE8;&#x6570;&#x91CF;/&#x6982;&#x7387;&#x4FE1;&#x606F;
        thresh = matrix.max() / 2
        for x in range(self.num_classes):
            for y in range(self.num_classes):
                # &#x6CE8;&#x610F;&#x8FD9;&#x91CC;&#x7684;matrix[y, x]&#x4E0D;&#x662F;matrix[x, y]
                info = int(matrix[y, x])
                plt.text(x, y, info,
                         verticalalignment='center',
                         horizontalalignment='center',
                         color="white" if info > thresh else "black")
        plt.tight_layout()
        plt.show()

Original: https://blog.csdn.net/m0_47889186/article/details/123694627
Author: 画纸仁
Title: 如何用python计算分类模型的混淆矩阵

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/651982/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pkg打包很慢的解决办法

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月29日
0084
论文阅读：《What Makes Training Multi-Modal Classification Networks Hard》

标题：是什么让训练多模态分类网络变得困难？来源：CVPR 2020[https://arxiv.org/abs/1905.12681]代码：暂无一、摘要考虑在具有多个输入模态…

人工智能 2023年6月4日
00118
HRNet代码及原理分析（一）– 网络结构

HRNet代码及原理分析（一）– 网络结构通常来说，目前市场上主流物体关键点的方法一般分两类：基于坐标回归，热力图。而后者主要是由高到低分辨率网络然后由低分辨率网络再…

人工智能 2023年7月12日
0072
HTML小游戏4 —— 简易版英雄联盟（附完整源码）

💂 网站推荐:【神级源码资源网】【摸鱼小游戏】 🤟 风趣幽默的前端学习课程：👉28个案例趣学前端 💅 想寻找共同学习交流、摸鱼划水的小伙伴，请点击【摸鱼学习交流群】 *💬 免…

人工智能 2023年6月28日
0077
html实现个人空间（源码）

文章目录 1.个人空间设计 * 1.1 进入空间 1.2 空间顶部 1.3 空间内容 1.3 空间底部 1.3 空间整体 2.源码和完整效果展示 * 2.1 完整效果 2.2 主要…

人工智能 2023年6月26日
0078
张量在神经网络算法中的角色是什么

引言在神经网络算法中，张量（tensor）起着非常重要的作用。它是表示多维数据的方式，可以存储和处理神经网络中的各种数据，并传递给下一层的神经元。本文将详细介绍张量在神经网络算法…

人工智能 2024年1月1日
0053
TensorFlow和keras安装教程

准备工作 1.安装anaconda安装教程参考此博客：点这儿2.安装成功记住自己anaconda的路径，以后pycharm配置会用3.查看并记住自己conda版本号以及python…

人工智能 2023年5月23日
00118
[3D检测系列-PointRCNN]复现PointRCNN代码，并实现PointRCNN3D目标检测可视化，包含预训练权重下载链接（从0开始以及各种报错的解决方法）

[3D检测系列-PointRCNN] 复现PointRCNN代码 1.下载代码 2.准备数据集 (1)使用官网提供的数据集格式 (2)使用软连接 3.检测结果 4.结果可视化 (1…

人工智能 2023年7月27日
00100
使用 Presto 和 Alluxio 在 AWS 上搭建高性能平台来支持实时游戏服务

概要速览美国艺电 (EA) 是游戏行业的翘楚，每年为全球几十亿用户提供数十款游戏。能否针对EA的在线服务做出近实时决策对于业务发展至关重要。本文介绍了在AWS上搭建的基于Pres…

人工智能 2023年7月15日
0045
Go数据结构队列

二队列 2.1 队列的介绍队列是一个有序列表，可以用数组或是链表来实现。遵循先入先出的原则。即:先存入队列的数据，要先取出。后存入的要后取出 2.2 数组模拟队列思路队列本身…

人工智能 2023年6月26日
0068
图像相似性评价指标（SSIM、MSE、PSNR）简单介绍及计算方法

图像相似性评价指标图像相似性评价指标 * SSIM（结构相似性） MSE（均方误差） PSNR（峰值信噪比）使用python进行计算图像相似性评价指标对于图像生成质量的通…

人工智能 2023年6月17日
00131
matplotlib之饼图

文章目录饼图： pie函数示例说明：扩展应用 * 饼图常用属性甜甜圈图表总结 * 饼图的缺点：饼图和柱状图区别 ; 饼图：饼图（pie plot），或称饼状图，在日常…

人工智能 2023年7月15日
0080
Opencv.js+Hbuilder快速打造一个图像处理App

一、开发工具简介 1、Opencv.js Opencv 是一个常见的图像处理库，通常使用C++和python去调这个库对图像、视频流进行处理，而js版的opencv可以进一步丰富前…

人工智能 2023年7月19日
0056
软件智能:aaas系统中AI众生的“世”和“界” 之9 一个主题（神经系统）及其两条线索

昨天的” 神经系统的假设“篇中对应三种计算复杂度的神经网络是aaas系统提出的AI原型，同时也是aaas系统提案的软件智能。神经网络是aaas的主体（实…

人工智能 2023年6月1日
0055
多层感知机MLP的理解及代码实现

1、MLP模型多层感知机（MLP，Multilayer Perceptron）也叫人工神经网络（ANN，Artificial Neural Network），除了输入输出层，它中…

人工智能 2023年6月13日
0066
2021科大讯飞试题标签预测挑战赛亚军方案总结

摘要这个比赛的任务是根据题目的文本内容，预测题目的知识点及难度标签，其中知识点包括五个类型，我们需要预测出对应类型的知识点标签。在本次比赛中，我们构造了六个独立的模型，模型结构相…

人工智能 2023年5月30日
0089

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

如何用python计算分类模型的混淆矩阵

（1）基本的统计结果

（2）二级指标

大家都在看