sklearn决策树/随机森林多分类绘制ROC和PR曲线

2023年7月2日上午11:15 • 人工智能 • 阅读 83

有篇讲解原理的博文/论文（可看可不看）：《为什么Decision Tree可以绘制出ROC曲线？》

一、数据，并要先one-hot多分类标签

from sklearn.preprocessing import label_binarize
y_test = label_binarize(y_test, classes=[0, 1, 2, 3, 4])
n_classes = y_test.shape[1]

二、构建模型，注意OVR类的使用（OneVsRestClassifier）


from sklearn.multiclass import OneVsRestClassifier

dtc = OneVsRestClassifier(DecisionTreeClassifier(criterion="gini",
                                                 min_samples_leaf=3, max_depth=15))

clf = dtc.fit(X=X_train, y=y_train)

y_score = clf.predict_proba(X_test)

三、绘图

第1个图 PR曲线

from sklearn.metrics import precision_recall_curve

precision = dict()
recall = dict()
average_precision = dict()
for i in range(n_classes):
    precision[i], recall[i], _ = precision_recall_curve(y_test[:, i],
                                                        y_score[:, i])
    average_precision[i] = average_precision_score(y_test[:, i], y_score[:, i])

precision["macro"], recall["macro"], _ = precision_recall_curve(y_test.ravel(),
                                                                y_score.ravel())
average_precision["macro"] = average_precision_score(y_test, y_score,
                                                     average="macro")
print('Average precision score, macro-averaged over all classes: {0:0.2f}'
      .format(average_precision["macro"]))

plt.subplot(2, 3, iter_)
iter_ += 1

plt.step(recall['macro'], precision['macro'], where='post')

plt.xlabel('Recall')
plt.ylabel('Precision')
plt.ylim([0.0, 1.05])
plt.xlim([0.0, 1.0])
plt.title(
    'Average precision score, macro-averaged over all classes: AP={0:0.3f}'
        .format(average_precision["macro"]))

第2个图 ROC曲线（分别计算每一类下面面积为AUC值）

from sklearn.metrics import roc_curve, auc
fpr = dict()
tpr = dict()
roc_auc = dict()
for i in range(n_classes):
    fpr[i], tpr[i], _ = roc_curve(y_test[:, i], y_score[:, i])
    roc_auc[i] = auc(fpr[i], tpr[i])

plt.subplot(2, 3, iter_)
iter_ += 1
lw = 1
colors = ['blue', 'red', 'green', 'black', 'yellow']
for i, color in zip(range(n_classes), colors):
    plt.plot(fpr[i], tpr[i], color=color, lw=lw,
             label='ROC curve of class {0} (area = {1:0.3f})'
             ''.format(i, roc_auc[i]))

plt.plot([0, 1], [0, 1], 'k--', lw=lw)
plt.xlim([-0.05, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver operating characteristic for multi-class data')
plt.legend(loc="lower right")
plt.show()

与上面不一样的是，也可以直接计算AUC值

auc()这个函数快被取消了，建议之后多用roc_auc_score，但是《sklearn：为什么roc_auc_score()和auc()有不同的结果？博客园》

from sklearn.metrics import roc_auc_score
y_score = clf.predict_proba(X_test)
print(f"AUC={roc_auc_score(y_test, y_score, average='micro')}")

全部参考：

Original: https://blog.csdn.net/weixin_43469047/article/details/114707688
Author: 小白tree
Title: sklearn决策树/随机森林多分类绘制ROC和PR曲线

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/665320/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

用Python脚本能获取Wifi密码么？能。

注意，本文不是破解 WIFI 密码，当然你把程序发给别人再获取对方密码，那是社会工程学。文章目录 * – ⛳️ 实战场景与 subprocess 模块介绍 &#821…

人工智能 2023年7月31日
0055
如何使用ArcGIS Pro中影像分类工具

遥感图像分类是图像信息提取的一种方法。在特征空间中，依据像元相似度的大小，归类相似的像元，并给每一个像元赋类别值的过程。分类的目标将是将图像中的所有像元自动进行地物类别的分类。 A…

人工智能 2023年7月2日
0090
yolov5的anchor详解

以yolov5s v3为例： *anchor长啥样及怎么得到的？以下是yolov5 v3.0中的anchor anchors: 1. [10,13, 16,30, 33,23] …

人工智能 2023年5月26日
0094
目标检测的Tricks | 【Trick12】分布式训练（Multi-GPU）与DistributedParallel使用相关总结

如有错误，恳请指出。用这篇博客记录多卡（也就是mutil-gpu）的使用，目的是加快训练过程，在pytorch中称之为分布式训练。在pytorch中主要使用的是Distribut…

人工智能 2023年7月12日
0073
Python-中北大学人工智能OpenCV人脸识别（根据图片训练数据，根据训练好的数据识别人脸）

文章目录 1. 根据训练照片训练数据模型 2. 根据训练的数据文件，进行人脸识别根据训练照片训练数据模型训练流程：读取文件夹下的所有文件，使用PIL 库中的Image方法打开…

人工智能 2023年7月26日
0064
相机标定原理与实战【python-opencv】

文章目录为什么要进行相机标定？ 1. 成像几何 * 1.1 坐标系统 1.2 坐标转换 – 1.2.1 世界坐标系转换到相机坐标系 1.1.3 相机坐标系到图像坐标系…

人工智能 2023年7月19日
0050
在部署过程中如何协调和管理不同团队或部门之间的合作和沟通

问题介绍在部署过程中，协调和管理不同团队或部门之间的合作和沟通是至关重要的。有效的协调和管理能够确保各团队之间的良好合作，促进信息的流动和协同工作，提高项目的准确性和完成度。在…

人工智能 2024年1月3日
0038
学习QT之解决方案和项目结构

本文使用QT5创建工程, 具体版本为 QT5.14.2, 包含的 QT Creator 为 4.11.1 1. 创建默认QT工程 1. 打开 QT Creator(4.11.1 社…

人工智能 2023年6月26日
0094
《商务与经济统计》练习：案例3-4：天使巧克力的网络交易

此练习涉及的知识技能：描述统计学、相关关系分析、Excel（数据透视表、数据分析工具）的应用练习内容：三种数值变量（浏览网站时间、观看网页数量、消费金额）的图表和和数值汇总分…

人工智能 2023年7月15日
0079
测量模型不确定性的两种简单方法

在本文中，我们将介绍两种方法，它们允许你获得模型的不确定性：蒙特卡罗Dropout法（MC Dropout）和深度集成法。它们适用于各种各样的任务，但在本文中，我们将展示一个图像…

人工智能 2023年6月16日
0074
2022福大数学建模赛题B题-BP神经网络多分类（基于Tensorflow）-附python代码

题目3：请根据附件 2 所提供的部分食物寒热属性（分为三类：性平、性温热、性凉寒），对附件 1 中的食物进行分类，判断这些食物是属于性平、性温热或性凉寒中哪一类，并说明你分…

人工智能 2023年7月14日
0079
88 R 用户画像之线性回归逻辑回归综合实战 1

用户画像之线性回归逻辑回归综合实战线性回归篇 1 初期准备 2 分割数据集 3 lift制作 4 缺失值处理 5 变量确定与模型拟合 6 lift图制作 7 输出模型公式线性回…

人工智能 2023年7月18日
0064
VS配置永久OpenCV（小萌轻松操作）：超细致

VS配置永久OpenCV（小萌轻松操作）：超细致一、下载安装Visual Studio2022 1.进入：Visual Studio2022的官网，点击Community202…

人工智能 2023年7月26日
0086
各种生成模型：VAE、GAN、flow、DDPM、autoregressive models

目录 1 生成模型分类 12 Autoregressive model 23 变分推断 33.1 ELBO 33.2 变分分布族Q 54 VAE 65 GAN 66 flow模型 …

人工智能 2023年6月23日
0078
深度学习之环境配置–anaconda安装虚拟环境

由于torch的CPU和GPU版本会发生冲突，为了避免冲突，我们在base中创建CPU环境之后可以再安装一个虚拟环境创建GPU版本，这样我们就同时拥有CPU和GPU两个环境了。下面…

人工智能 2023年6月16日
0076
【UV打印机】电气之光电传感器

00. 目录文章目录 * – 00. 目录 – 01. 概述 – 02. 应用场景 – 03. 检测方式 – 04. …

人工智能 2023年6月27日
00104

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

sklearn决策树/随机森林多分类绘制ROC和PR曲线

一、数据，并要先one-hot多分类标签

二、构建模型，注意OVR类的使用（OneVsRestClassifier）

三、绘图

第1个图 PR曲线

第2个图 ROC曲线（分别计算每一类下面面积为AUC值）

与上面不一样的是，也可以直接计算AUC值

大家都在看