ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

目录

基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性

# 1、定义数据集

# 2、数据预处理

# 2.1、分离特征与标签

# 3、模型建立和训练

# 3.1、数据集切分# 3.2、模型训练

# 3.3、树模型可视化并保存图片

# 4、PDP实现模型可解释性

# (1)、单特征PDP可视化

# (2)、双特征交互PDP可视化

相关文章
ML:机器学习可解释性之SHAP值之理解单样本单特征预测
ML之shap:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图可视化实现可解释性之详细攻略
ML之shap:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图可视化实现可解释性之详细攻略实现

相关文章
ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略
ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略实现

相关文章
DataScience&ML:基于heart disease心脏病分类预测数据集利用决策数算法基于graphviz/eli5/pdpbox/shap库实现模型可解释性(全局特征重要性解释/部分特征重要性/局部特征重要性解释/局部决策图可解释/误分类样本可视化)之详细攻略
DataScience&ML:基于heart disease心脏病分类预测数据集利用决策数算法基于graphviz/eli5/pdpbox/shap库实现模型可解释性(全局/部分/局部解释)实现

基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性

1、定义数据集

数据集来源Dataset:FIFA 2018 Statistics数据集(Predict FIFA 2018 Man of the Match预测2018年国际足联最佳球员)的简介、下载、使用方法之详细攻略_一个处女座的程序猿的博客-CSDN博客
Date Team Opponent Goal Scored Ball Possession %Attempts On-Target Off-Target Blocked Corners Offsides Free Kicks Saves Pass Accuracy %Passes Distance Covered (Kms)Fouls Committed Yellow Card Yellow & Red Red Man of the Match 1st Goal Round PSO Goals in PSO Own goals Own goal Time 14-06-2018 Russia Saudi Arabia 5 40 13 7 3 3 6 3 11 0 78 306 118 22 0 0 0 Yes 12 Group Stage No 0 14-06-2018 Saudi Arabia Russia 0 60 6 0 3 3 2 1 25 2 86 511 105 10 0 0 0 No Group Stage No 0 15-06-2018 Egypt Uruguay 0 43 8 3 3 2 0 1 7 3 78 395 112 12 2 0 0 No Group Stage No 0 15-06-2018 Uruguay Egypt 1 57 14 4 6 4 5 1 13 3 86 589 111 6 0 0 0 Yes 89 Group Stage No 0 15-06-2018 Morocco Iran 0 64 13 3 6 4 5 0 14 2 86 433 101 22 1 0 0 No Group Stage No 0 1 90

2、数据预处理

# 2.1、分离特征与标签

df_X    Goal Scored  Ball Possession %  Attempts  ...  Yellow & Red  Red  Goals in PSO
0            5                 40        13  ...             0    0             0
1            0                 60         6  ...             0    0             0
2            0                 43         8  ...             0    0             0
3            1                 57        14  ...             0    0             0
4            0                 64        13  ...             0    0             0

[5 rows x 18 columns]
df_y 0     True
1    False
2    False
3     True
4    False
Name: Man of the Match, dtype: bool

3、模型建立和训练

# 3.1、数据集切分 # 3.2、模型训练

# 3.3、树模型可视化并保存图片

将dot数据保存为图片

ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

4、PDP实现模型可解释性

# (1)、单特征PDP可视化

ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

# (2)、双特征交互PDP可视化

ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

Original: https://blog.csdn.net/qq_41185868/article/details/126069132
Author: 一个处女座的程序猿
Title: ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/662811/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球