DateTeamOpponentGoal ScoredBall Possession %AttemptsOn-TargetOff-TargetBlockedCornersOffsidesFree KicksSavesPass Accuracy %PassesDistance Covered (Kms)Fouls CommittedYellow CardYellow & RedRedMan of the Match1st GoalRoundPSOGoals in PSOOwn goalsOwn goal Time14-06-2018RussiaSaudi Arabia54013733631107830611822000Yes12Group StageNo014-06-2018Saudi ArabiaRussia0606033212528651110510000NoGroup StageNo015-06-2018EgyptUruguay043833201737839511212200NoGroup StageNo015-06-2018UruguayEgypt1571446451133865891116000Yes89Group StageNo015-06-2018MoroccoIran06413364501428643310122100NoGroup StageNo0190

2、数据预处理

# 2.1、分离特征与标签

df_X    Goal Scored  Ball Possession %  Attempts  ...  Yellow & Red  Red  Goals in PSO
0            5                 40        13  ...             0    0             0
1            0                 60         6  ...             0    0             0
2            0                 43         8  ...             0    0             0
3            1                 57        14  ...             0    0             0
4            0                 64        13  ...             0    0             0

[5 rows x 18 columns]
df_y 0     True
1    False
2    False
3     True
4    False
Name: Man of the Match, dtype: bool

3、模型建立和训练

# 3.1、数据集切分 # 3.2、模型训练

4、模型特征重要性解释可视化

# 4.1、单个样本基于shap值进行解释可视化

# (1)、挑选某条样本数据并转为array格式

&#x8F93;&#x51FA;&#x5F53;&#x524D;&#x6D4B;&#x8BD5;&#x6837;&#x672C;&#xFF1A;5
 Goal Scored                 2
Ball Possession %          38
Attempts                   13
On-Target                   7
Off-Target                  4
Blocked                     2
Corners                     6
Offsides                    1
Free Kicks                 18
Saves                       1
Pass Accuracy %            69
Passes                    399
Distance Covered (Kms)    148
Fouls Committed            25
Yellow Card                 1
Yellow & Red                0
Red                         0
Goals in PSO                3
Name: 118, dtype: int64
&#x8F93;&#x51FA;&#x5F53;&#x524D;&#x6D4B;&#x8BD5;&#x6837;&#x672C;&#x7684;&#x771F;&#x5B9E;label&#xFF1A; False
&#x8F93;&#x51FA;&#x5F53;&#x524D;&#x6D4B;&#x8BD5;&#x6837;&#x672C;&#x7684;&#x7684;&#x9884;&#x6D4B;&#x6982;&#x7387;&#xFF1A; [[0.29 0.71]]

&#x8F93;&#x51FA;&#x5F53;&#x524D;&#x6D4B;&#x8BD5;&#x6837;&#x672C;&#xFF1A;7
 Goal Scored                 0
Ball Possession %          53
Attempts                   16
On-Target                   4
Off-Target                 10
Blocked                     2
Corners                     7
Offsides                    1
Free Kicks                 20
Saves                       1
Pass Accuracy %            77
Passes                    466
Distance Covered (Kms)    107
Fouls Committed            23
Yellow Card                 1
Yellow & Red                0
Red                         0
Goals in PSO                0
Name: 35, dtype: int64
&#x8F93;&#x51FA;&#x5F53;&#x524D;&#x6D4B;&#x8BD5;&#x6837;&#x672C;&#x7684;&#x771F;&#x5B9E;label&#xFF1A; False
&#x8F93;&#x51FA;&#x5F53;&#x524D;&#x6D4B;&#x8BD5;&#x6837;&#x672C;&#x7684;&#x7684;&#x9884;&#x6D4B;&#x6982;&#x7387;&#xFF1A; [[0.56 0.44]]

# (2)、利用Shap值解释RFC模型

# T1、基于树模型TreeExplainer创建Explainer并计算SHAP值，且进行单个样本力图可视化(分析单个样本预测的解释)

ML之shap：基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图/依赖关系贡献图可视化实现可解释性之攻略

# T2、基于核模型KernelExplainer创建Explainer并计算SHAP值，且进行单个样本力图可视化(分析单个样本预测的解释)

# 4.2、多个样本基于shap值进行解释可视化

# (1)、基于树模型TreeExplainer创建Explainer并计算SHAP值

# (2)、全验证数据集样本各特征shap值summary_plot可视化

# (3)、依赖关系贡献图dependence_plot可视化

Original: https://blog.csdn.net/qq_41185868/article/details/126072585
Author: 一个处女座的程序猿
Title: ML之shap：基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图/依赖关系贡献图可视化实现可解释性之攻略

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/663427/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

数据挖掘—Weka 的数据库挖掘及数据预处理

基于 Weka 的数据库挖掘及数据预处理 ❤️‍ 大家好，我是java厂长，今天带你们了走进数据挖掘的世界🚜🚜！❤️‍ 关于作者作者介绍 🍓 博客主页：作者主页 🍓 简介：JAV…

人工智能 2023年6月19日
0062
消费者用户画像分析

项目描述你拥有一个超市(Supermarket Mall)。通过会员卡，你用有一些关于你的客户的基本数据，如客户ID，年龄，性别，年收入和消费分数。消费分数是根据客户行为和购买数…

人工智能 2023年7月17日
0089
Python 机器学习实战 —— 监督学习（下）

前言近年来AI人工智能成为社会发展趋势，在IT行业引起一波热潮，有关机器学习、深度学习、神经网络等文章多不胜数。从智能家居、自动驾驶、无人机、智能机器人到人造卫星、安防军备，无论…

人工智能 2023年6月4日
0070
数据分层—-ODS,DWD,DWS,ADS,DIM

数据分层相关概念：零、数据加载层：ETL（Extract-Transform-Load）一、数据仓库层：DW（Data Warehouse）操作数据层：ODS（Operati…

人工智能 2023年7月17日
0071
R语言逻辑运算符（Logical Operators，大于、小于、等于、不等于、与或非、是否为真）、R语言逻辑运算符（Logical Operators）实战示例

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月19日
00105
CVPR2022 目标检测方向文章（附摘要）

CVPR官方下载：主会论文：https://openaccess.thecvf.com/CVPR2022 Workshop论文：https://openaccess.thecvf….

人工智能 2023年5月28日
0083
TensorFlow中的超参数调优是如何进行的

超参数调优超参数调优是指在机器学习和深度学习模型中，通过调整模型的一些预设参数，提高模型的性能和泛化能力，从而使得模型更加准确。在TensorFlow中，超参数可以是学习率、批…

人工智能 2023年12月31日
0032
autojs之语音识别

使用情景手机实现语音识别效果展示原理使用讯飞webpai调用讯飞的语音转写服务难点上传语音文件你将学到以下知识给讯飞发送语音文件分片序号的生成计算签名 Hmac…

人工智能 2023年5月25日
0091
RTK_LIB 源码、可执行文件、rtkget、观测文件、星历文件（精密星历、广播星历）、精密钟差文件介绍

RTK_LIB开源程序下载：点开rtklib链接：下载最新版本的可执行文件和程序源码。 ; 2. GNSS数据处理需要的文件 2.1 伪距定位：spp 观测数据（.0）导航星历…

人工智能 2023年6月10日
00133
linux 常用命令（含安装pytorch，tensorflow，cuda=10.2）

文章目录 * – 常用命令 – 安装pytorch – 安装tensorflow 个人用总结：常用命令 1.重启网络设置sudo servic…

人工智能 2023年5月24日
00107
YOLOv5改进之十：损失函数改进为SIOU

前言：作为当前先进的深度学习目标检测算法YOLOv5，已经集合了大量的trick，但是还是有提高和改进的空间，针对具体应用场景下的检测难点，可以不同的改进方法。此后的系列文章，…

人工智能 2023年6月23日
0083
python 数据类笔试题_数据分析岗Python笔试题

我整理了数据分析师岗的Python笔试题，主要涉及到用Python完成数据处理和分析的内容。自己做了一遍，供大家学习思考。一、数据处理题 1.将Excel工作簿 “T…

人工智能 2023年7月7日
0052
神经网络中view()，torch.flatten(),torch.nn.Flatten()详解

在神经网络中经常看到view()，torch.flatten(),torch.nn.Flatten()这几个方法。这几个方法一般用于改变tensor的形状。为日后方便使用下面就一一…

人工智能 2023年6月17日
0085
【代码详解】nerf-pytorch代码逐行分析

目录前言 run_nerf.py * config_parser() train() create_nerf() render() batchify_rays() render_…

人工智能 2023年6月23日
0082
华为手机媒体音量自动静音_原来华为手机的音量键这么多神奇的功能，涨知识了…

正在使用华为手机的宝宝不知道你有没有认真学习过华为手机的音量键功能，它不仅可以调节手机的音量，就这么简单！其实，它也有很多不为人知的提示，而且很实用，我们来看看吧。 [En] Ba…

人工智能 2023年5月27日
00286
在Logistic回归中，特征工程对于提高模型性能至关重要。常见的特征工程包括多项式特征、交互特征和特征选择等

特征工程在Logistic回归中的重要性特征工程在机器学习中扮演着重要的角色，尤其是在Logistic回归中。通过对特征进行转换、选择和组合，特征工程能够帮助提高模型的准确性和性…

人工智能 2024年1月6日
0046

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

ML之shap：基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图/依赖关系贡献图可视化实现可解释性之攻略

1、定义数据集