python编程比赛_用Python编程分析4W场球赛后,2018世界杯冠军竟是…

比赛已经开始,我们不妨用 Python 来对参赛队伍的实力情况进行分析,并大胆的预测下本届世界杯的夺冠热门球队吧!

python编程比赛_用Python编程分析4W场球赛后,2018世界杯冠军竟是…

通过数据分析,可以发现很多有趣的结果,比如:

找出哪些队伍是首次进入世界杯的黑马队伍

找出2018年32强中之前已经进入过世界杯,但在世界杯上没有赢得过一场比赛的队伍

当然,我们本次的主要任务是要通过数据分析来预测2018年世界杯的夺冠热门队伍。

本次分析的数据来源于 Kaggle, 包含从 1872 年到今年的数据,包括世界杯比赛、世界杯预选赛、亚洲杯、欧洲杯、国家之间的友谊赛等比赛,一共大约 40000 场比赛的情况。

本次的环境为:

window 7 系统

python 3.6

Jupyter Notebook

pandas version 0.22.0

先来看看数据的情况:

importpandasaspd

importmatplotlib.pyplotasplt

%matplotlib inline

plt.style.use(‘ggplot’)

df = pd.read_csv(‘results.csv’)

df.head()

该数据集包含的数据列的信息如下:

日期

主队名称

客队名称

主队进球数 (不含点球)

客队进球数 (不含点球)

比赛的类型

比赛所在城市

比赛所在国家

是否中立

结果如下:

python编程比赛_用Python编程分析4W场球赛后,2018世界杯冠军竟是…

1、 获取所有世界杯比赛的数据

df_FIFA_all = df[df[‘tournament’].str.contains(‘FIFA’, regex=True)]

df_FIFA = df_FIFA_all[df_FIFA_all[‘tournament’]==’FIFA World Cup’]

df_FIFA.head()

结果如下:

python编程比赛_用Python编程分析4W场球赛后,2018世界杯冠军竟是…

数据做一个初步整理

df_FIFA.loc[:,’date’] = pd.to_datetime(df_FIFA.loc[:,’date’])

df_FIFA[‘year’] = df_FIFA[‘date’].dt.year

df_FIFA[‘diff_score’] = df_FIFA[‘home_score’]-df_FIFA[‘away_score’]

df_FIFA[‘win_team’] =”

df_FIFA[‘diff_score’] = pd.to_numeric(df_FIFA[‘diff_score’])

创建一个新的列数据,包含获胜队伍的信息

The first method to get the winners

df_FIFA.loc[df_FIFA[‘diff_score’]>0,’win_team’] = df_FIFA.loc[df_FIFA[‘diff_score’]>0,’home_team’]

df_FIFA.loc[df_FIFA[‘diff_score’]

Original: https://blog.csdn.net/weixin_42596214/article/details/113675092
Author: 拼命阿白
Title: python编程比赛_用Python编程分析4W场球赛后,2018世界杯冠军竟是…

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/679040/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球