比赛已经开始,我们不妨用 Python 来对参赛队伍的实力情况进行分析,并大胆的预测下本届世界杯的夺冠热门球队吧!
通过数据分析,可以发现很多有趣的结果,比如:
找出哪些队伍是首次进入世界杯的黑马队伍
找出2018年32强中之前已经进入过世界杯,但在世界杯上没有赢得过一场比赛的队伍
当然,我们本次的主要任务是要通过数据分析来预测2018年世界杯的夺冠热门队伍。
本次分析的数据来源于 Kaggle, 包含从 1872 年到今年的数据,包括世界杯比赛、世界杯预选赛、亚洲杯、欧洲杯、国家之间的友谊赛等比赛,一共大约 40000 场比赛的情况。
本次的环境为:
window 7 系统
python 3.6
Jupyter Notebook
pandas version 0.22.0
先来看看数据的情况:
importpandasaspd
importmatplotlib.pyplotasplt
%matplotlib inline
plt.style.use(‘ggplot’)
df = pd.read_csv(‘results.csv’)
df.head()
该数据集包含的数据列的信息如下:
日期
主队名称
客队名称
主队进球数 (不含点球)
客队进球数 (不含点球)
比赛的类型
比赛所在城市
比赛所在国家
是否中立
结果如下:
1、 获取所有世界杯比赛的数据
df_FIFA_all = df[df[‘tournament’].str.contains(‘FIFA’, regex=True)]
df_FIFA = df_FIFA_all[df_FIFA_all[‘tournament’]==’FIFA World Cup’]
df_FIFA.head()
结果如下:
数据做一个初步整理
df_FIFA.loc[:,’date’] = pd.to_datetime(df_FIFA.loc[:,’date’])
df_FIFA[‘year’] = df_FIFA[‘date’].dt.year
df_FIFA[‘diff_score’] = df_FIFA[‘home_score’]-df_FIFA[‘away_score’]
df_FIFA[‘win_team’] =”
df_FIFA[‘diff_score’] = pd.to_numeric(df_FIFA[‘diff_score’])
创建一个新的列数据,包含获胜队伍的信息
The first method to get the winners
df_FIFA.loc[df_FIFA[‘diff_score’]>0,’win_team’] = df_FIFA.loc[df_FIFA[‘diff_score’]>0,’home_team’]
df_FIFA.loc[df_FIFA[‘diff_score’]
Original: https://blog.csdn.net/weixin_42596214/article/details/113675092
Author: 拼命阿白
Title: python编程比赛_用Python编程分析4W场球赛后,2018世界杯冠军竟是…
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/679040/
转载文章受原作者版权保护。转载请注明原作者出处!