数据分析入门学习之三

用PowerBI分析往届世界杯赛球队成绩

用PowerBI与Python做个简单对比

python分析文章请见用Python分析热门夺冠球队

1、 获取所有世界杯比赛的数据(不含预选赛) 

2、 获取世界杯所有比赛的前20强数据情况 

2.1 获胜场数 

2.2 进球总数量 

2.3 参加场次

数据来源于International football results from 1872 to 2018

数据集包含以下信息:

date - 比赛日期

home_team - 主队

away_team - 客队

home_score - 主队进球数 (不含点球)

away_score - 客队进球数 (不含点球)

tournament - 比赛的类型

city - 比赛所在城市

country - 比赛所在国家

neutral - 是否中立TRUE/FALSE

一、导入数据

从kaggle下载数据文件后用PBI导入,并筛选出世界杯比赛:

二、数据检查

2.1>查看PBI自动生成的代码,数据类型转换正确

2.2>过滤出世界杯正式比赛场次,总共847场,数据比较“干净”

简单浏览一下数据情况

三、数据统计

3.1>获胜场次统计

制作报表:

结果如下:


巴西、德国、意大利、阿根廷获胜场次名列4强

查看一下阿根廷的获胜场次情况:

3.2>进球数统计

分别统计出主、客进球,然后求和即可

客队也如法炮制,然后合并结果生成报表:




德国、巴西、阿根廷、意大利攻击力名列4强

3.3>参赛场次统计

与进球总数的统计方法相似,分别统计出主、客场次数然后合并相加,最后结果如下:

德国、巴西、意大利、阿根廷名列4强,其中墨西哥名列第8,也是世界杯常客

对本届32强XXX年以来的分析,采用同样的套路即可。


过滤一下时间即可

对于这种数量不大又很干净的数据,PowerBI做统计分析,其实比python+pandas更快捷!

你可能感兴趣的:(数据分析入门学习之三)