第三届泰迪杯技能赛赛后分享总结

第三届泰迪杯技能赛赛后分享总结

  今天泰迪杯官方公布了第三届泰迪杯技能赛的获奖情况,我的小组A题获得了二等奖,B题获得了一等奖。作为第一次参加这个比赛的小白,还是感到比较幸运的。下面就来复盘一下这次的比赛和分享一下做题经历。

对本次竞赛的一些看法

  通过这次的比赛,我感觉参赛方主要考察的是大家利用各种工具解决问题的能力,毕竟一道题目的时间限制为12个小时,大家不必把问题太过复杂化,感觉自己用Excel解决这个问题更顺手就用Excel,用python画图简单就用python,主要是能在规定时间内得到一个较好的答案,无论哪一步都可以做的比较简单,包括最后的提交报告,虽然是非常重要的一环,但是不用写的过于复杂,主要是表达清晰,可以看做是一个很简化的数学建模论文。
  泰迪杯技能赛分为A,B两道题目。因为竞赛的颁奖是按照报名人数的比例颁奖,所以建议参赛的同学也最好把两道题都做了,这样获奖概率会大很多。
  今年的A题难度明显要高于B题,我们组在做A题的时候也遇到了很多的困难,尤其是任务3需要用到一些特定的算法,由于种种原因,到晚上7点(8点截止)我们也没有得到一个比较好的结果,由于对时间的把控失误,最后剩给我们写报告和整理支撑材料的时间只剩下了40分钟。着急提交了论文之后觉得获奖无望,于是我们毅然决定在第二天继续做B题。最后很幸运两道题目均有获奖。

B题复盘

  由于当时做A题的时候草草结尾,时间过去一个多月,很多记忆和比赛资料也都丢失了,这里就只能给大家复盘一下B题。
  B题的背景是当下世界最关心的话题:新冠疫情。简单分析题目之后解题重点就尤为突出:处理数据、可视化
  当然这也正是这类比赛的考察重点。大多数这类比赛的前期数据处理都较为复杂,这次竞赛的A题也是如此,但是这次的B题不一样,队友利用pandas对数据进行清洗查看后,发现数据并无异常,唯有在“A 市涉疫场所”表中出现一行重复数据,猜测是因为在同一天的同一地点报告了两例病例,故 视为正常数据。因此,我们直接着手对数据进行分析和处理。任务1.1-1.3偏向于一个定解问题,利用python中的group by函数可以进行处理,其中任务1.3需要对该日住院人数进行定义,然后将问题的结果做成表格展示在报告中。
  任务1.4有一个需要注意的点在于:第六天具有传播性且未被收治的感染者,应为第七天和八天被通报的确诊者,第十天具有传播性且未被收治的感染者,应为第十一天和十二天被通报的确诊者。只要理解了这个点,剩下的就很简单了,把对应的确诊者的坐标找到,然后作图画出,这里作图还是尽量以简洁美观为要点。下面展示第十天疫情传播风险区域图:
第三届泰迪杯技能赛赛后分享总结_第1张图片
  到这里任务1就圆满解决了,大家可以看出任务1的解决是相对简单的,我认为任务1要点就是完成度要高,结果展示清晰,分析合理。
  对于任务2,这里就不得不提到竞赛方提供的一个可以用于可视化大屏制作的BI平台。我们小组的任务2就是在第一题处理的数据基础上,完全依赖于BI平台制作的可视化大屏。(竞赛方的意思是可以使用任何软件工具,但是他都已经提供了这么一个平台,我大胆猜测当然是用这个比较好)
  制作可视化大屏的基本框架是来源于赛前培训的汽车销售大屏。内容方面是参考丁香医生的表达内容。第三届泰迪杯技能赛赛后分享总结_第2张图片
第三届泰迪杯技能赛赛后分享总结_第3张图片
  相关的分析也就是完全照着可视化大屏的内容,有什么说什么。
  任务3就相对比较开放,需要对疫情发展阶段进行划分,为了对世界不同地区在不同阶段的标志参数的特点进行分析,我们定义了新冠疫情标志性参数:
第三届泰迪杯技能赛赛后分享总结_第4张图片
  后面的工作就是根据这些指标,进行数据的处理,数据的可视化,然后根据可视化结果进行简单分析。下面是在Jupyter Notebook 上做的图:
第三届泰迪杯技能赛赛后分享总结_第5张图片
第三届泰迪杯技能赛赛后分享总结_第6张图片

关于报告写作

  报告的写作一定是很重要的一点,因为无论你过程做的多好,评委也只能看到你提交的报告,所以真正决定你获奖高低的一定是最后报告中体现的内容。
  报告一定要从比赛一开始就着手去写,和数学建模比赛一样,可以有一个同学专门负责记录整理大家的思路和撰写报告,报告不需要太复杂,我认为报告一定是在能完整表达出自己的结果和内容的基础上,以清晰简洁为重。下面是我们组报告的目录:第三届泰迪杯技能赛赛后分享总结_第7张图片
  问题重述、任务假设、任务解决三点足矣表达清楚整个解题流程和思想。
  最重要的部分可能就在于数据可视化,俗话说一图胜千文,其实我们组的可视化部分也不是特别精美,还有很多值得改进的地方,大家在写报告的时候多多插入能表达结果或思考内容的表格、可视化图片或是流程图,对于整个报告的质量提升还是会有很大帮助的。

个人心得与题外话

  个人认为这个比赛有好的地方:某种程度上比数学建模的强度更大,因为要在12个小时内完成所有工作,但它的题目还是相对简单的,获奖比例也较高,相信各位无论是新手还是大佬,只要做好准备,和队友努力作战两天,应该还是可以获得好成绩,当然最主要的是可以得到锻炼。
  不好的地方也有:主办方提供的数据不一定符合常理;竞赛官网经常拉闸,连续三届比赛提交题目的时候官网都很卡,主办方也因此一再延长提交时间,大家要对突发情况多点耐心;提供的建模平台和BI平台bug也有很多,我们组的A题就是因为建模平台给搞砸了,但B题又因为BI平台而出彩,但无论怎样,如果想获奖,大家还是多多去学习一下赛前培训。
  不出意外的话,会有看到这篇文章的小伙伴会来找我要原始报告看看,其实我已经把报告中大部分展示的内容在B题复盘中展示了,而且这个竞赛的报告相对简单,大家还是要突出自己的元素。这里就提前狠心拒绝了。
  距离比赛结束也有一个月了,可能博客中有的地方表达不清晰或者有错误,欢迎指正。最后祝大家下次比赛取得理想成绩!

你可能感兴趣的:(泰迪杯,可视化,大数据)