韩国新冠病例突破7000人,韩疾控中心公开数据解析

新冠肺炎在韩国一触即发,虽有不良组织屡屡做出违反抗疫秩序的事,但韩国官方始终很尽责,做出的决策都很关键果决,没有上演电影《流感》的剧情。

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第1张图片

前几日,韩国疾病预防控制中心(KCDC)在官网(http://www.cdc.go.kr)公开了全部确诊病例的相关信息,目前在 Github 和 Kaggle 上都同步了这些数据,都有人在维护和更新。最近在 Kaggle 的公开数据集中始终保持前三的热度。目前在公开数据集排行中,前两个都是有关新冠病毒的。

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第2张图片

KCDC 公开的数据包括三张表:

  1. 每日的病例数量更新:日期、累积检查人数、检查结果呈阴性人数、确诊人数(检查结果呈阳性人数)、出院人数、死亡人数,以及每天新增的检查、确诊人数等;

  2. 确诊病人的信息:病例ID、性别、出生年份、国籍、所在地、组织、感染原因、感染顺序、感染源病人的ID、与该病例接触过的人数、确诊日期、出院日期、死亡日期、目前状态;

  3. 每位病患的活动路线:病例ID、日期、省份、城市、去过的地方、经纬度;

作为一位数据工作者,坚信数据会说话,我从以下三个方面浅析一下这些数据:

  • 全韩的病例数量发展趋势

  • 病例的个人信息数据

  • 病例的地理活动信息


全韩的病例数量发展趋势

这部分数据覆盖了1月20日~3月5日期间的日更数据,累计确诊、出院及死亡人数趋势如下:

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第3张图片

韩国还处于疫情初期,经治疗后出院的人截止3月5日仅有108位。通过我国的疫情数据来看,从疫情爆发开始20天左右,治愈人数日渐增多,相信韩国的绿色折线也即将上扬了。

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第4张图片

韩国政府对病患的排查工作很积极,从2月19日左右开始,每天安排接受检查的日均人数达到了10000左右:

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第5张图片

正所谓 ”消除恐惧的最好办法就是面对恐惧“(手动滑稽),面对疫情掩耳盗铃是绝对不可以的。印象中的韩国始终是一个很愿意面对问题的国家,顺便推荐《寄生虫》,很好看。


病例的个人信息数据

个人信息这部分的缺失率较高,可能出于隐私考虑,只有国籍、确诊日期、目前状态三个字段的记录较全,其他字段的缺失率都达到了90%以上。如性别这一栏,仅有421人有记录,分布如下:

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第6张图片

从有性别记录的这部分人来看,女性偏多,但男性的死亡率却是女性死亡率的两倍多,这与我国疫情早期的情况也相近:

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第7张图片

从年龄分布上看,主要集中在25-65岁之间,在30-40岁和50-60岁年龄段出现了两个小波峰:

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第8张图片

以10岁为间隔对年龄进行分段,30岁以下的患者几乎未出现死亡病例,50岁以上人群的死亡率突增,具体如下:

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第9张图片

最主要的感染原因是与病毒携带者接触过,其次是居住或者去过大邱,排在第三的原因是去过武汉:

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第10张图片

今天新闻报道的46人被感染的公寓就位于大邱,其中大部分人属于新天地教会,也就是文章开头说的不良组织。

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第11张图片

排在第四名的感染原因 “去以色列朝圣” 也和这群人有关,韩国共39人赴以色列朝圣,截止目前已有31人确诊新冠肺炎,连累同机的空姐也有人被感染了。

这份数据中还有小部分病例被记录了被感染的顺序,过了疫情初期后人数暴增,后边的病例就没有这项信息了。前20个病例的感染顺序如下:

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第12张图片

最初的病情入侵开始于1月20~30日,期间有一位中国人和四位韩国人去往武汉又返回韩国,先后被确诊,这五人共接触过262人。第六例属于被二次传播者,被第三例病人感染。第12例是因为接触了来自日本的患者,后又接触了422人。疫情从1月末、2月初开始迅速传播。


病例的地理活动信息

关于地理活动信息的数据也非常少,仅有前20例患者的活动轨迹,总计102条数据。我用 folium 对这部分地理数据进行可视化,folium 是一个地图可视化神器,只要有纬度和经度值,就可以创建世界上任何位置的地图。这20例病患的地理活动轨迹如下:

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第13张图片

主要集中在韩国西北部首都近郊的省份 —— 京畿道:

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第14张图片

除了在医院隔离的病患,这20例病患的历史活动地点主要集中在机场、饭店、医院、火车站等,均是人流量比较大的地方:

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第15张图片


结语

今天又去温习了一下韩国拍的《流感》,虽然剧情比较夸张,但是还原了灾难来临时的很多典型时刻。感谢那些为了大多数人的人生而牺牲的少数人,以及所有不抛弃自己人民的政府。

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第16张图片

韩国新冠病例突破7000人,韩疾控中心公开数据解析_第17张图片


⬇️ 扫描下方二维码关注公众号【数据池塘】 ⬇️

回复【算法】,获取最全面的机器学习算法网络图:

你可能感兴趣的:(数据分析)