新冠疫情可视化

import pandas as pd
import matplotlib.pyplot as plt
import folium # 用来绘制地图,并在地图上打点,画圈,做颜色标记的工具类
import folium.plugins as plugins
import numpy as np
import datetime


# 导入数据
data=pd.read_csv(r'C:\Users\a\Desktop\2019ncov5600\2019_nCoV_data.csv')
data


# 查看数据信息
data.info()


# 数据清洗

# (1)删除无用列:Sno编号列没有用,要删去
data.drop(['Sno'],axis=1,inplace=True) # drop([]),默认情况下删除某一行;如果要删除某列,需要axis=1;参数inplace 默认情况下为False,表示保持原来的数据不变,True 则表示在原来的数据上改变


# (2)填充空白值:部分国家对应的地区为NAN,需要填充为空白字符串
data.fillna('',inplace=True)


# (3)删除无用行:部分国家/地区,受感染人数为0,也被列在表格中,需要删去
data.drop(data[data['Confirmed']==0].index.to_list(),axis=0,inplace=True)  # index() 函数用于从列表中找出某个值第一个匹配项的索引位置


# (4)查看受影响的国家/地区的数量
countries = data['Country'].unique().tolist()
print(countries)


# (5)中国有China, Mainland China两个写法,需要统一;另外还有一些你懂的问题需要修正
data['Country'].replace({'Mainland China':'China','Hong Kong':'China','Macau':'China','Singapore':'China','Taiwan':'China'},inplace=True)
countries=data['Country'].u

你可能感兴趣的:(Python)