pandas数据分析美国各区人口普查案例

需求:

导入文件,查看原始数据
将人口数据和各州简称数据进行合并
将合并的数据中重复的abbreviation列进行删除
查看存在缺失数据的列
找到有哪些state/region使得state的值为NaN,进行去重操作
为找到的这些state/region的state项补上正确的值,从而去除掉state这一列的所有NaN
合并各州面积数据areas
我们会发现area(sq.mi)这一列有缺失数据,找出是哪些行
去除含有缺失数据的行
找出2010年的全民人口数据
计算各州的人口密度
排序,并找出人口密度最高的五个州 df.sort_values()

  1. 导入文件,查看原始数据

import numpy as np
from pandas import DataFrame,Series
import pandas as pd
pandas数据分析美国各区人口普查案例_第1张图片

  1. 将人口数据和各州简称数据进行合并
    pandas数据分析美国各区人口普查案例_第2张图片

  2. 将合并的数据中重复的abbreviation列进行删除
    pandas数据分析美国各区人口普查案例_第3张图片

  3. 查看存在缺失数据的列
    pandas数据分析美国各区人口普查案例_第4张图片

  4. 找到有哪些state/region使得state的值为NaN,进行去重操作
    pandas数据分析美国各区人口普查案例_第5张图片

  5. 为找到的这些state/region的state项补上正确的值,从而去除掉state这一列的所有NaN
    pandas数据分析美国各区人口普查案例_第6张图片

  6. 合并各州面积数据areas
    pandas数据分析美国各区人口普查案例_第7张图片

  7. 我们会发现area(sq.mi)这一列有缺失数据,找出是哪些行

在这里插入图片描述
9. 去除含有缺失数据的行在这里插入图片描述

  1. 找出2010年的全民人口数据

在这里插入图片描述
11. 计算各州的人口密度
pandas数据分析美国各区人口普查案例_第8张图片
12. 排序,并找出人口密度最高的五个州 df.sort_values()

pandas数据分析美国各区人口普查案例_第9张图片

对应的代码获取看↓可获取,或者私❤我

你可能感兴趣的:(程序员,python,python,Pandas,数据分析,程序员,IT)