美国人口数据分析

     #正常导包

   #读取csv格式的文件,把文件内容变成DataFrame格式

 

###

数据清洗

###

将两个DataFrame表融合在一起,生成新表,how=“outer”,表示连接方式。

DataFrame.merge(righthow='inner'on=Noneleft_on=Noneright_on=Noneleft_index=Falseright_index=Falsesort=Falsesuffixes=('_x''_y')copy=Trueindicator=Falsevalidate=None)

http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.merge.html#pandas.DataFrame.merge

DataFrame.drop(labels=Noneaxis=0index=Nonecolumns=Nonelevel=Noneinplace=Falseerrors='raise')

http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop.html#pandas.DataFrame.drop

删除DataFrame的一条数据,axis=0删除一行(默认),axis=1删除一列。inplace是否替换原表。

美国人口数据分析_第1张图片

.isnull()函数,list Series DataFrame都可以使用,判断数据中数据是否有NaN,数据只要是NaN就返回True。

http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.isnull.html#pandas.isnull

.any()函数  list Series DataFrame都可以使用,判断数据中数据是否有NaN,列数据只要有NaN,返回一个Series。

http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.core.groupby.GroupBy.any.html#pandas.core.groupby.GroupBy.any

美国人口数据分析_第2张图片

pop2[“state/region”]=="PR" 判断是否“state/region”里面是否有“PR” ,返回bool

.sum()函数 求和

http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.core.groupby.GroupBy.sum.html#pandas.core.groupby.GroupBy.sum

美国人口数据分析_第3张图片

.head()函数  不传参数默认显示前5行数据。传参数就显示参数行数据

http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.core.groupby.GroupBy.head.html#pandas.core.groupby.GroupBy.head

美国人口数据分析_第4张图片

.query() query查询语句

http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.query.html#pandas.DataFrame.query

.tolist()  Series  使用将所有数据放在列表里

http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Index.tolist.html#pandas.Index.tolist

美国人口数据分析_第5张图片

DataFrame.sort_values(byaxis=0ascending=Trueinplace=Falsekind='quicksort'na_position='last')

将数据排序

http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sort_values.html#pandas.DataFrame.sort_values

你可能感兴趣的:(美国人口数据分析)