使用astype实现dataframe字段类型转换

在有些情况下,我们需要在DataFrame类型的数据中通过切片获得我们所需要的数据,然后转换为我们所需要的类型。Dataframe数据类型的转换需要用到astype函数。

# encoding: utf-8
import pandas as pd

df = pd.DataFrame(pd.read_csv('film_log3.csv', sep=';',encoding='utf-8', names=[u'电影名称', u'上映时间', u'制作公司', u'导演', u'票房']))
df = df.drop_duplicates().dropna().reset_index().drop('index', axis=1)
df_1 = df[df[u'电影名称'] == u'《冲上云霄》']
df[u'票房'] = float(df[u'票房'].str.split(u')').str[1])
print df

笔者一开始想使用float()将dataframe转换为float类型,然后编译器报错了:

这里写图片描述

无法将这个系列转换为float类型?通过type(),发现该数据为Series数据类型,所以不能使用float()方法。

在老司机的指导下,我使用了astype函数进行数据类型转换:

……
df[u'票房'] = df[u'票房'].str.split(u')').str[1].astype(float)
print df

然后,就能成功转换并输出了。

这里写图片描述

你可能感兴趣的:(大数据和云计算)