1.loc
2.iloc
loc与iloc的不同:列表切片:iloc不包含右侧,loc包含右侧。因为loc基于label,而iloc基于location
3.ix
ix不建议使用,因为当label是数值型时,使用loc的规则,当label是字符串型时,使用iloc规则
使用drop删除某个列时,未指定inplace=True,实际并未删除此列
而使用inplace=True才是真正的删除
ufo.set_index(‘Time’, inplace=True)和ufo = ufo.set_index(‘Time’)结果一样,但执行方式不同,后者会复制一遍,故运行速度慢。
drinks[‘continent’] = drinks.continent.astype(‘category’)
将string转化为int
再次查看内存使用空间:
发现比之前小了很多
drinks.country.cat.categories
先将某个series转换成category类型,然后使用drinks.country.cat.categories查看
编写代码并进行预测:
将结果保存到csv文件中:
bonus:将数据存储在磁盘上,.pkl是python中保存文件的一种方式:train.to_pickle()