『pandas』pandas查漏补缺

1、to_numeric

在转换数据类型时,会忽略 NaN ,而 astype 则在数据中存在 NaN 时报错,无法转换成功

2、用 cut 函数分箱

cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)

备注:x 为被切对象,是个一维的类数组结构,bins 参数可以是序列、整数或标量

当 bins 为整数时,它代表的意思是等宽的箱子个数

备注1:bins 的元素必须是唯一的

3、当使用 *_index 作为连接键时,连接后的 df 的索引可能会是乱序的

4、df.join([list1, list2, ..., listn])

该方法可以将多个 df 合并

5、concat 函数

『pandas』pandas查漏补缺_第1张图片

备注:

①concat 函数既可以合并 Series 也可以合并 df 

②默认纵向连接

6、np.where 方法可以用来用作两个 Series 间的数据的满足条件的替换, 如:

np.where(pd.isnull(a), b, a)

第一个参数:condition, 条件

第二个参数:既可以是二维数组也可以是一维的 Series

第三个参数:同第二个参数

该函数是当 b 在条件为 False 时,用 a 的值来填充


7、想要获取某个 datetime 格式的 Series 的年月日时,可以通过如下方法获得

print tmp1.dt.year
print tmp1.dt.month
print tmp1.dt.day



8、当 Series 的值中存在有空值 NaN 时,值的数据类型不能是整数,可以是浮点数、字符串








你可能感兴趣的:(Python学习)