python利用np.where()实现不同条件下的数据处理或者计算

numpy.where (condition[, x, y])用法
  • np.where(condition, x, y)

满足条件(condition),输出x,不满足输出y。

np.where([[True,False], [True,True]],    # 官网上的例子
             [[1,2], [3,4]],
             [[9,8], [7,6]])

array([[1, 8],
[3, 4]])

  • np.where(condition)

只有条件 (condition),没有x和y,则输出满足条件 (即非0) 元素的坐标 (等价于numpy.nonzero)。这里的坐标以tuple的形式给出,通常原数组有多少维,输出的tuple中就包含几个数组,分别对应符合条件元素的各维坐标。

np.where([[0, 1], [1, 0]])

(array([0, 1]), array([1, 0]))

栗子
#数据预处理
TFS_data_origin['Delivery_date'] = np.where((TFS_data_origin['Delivery_date']<TFS_data_origin['Date_of_submission'])|\
                                              (TFS_data_origin['Delivery_date']<TFS_data_origin['Adopted_date']),\
                                                  None, TFS_data_origin['Delivery_date'])
                                                             
#不同条件下计算
TFS_data_origin['Req_delivery_cycle'] = np.where(TFS_data_origin['standard_state'].map(lambda x:x=='已交付'),\
                                                 ((TFS_data_origin['Delivered_date'] - TFS_data_origin['Date_of_submission']).dt.days + 1),\
                                                 None)                                                  

你可能感兴趣的:(数据处理,解决Python相关的问题,python基础知识,dateframe,python,numpy)