fome pandas import read_csv
df = read_csv('filepath\\filename.csv')
result = df.price*df.num
df['sum'] = result
#对df文件的cost列分组进行操作
bins = [min(df.cost)-1, 20, 40, 60, 80, 100, max(df.cost)+1]
labels=['20一下', '20-40', '40-60', '60-80', '80-100', '100以上']
pandas.cut(df.cost, bins)pandas.cut(df.cost, bins, right=False)
pandas.cut(df.cost, bins, right=False, labels=labels)
日期转换
#字符型→日期型
date = to_datetime(dateString, format)
属性:%Y, %m, %d, %H, %M, %S
例如:
#原列名为“注册时间”
#原数据日期格式:2018/6/10
df_date = to_datetime(df.注册时间, format='%Y/%m/%d')
#转换结果:2018-06-10 00:00:00
日期格式化
#日期型→字符型
apply(lambda x:处理逻辑)
datetime.strftime(x, format)
例如:
#列名为“注册时间”的数据为:2018/6/10
#先进行日期转换
df_date = to_datetime(df.注册时间, format='%Y/%m/%d')