需求:加载数据,将某游戏公司后台财务记录中游戏、玩家姓名、玩家所在地区、玩家所在公司、玩家职业、充值金额和充值日期进行提取。将空值和充值金额小于0的异常值删除。查看公司从每个游戏获得的收入总数。查看公司每天从每个游戏获得的收入总数。将表中日期格式修改为"yyyy-MM-dd"。查看职业为学生的玩家最喜欢为哪个游戏充值。
TIPS:这个数据是我拿别的数据随便改的,不要当真
链接:https://pan.baidu.com/s/16WzYi5cc8A7X4CxM5G201w
提取码:hasc
----------------------------------------------------
----------------------------------------------------
----------------------------------------------------
import pandas as pd
import calendar
df = pd.read_csv("games.csv")
df = df.loc[:, ["game_nm", "user_nm", "user_st", "user_employer", "user_occupation", "user_receipt_amt", "user_receipt_dt"]]
df = df[df.loc[:, "user_receipt_amt"] >= 0]
df.dropna()
user_receipt_amt = df.pivot_table(values="user_receipt_amt", index="game_nm", aggfunc="sum")
user_receipt_amt_per_day = df.pivot_table(values="user_receipt_amt", index=["user_receipt_dt", "game_nm"], aggfunc="sum")
t = 0
for i in df["user_receipt_dt"].values:
l = list(i)
l[3] = str(list(calendar.month_abbr).index(i[3:6].lower().capitalize()))
del l[4]
del l[4]
i = ''.join(l)
i = pd.datetime.strptime(i, '%d-%m-%y').strftime('%Y-%m-%d')
df["user_receipt_dt"].values[t] = i
t += 1
student = df[df.loc[:, "user_employer"] == "STUDENT"]
student _amt = df.pivot_table(values="user_receipt_amt", index="game_nm", aggfunc="sum")#["STUDENT"]