Python 数据分析练习3:游戏充值数据分析

需求:加载数据,将某游戏公司后台财务记录中游戏、玩家姓名、玩家所在地区、玩家所在公司、玩家职业、充值金额和充值日期进行提取。将空值和充值金额小于0的异常值删除。查看公司从每个游戏获得的收入总数。查看公司每天从每个游戏获得的收入总数。将表中日期格式修改为"yyyy-MM-dd"。查看职业为学生的玩家最喜欢为哪个游戏充值。

TIPS:这个数据是我拿别的数据随便改的,不要当真

链接:https://pan.baidu.com/s/16WzYi5cc8A7X4CxM5G201w
提取码:hasc

Python 数据分析练习3:游戏充值数据分析_第1张图片

----------------------------------------------------

 ----------------------------------------------------

 ----------------------------------------------------

import pandas as pd
import calendar

df = pd.read_csv("games.csv")
df = df.loc[:, ["game_nm", "user_nm", "user_st", "user_employer", "user_occupation", "user_receipt_amt", "user_receipt_dt"]]
df = df[df.loc[:, "user_receipt_amt"] >= 0]
df.dropna()
user_receipt_amt = df.pivot_table(values="user_receipt_amt", index="game_nm", aggfunc="sum")
user_receipt_amt_per_day = df.pivot_table(values="user_receipt_amt", index=["user_receipt_dt", "game_nm"], aggfunc="sum")
t = 0
for i in df["user_receipt_dt"].values:
    l = list(i)
    l[3] = str(list(calendar.month_abbr).index(i[3:6].lower().capitalize()))
    del l[4]
    del l[4]
    i = ''.join(l)
    i = pd.datetime.strptime(i, '%d-%m-%y').strftime('%Y-%m-%d')
    df["user_receipt_dt"].values[t] = i
    t += 1
student = df[df.loc[:, "user_employer"] == "STUDENT"]
student _amt = df.pivot_table(values="user_receipt_amt", index="game_nm", aggfunc="sum")#["STUDENT"]

你可能感兴趣的:(Python,python,数据分析)