【数据处理与分析】电商订单数据计算

任务详情:

请根据系统提供的订单数据表,按要求完成以下三个任务:

传入一个字符串,返回订单总金额 (quantity * item_price) 最大或最小的商品,并返回商品的名称(item_name)

请根据以上要求,将函数 salesStr() 补充完整,函数的返回值为字符(str),比如:"Steak Burrito"

字段名 order_id quantity item_name choice_description item_price
中文含义 商品编号 数量 商品名称 描述 单价

 任务要求:

1. 传入一个字符串('max' 或 'min'),返回订单总金额最大或最小的商品的名称(item_name) ;

2. 传入的字符串不区分大小写,即传入值可能是"Max",也可能是"max";

3. 传入"max",返回订单总金额 (quantity * item_price) 最大的商品名称;传入“min”,返回订单总金额 (quantity * item_price) 最小的商品名称;

4. 返回字符串区分大小写,且保留字符串中间空格。

思路:

1.因为数据表中单价中含有特殊字符‘$’需要把数据取出进行切片处理,随后再存入DataFrame。

2.把商品的总金额进行计算生成一个新的columns['count']。

3.使用groupby()方法以商品名称对数据进行分组,把重复的商品数据整合到一起,随后再重置一下索引。

4.对新生成的DataFrame对象的['colunt'],使用Numpy中的argmax()/argmin()获取最大值和最小值的索引。

5.按照任务要求传入的字符串不区分大小写,我们判断时需把传进来的值转成小写或者大写进行比较。

6.最后通过loc[index,['columns']]获取商品的名称,并通过''.join 把商品名称转成字符串的形式return

代码如下:

import pandas as pd
import numpy as np

class Solution:
    def salesStr(self, condition: str) -> str:
        url ='http://72.itmc.org.cn:80/JS001/data/user/14053/80/fj_order_data.csv'
        df = pd.read_csv(url, sep = ',')
        list_price=[]
        for x in df['item_price']:
            list_price.append(float(x[1:]))
        df['item_price']=list_price
        df['count']=df['item_price']*df['quantity']
        df1=df.groupby('item_name').sum().reset_index()
        max_price=np.argmax(df1['count'])#最大值的索引
        min_price=np.argmin(df1['count'])#最小值的索引
        if condition.lower()=='max':
            max_=''.join(df1.loc[max_price,['item_name']].values)
            return max_
        elif condition.lower()=='min':
            min_=''.join(df1.loc[min_price,['item_name']].values)
            return min_
        return 0

以上仅代表个人的思路,如有欠缺请指教。

你可能感兴趣的:(Python【数据处理与分析】,python,pandas,numpy)