python练习---菜品统计

1、统计最火的菜品是什么?而且这个最火的菜品总共出现了多少次? # # dishes_name 该列为菜品的名字 # 2、白饭/大碗—不算菜 # 3、删除全部为空的列 # 4、新的DF写入文件 imp

# encoding:utf-8
import pandas as pd
# 读文件
detail = pd.read_excel("meal_order_detail.xlsx")
print(detail.head(10))
print(detail.shape)

# 删除白饭/大碗----取出所有不是 白饭大碗的
mask = detail["dishes_name"] !="白饭/大碗"
detail = detail.loc[mask]

# 1、统计最火的菜品是什么?而且这个最火的菜品总共出现了多少次?
# a、 value_counts
# res = detail["dishes_name"].value_counts().reset_index()
# # res.columns =newcolumns
# # 修改特定的列索引
# res.rename(columns={"index":"菜品名称", "dishes_name":"次数"},
#            inplace=True)
# print(res.loc[0, "菜品名称"], res.loc[0, "次数"])

# b、describe()
res = detail["dishes_name"].describe()
print("最火菜品和次数")
print(res["top"], res["freq"])
print(res.top, res.freq)


# 2、删除全部为空的列
# count---统计某列非空值
# a、获取所有列名称
# b、遍历列名称,逐个调用count
# c、count==0, 保存空列
# d、删除
null_list=[]
for tmp in detail.columns:
    if detail[tmp].count()==0:
        null_list.append(tmp)
print("删除前", detail.shape)
detail.drop(labels=null_list, axis=1, inplace=True)
print("删除后", detail.shape)

print(detail["dishes_name"].describe())

# detail.to_excel("meal_order_detail_new.xlsx")

你可能感兴趣的:(python练习---菜品统计)