python数据分析案例

对订单的数据类型进行封装

# data_define.py
# 对数据进行封装 ORM
class Record:
    def __init__(self, date, order_id, money, province):
        self.date = date
        self.order_id = order_id
        self.money = money
        self.province = province

    # 魔术方法,print Record对象时,将对象转换的规则
    def __str__(self):
        return f"{self.date}, {self.order_id}, {self.money}, {self.province}"

对文件读取的功能进行封装

本案例实现从csv格式文件和json格式文件读取出每行数据组织成Record对象,放入一个list并返回:

# file_define.py
import json

from data_define import Record

# 定义一个抽象类做顶层设计,确定有哪些功能需要实现
class FileReader:
    def read_data(self) -> list[Record]:
        '''
        读取文件数据,读到的每条数据都转换为 Record 对象
        然后将它们加入list返回即可
        '''
        pass

class TextFileReader(FileReader):
    def __init__(self, path):
        self.path = path

    # 复写父类方法
    def read_data(self) -> list[Record]:
        f = open(self.path, "r", encoding="UTF-8")

        record_list: list[Record] = []

        for line in f.readlines():
            line = line.strip()
            data_list = line.split(",")
            record = Record(data_list[0], data_list[1], int(data_list[2]), data_list[3])
            record_list.append(record)

        f.close()
        return record_list

class JsonFileReader(FileReader):
    def __init__(self, path):
        self.path = path

    # 复写父类方法
    def read_data(self) -> list[Record]:
        f = open(self.path, "r", encoding="UTF-8")

        record_list: list[Record] = []

        for line in f.readlines():
            data_dict = json.loads(line) # 反序列化
            record = Record(data_dict["date"], data_dict["order_id"], data_dict["money"], data_dict["province"])
            record_list.append(record)

        f.close()
        return record_list

# 测试代码,在作为包导入时不会执行
if __name__ == '__main__':
    text_file_reader = TextFileReader("./2011年1月销售数据.txt")
    json_file_reader = JsonFileReader("./2011年2月销售数据JSON.txt")
    list1 = text_file_reader.read_data()
    list2 = json_file_reader.read_data()

    for l in list1:
        print(l)

    for l in list2:
        print(l)

数据计算和绘图

读取销售数据计算出每日销售数据,并使用数据画出柱状图:

# main.py
"""
实现步骤
1. 设计一个类,完成数据封装
2. 设计抽象类,定义文件读取的相关功能,并用子类实现具体功能
3. 读取文件,产生数据对象
4. 进行数据需求的逻辑计算(计算每日销售额)
5. 通过PyEchars进行图形绘制
"""

from file_define import FileReader, TextFileReader, JsonFileReader
from data_define import Record
from pyecharts.charts import Bar
from pyecharts.options import *
from pyecharts.globals import ThemeType

text_file_reader = TextFileReader("./2011年1月销售数据.txt")
json_file_reader = JsonFileReader("./2011年2月销售数据JSON.txt")

jan_data: list[Record] = text_file_reader.read_data()
feb_data: list[Record] = json_file_reader.read_data()

# 将两个月份数据合并为到一个list中
all_data: list[Record] = jan_data + feb_data

# 计算每天的销售额
data_dict = {}
for record in all_data:
    # 已经存在某一天记录,就累加
    if record.date in data_dict.keys():
        data_dict[record.date] += record.money
    else:
        data_dict[record.date] = record.money

# 可视化图表开发
# 设置柱状图颜色
bar = Bar(init_opts=InitOpts(theme=ThemeType.LIGHT))

bar.add_xaxis(list(data_dict.keys()))
# 不在柱上显示y轴的数字
bar.add_yaxis("销售额", list(data_dict.values()), label_opts=LabelOpts(is_show=False))
bar.set_global_opts(
    title_opts=TitleOpts(title="每日销售额")
)

bar.render("每日销售额柱状图.html")

输出结果图

python数据分析案例_第1张图片

你可能感兴趣的:(python,python,数据分析)