案例分析：电商交易数据分析

案例分析练习：

电商交易数据分析

# 加载数据分析需要使用的库
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

一、首先明确分析的目标

1、加载数据文件，以id列为索引

使用read_csv方法加载csv数据文件，默认分隔符是逗号

# 加载数据，加载之前先用文本编辑器看下数据格式，首行是什么，分隔符是什么的
df = pd.read_csv('order_info_2016.csv',index_col='id')

2、查看下数据文件头部信息

df.head()

3、使用describe和info方法看下数据的大概分布

# 加载好数据之后，第一步先分别使用describe和info方法看下数据的大概分布
# 这两个方法放到两个cell中
df.describe()

加载设备类型device_type

# 加载device_type
device_type = pd.read_csv('device_type.txt')
device_type

查看索引、数据类型和内存信息

df.info()

二、对数据进行清洗

1、首先要做一个数据的清洗，order_id在一个系统里是唯一值

# 先看下有没有重复值
# 注意：当我们对一列取size属性的时候，返回的是行数，如果对于dataframe使用size，返回的是行乘以列的结果，也就是总的元素数
df.orderId.unique().size

注意：当我们对一列取size属性的时候，返回的是行数，如果对于dataframe使用size，返回的是行乘以列的结果，也就是总的元素数

如果有重复值，我们一般最后处理，因为其他的列可能会影响到删除哪一条重复的记录，先处理其他的列。

2、userId我们只要从上面的describe和info看下值是不是在正常范围就行了

# 对于订单数据，一个用户有可能有多个订单，重复值是合理的
df.userId.unique().size

3、productId最小值是0，先来看下值为0的记录数量

# productId
# productId最小值是0，先来看下值为0的记录数量
df.productId[(df.productId == 0)].size

177条记录，数量不多，可能是因为商品的上架下架引起的，处理完其他值的时候我们再把这些删掉

3、cityId类似于userId，值都在正常范围，不需要处理

# cityId类似于userId，值都在正常范围，不需要处理
df.cityId.unique().size

4、price没有空值，且都大于0，注意单位是分，我们要把它变成元

# price没有空值，且都大于0，注意单位是分，我们把它变成元
df.price = df.price /100
df.price

5、payMoney有负值，我们下单不可能是负值，所以这里对于负值的记录要删除掉

# 展示负值的记录
df[df.payMoney < 0 ]

使用drop方法删除负值的记录

# 删除负值的记录
df.drop(index=df[df.payMoney < 0].index, inplace=True)

检查看下，是否删除成功

# 在看下，已经没有了
df[df.payMoney < 0].index

3. 将payMoney 列数据变成元为单位

# 变成元
df.payMoney = df.payMoney / 100
df.payMoney

6、channelId根据info的结果，有些null的数据，可能是端的bug等原因，在下单的时候没有传channelId字段。
数据量大的时候，删掉少量的null记录不会影响统计结果，这里我们直接删除

# 展示null记录
df[df.channelId.isnull()]

4. 使用drop方法删除空值的记录

# 删除
df.drop(index=df[df.channelId.isnull()].index, inplace=True)

检查看下是否删除成功

# 在查看
df[df.channelId.isnull()]

7、deviceType的取值可以看device_type.txt文件，没有问题，不需要处理。

8、使用 df.isnull() 我们观察到，createTime和payTime都没有null，不过我们是要统计2016年的数据，所以把非2016年的删掉； payTime类似，这里只按创建订单的时间算，就不做处理了

先把createTime和payTime转换成datetime格式

# 先把createTime和payTime转换成datetime格式
df.createTime = pd.to_datetime(df.createTime)
df.payTime = pd.to_datetime(df.payTime)
df.dtypes

引用处理datetime时间模块，并设置2016年的时间区域

import datetime
startTime = datetime.datetime(2016, 1, 1)
endTime = datetime.datetime(2016, 12, 31, 23,59, 59)
# 有16年之前的数据，需要删掉
df[df.createTime < startTime]

删除16年之前的数据

df.drop(index=df[df.createTime < startTime].index, inplace=True)

验证是否删除

df[df.createTime < startTime]

处理16年之后的数据

# 处理16年之后的数据
df[df.createTime > endTime]

看下支付时间有没有16年以前的，支付时间在16年之后的这里就不处理了

# 看下支付时间有没有16年以前的，支付时间在16年之后的这里就不处理了
df[df.payTime < startTime]

9、我们再把orderId重复的记录删掉

# 回过头来我们把orderId重复的记录删掉
df.orderId.unique().size

使用duplicated()找到重复记录并删除

# 删除orderId重复数据
df.drop(index=df[df.orderId.duplicated()].index, inplace=True)

检查下是否删除成功

# 查看下
df.orderId.unique().size

10、把productId为0的也删除掉

# 把productId为0的也删除掉
df.drop(df[df.productId==0].index, inplace=True)

检查下productId为0是否删除成功

# 查看下
df[df.productId==0]

至此，数据清洗完毕，开始分析了

三、分析与可视化

1、一般都是先看下数据的总体情况，比如：总订单数，总下单用户，总销售额，有流水的商品数

# 看下数据的总体情况
# 总订单数，总下单用户，总销售额，有流水的商品数
print(df.orderId.count())
print(df.userId.unique().size)
print(df.payMoney.sum()/100)
print(df.productId.unique().size)

分析数据可以从两方面开始考虑，一个是维度，一个是指标，维度可以看做x轴，指标可以看成是y轴，同一个维度可以分析多个指标，同一个维度也可以做降维升维。

2、按照商品的productId，先看下商品销量的前十和后十个

# 先看下商品销量的前十和后十个
productId_orderCount = df.groupby('productId').count()['orderId'].sort_values(ascending=False)
# 商品销量的前十个
productId_orderCount_head_10 = productId_orderCount.head(10)
fig = plt.figure(figsize = (20, 15),dpi=80)
f1 = fig.add_subplot(2, 2, 1)
f1.set_xlabel("商品ID", fontproperties="SimHei", size = 22)
f1.set_ylabel("销量(件)", fontproperties="SimHei", size = 22)
f1.set_title("2016年不同商品销量前10名", fontproperties="SimHei", size = 25)
f1.set_xticks(range(0, 10))
f1.set_xticklabels(productId_orderCount_head_10.index, size = 20)
f1.set_yticklabels(range(0, 351, 50), size = 20)
rects = f1.bar(range(0, len(productId_orderCount_head_10.index)), productId_orderCount_head_10.values, width = 0.5, color = "g")
for rect in rects:
    height = rect.get_height()
    f1.text(rect.get_x(), height+2, str(height), size = 15)
plt.grid(ls = "--", alpha = 0.5)

# 商品销量的后十个
productId_orderCount_tail_10 = productId_orderCount.tail(10)
fig = plt.figure(figsize = (20, 15),dpi=80)
f1 = fig.add_subplot(2, 2, 1)
f1.set_xlabel("商品ID", fontproperties="SimHei", size = 22)
f1.set_ylabel("销量(件)", fontproperties="SimHei", size = 22)
f1.set_title("2016年不同商品销量后10名", fontproperties="SimHei", size = 25)
f1.set_xticks(range(0, 10))
f1.set_xticklabels(productId_orderCount_tail_10.index, size = 20)
f1.set_yticklabels(range(0, 31, 5), size = 20)
rects = f1.bar(range(0, len(productId_orderCount_tail_10.index)), productId_orderCount_tail_10.values, width = 0.5, color = "g")
for rect in rects:
    height = rect.get_height()
    f1.text(rect.get_x(), height+0.1, str(height), size = 15)
plt.grid(ls = "--", alpha = 0.5)

3、使用sum聚合函数汇总统计下payMoney销售额前十和倒数前十的商品

# 看下销售额前十和倒数前十的商品
productId_turnover = df.groupby('productId').sum()['payMoney'].sort_values(ascending=False)
## 销售额前十
productId_turnover_head_10 = productId_turnover.head(10)
productId_turnover_head_max = round(productId_turnover_head_10.max())
# print(productId_turnover_head_10.index)
# print(productId_turnover_head_10.values)
fig = plt.figure(figsize = (20, 15))
f1 = fig.add_subplot(2, 2, 1)
f1.set_xlabel("商品ID", fontproperties="SimHei", size = 18)
f1.set_ylabel("销售额(元)", fontproperties="SimHei", size = 18)
f1.set_title("2016年不同商品销售额前10名", fontproperties="SimHei", size = 18)
f1.set_xticks(range(0, 10))
f1.set_xticklabels(productId_turnover_head_10.index, size = 18)
f1.set_yticklabels(range(0, productId_turnover_head_max, 50000), size = 18)
rects = f1.bar(range(0, len(productId_turnover_head_10.index)), productId_turnover_head_10.values, width = 0.5, color = "g")
for rect in rects:
    height = rect.get_height()
    f1.text(rect.get_x(), height+2, str(height), size = 15, rotation=15)
plt.grid(ls = "--", alpha = 0.5)

## 商品销售额后10名
productId_turnover_tail_10 = productId_turnover.tail(10)
productId_turnover_tail_max = round(productId_turnover_tail_10.max())
fig = plt.figure(figsize = (20, 15))
f1 = fig.add_subplot(2, 2, 1)
f1.set_xlabel("商品ID", fontproperties="SimHei", size = 18)
f1.set_ylabel("销售额(元)", fontproperties="SimHei", size = 18)
f1.set_title("2016年不同商品销售额后10名", fontproperties="SimHei", size = 18)
f1.set_xticks(range(0, 10))
f1.set_xticklabels(productId_turnover_head_10.index, size = 18)
f1.set_yticklabels(range(0, productId_turnover_tail_max, 5000), size = 18)
rects = f1.bar(range(0, len(productId_turnover_tail_10.index)), productId_turnover_tail_10.values, width = 0.5, color = "g")
for rect in rects:
    height = rect.get_height()
    f1.text(rect.get_x(), height+2, str(height), size = 15, rotation=15)
plt.grid(ls = "--", alpha = 0.5)

4、看下销量和销售额最后100个的交集，如果销量和销售额都不达标，这些商品需要看看是不是要优化或者下架

# 看下销量和销售额最后100个的交集，如果销量和销售额都不达标，这些商品需要看看是不是要优化或者下架
problem_productIds = productId_turnover.tail(100).index.intersection(productId_orderCount.tail(100).index)
problem_productIds

5、城市的分析可以和商品维度类似

看下城市的商品销量

# 城市的分析可以和商品维度类似
# 城市的商品销量
cityId_orderCount = df.groupby('cityId').count()['orderId'].sort_values(ascending=False)
cityId_orderCount

看下城市的商品销售额

# 城市的商品销售额
cityId_payMoney = df.groupby('cityId').count()['payMoney'].sort_values(ascending=False)
cityId_payMoney

6、对于价格price，可以看下所有商品价格的分布，这样可以知道什么价格的商品卖的最好

按照100的区间取分桶，价格是分，这里为了好看把他转成元

# 按照100的区间取分桶，价格是分，这里为了好看把他转成元
bins = np.arange(0, 25000, 100)
pd.cut(df.price, bins).value_counts()

直方图

觉得尺寸小的话可以先设置figsize，觉得后面的值没有必要展示，可以不用25000，改成10000

# 觉得尺寸小的话可以先设置figsize，觉得后面的值没有必要展示，可以不用25000，改成10000
plt.figure(figsize=(10, 8))
plt.hist(df['price'], bins)
plt.show()

很多价格区间没有商品，如果有竞争对手的数据，可以看看是否需要补商品填充对应的价格区间

# 很多价格区间没有商品，如果有竞争对手的数据，可以看看是否需要补商品填充对应的价格区间
price_cut_count = pd.cut(df.price, bins).value_counts()
zero_cut_result = (price_cut_count == 0)
zero_cut_result[zero_cut_result.values].index

自定义一个数组分区间，使用pd.cut() 方法按1000分桶再看下

# 按1000分桶再看下
bins = np.arange(0, 5001, 1000)
price_cut = pd.cut(df.price, bins).value_counts()
price_cut

饼图

看看1000分桶的时候5000以下的饼图

# 看看1000分桶的时候5000以下的饼图
plt.figure(figsize=(8,8), dpi=80)
m = plt.pie(x=price_cut.values, labels=price_cut.index, autopct='%d%%', shadow=True)
plt.show(m)

7、channelId的分析类似于productId，可以找出成交量最多的渠道，交易额最多的渠道等；渠道有时候是需要花钱买流量的，所以还需要根据渠道盈利情况和渠道成本进行综合比较。

同时也可以渠道和商品等多个维度综合分析，看看不同的渠道卖的最好的商品是否相同

1> 按一天中下单时间分布情况分析

# 按下单时间分布情况分析
df['orderHour'] = df.createTime.dt.hour
df['orderHour']

折线图

一天中下单时间情况分布

order_hour_count = df['orderHour'].value_counts().sort_index()
# print(order_hour_count)
plt.figure(figsize = (12, 8))
_xticks = list(order_hour_count.index)
_xticks.append(24)
_x = [i-0.5 for i in range(0, 25)]
plt.xticks(_x, _xticks, size = 15)
plt.yticks(range(0, 14001, 2000), [i for i in range(0, 14001, 2000)], size = 15)
plt.xlabel("时间段", size = 18, fontproperties="SimHei")
plt.ylabel("订单数(件)", size = 18, fontproperties="SimHei")
plt.title("2016年在每日不同时间段的总订单数", size = 20, fontproperties="SimHei")
colors = ["#1C86EE"] * 24
colors[13] = "r"
colors[20] = "r"
rects = plt.bar(range(0, 24), order_hour_count.values, width = 1, edgecolor = "#B8B8B8", color = colors)
for rect in rects:
    height = rect.get_height()
    plt.text(rect.get_x(), height+80, str(height), size = 10)
plt.grid(ls = "--", alpha = 0.4)
plt.show()

按小时的下单分布，可以按时间做推广
中午12，13，14点下单比较多，应该是午休的时候；
然后是晚上20点左右，晚上20点左右几乎是所有互联网产品的一个高峰，下单高峰要注意网站的稳定性、可用性

2> 按一周下单时间分布情况分析

# 
df['orderWeek'] = df.createTime.dt.dayofweek
df['orderWeek']

一周中下单时间情况分布

# 不同星期的订单数
order_week_groupby = df.groupby('orderWeek').count()['orderId']
order_week_groupby.index = [i for i in range(1, 8)]
# ---- 绘图 ----
plt.figure(figsize = (8, 8))
_xticks = ["星期一", "星期二", "星期三", "星期四", "星期五", "星期六", "星期日", ]
plt.xticks(order_week_groupby.index, _xticks, size = 15, fontproperties="SimHei")
plt.yticks(size = 15)
plt.xlabel("时间", size = 18, fontproperties="SimHei")
plt.ylabel("订单数", size = 18, fontproperties="SimHei")
plt.title("2016年在每周不同时间的总订单数", size = 20, fontproperties="SimHei")
rects = plt.bar(order_week_groupby.index, order_week_groupby.values, width = 0.4)
for rect in rects:
    height = rect.get_height()
    plt.text(rect.get_x()-0.1, height+200, str(height), size = 15)
plt.grid(ls = "--", alpha = 0.4)
plt.show()

按照星期来看，周末两天的下单数居多

3> 下单后多久支付

# 下单后多久支付
def get_seconds(x):
    return x.total_seconds()
df['payDelta'] = (df['payTime'] - df['createTime']).apply(get_seconds)

bins = [0, 50, 100, 1000, 50000, 100000]
pd.cut(df['payDelta'], bins).value_counts()

饼图看下，有重合的话可以改下bins

# 饼图展示
pd.cut(df.payDelta, bins).value_counts().plot(kind='pie', autopct='%d%%', shadow=True, figsize=(10,10))
plt.show()

绝大部分都在十几分钟之内支付，说明用户基本很少犹豫，购买的目的性很强

4> 月成交额

把创建订单的时间设置为索引

# 先把创建订单的时间设置为索引
df.set_index('createTime', inplace=True)
df.head()

每个月的总成交额的变化趋势

turnover = df.resample('M').sum()['payMoney']
turnover.plot()
plt.show()

每个月的总成交订单数的变化趋势

order_count = df.resample('M').count()['orderId']
order_count.plot()
plt.show()

总结：
本案例主要对电商交易数据进行了一些常见的分析，包括了商品ID、商品价格、设备类型、下单时间等多个维度。因为不是多年的数据，因此无法做同比分析，而且数据不是企业内部的全部数据，所以原数据并没有出现像加购转化漏斗、网站流量等电商数据分析中常见的指标。不过，从仅有的数据来看，分析的结果基本符合我们的生活习惯，例如手机购物占多数、午休和晚饭后的休闲时间达到购物高峰期等。

高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
40岁的java程序员，还有出路吗？ cesske java 开发语言
目录前言一、现状与挑战二、出路与机遇三、案例分析与启示四、结语前言40岁Java程序员的出路：挑战与机遇并存在科技日新月异的今天，IT行业始终保持着高速的发展态势，而Java作为其中的重要一员，其地位依然稳固且充满挑战。对于一位40岁的Java程序员而言，面对职业生涯的“中年危机”，是否还有出路？本文将从多个维度探讨这一问题，旨在为这一群体提供思考和启示。一、现状与挑战职场竞争加剧随着技术的不断发
深入理解AOP（面向切面编程）及其应用自身就是太阳 java 开发语言 spring
目录AOP的核心概念AOP的实现方式1.定义DAO接口和实现类2.定义通知类3.开启AOP注解驱动切入点表达式通配符的使用：AOP通知类型案例分析：测量业务层接口的执行效率结论概述：AOP（Aspect-OrientedProgramming，面向切面编程）是一种编程范式，主要用于将共性功能从具体的业务逻辑中分离出来，实现松耦合的代码设计。其作用是在不修改原始代码的情况下，对现有方法进行增强，广泛
架构师备考的一些思考（四） kiba518
前言对于数学，我们之前学的是对的，但不是真的，所以我们没有数学思维。对于计算机，我们学校教的是对的，但不是真的，所以仅仅从学校学习知识的应届毕业生，不论985,211，本科，专科都一样，都是一张白纸，啥也不会。案例分析案例分析是5选3，第一题必答。问题一的类型架构风格对比问题二的类型质量属性填写问题三的类型ER图分析问题类型四场景分析，此类型题比较多。案例分析主要是结合我们之前介绍的内容和自身的经
案例分析：如何用设计模式优化性能7 是小旭啊 fastapi
设计模式就是对常用开发技巧进行的总结，它使得程序员之间交流问题，有了更专业、便捷的方式。比如，我们在《02|理论分析：性能优化有章可循，谈谈常用的切入点》中提到，I/O模块使用的是装饰器模式，你就能很容易想到I/O模块的代码组织方式。事实上，大多数设计模式并不能增加程序的性能，它只是代码的一种组织方式。本课时，我们将一一举例讲解和性能相关的几个设计模式，包括代理模式、单例模式、享元模式、原型模式等
Rust：重塑编程世界的利器，对前端开发的深远影响大鱼前端前端
引言：在编程语言的海洋中，有一颗璀璨的明星正在冉冉升起——那就是Rust。它不仅在后端领域展现出强大的实力，更在前端领域带来了颠覆性的变革。本文将带你深入了解Rust的魅力，探讨其独特的优势，以及Rust如何影响前端开发，并通过案例分析展示Rust在前端应用的实力。一、Rust：编程语言的新星Rust，这门由Mozilla主导开发的系统编程语言，自诞生之初就以其独特的设计理念和出色的性能赢得了众多
旅游网站设计与实现：SpringBoot框架案例分析 2401_85763803 旅游 spring boot 后端
目录摘要2Abstract31.1课题开发的背景41.2课题研究的意义41.3研究内容5第二章系统开发关键技术62.1JSP技术介绍62.2JAVA简介62.3MyEclipse开发环境72.4Tomcat服务器72.5SpringBoot框架72.6MySQL数据库8第三章系统分析93.1系统可行性研究93.2性能分析103.3业务流程分析10第四章系统的总体设计134.1系统功能结构设计134
8.18下午学习心得（宋丽娟）无为_72a4
下午听了吴波老师《历史学科德育实践与案例分析》，收获如下：1.对于核心素养的理解更加透彻，唯物史观，时空定位，史料实证，历史解释，家国情怀它们个体以及整体之间的联系有一个深入了解！2.终于知道怎么完整做一份教学设计，包括教学分析（课标分析，内容分析（本课知识结构，本课单元地位，在知识体系中的地位，对于学生发展的作用））学情分析（分析学生的已学知识和基本状况）自我分析，资源分析，教学目标，教学重难点
“我是个人来疯”哈哈！笑看世界育儿说
Hello!大家好。欢迎大家来到笑看世界育儿说。很高兴与大家一起来学习。作为父母常常有这样的困惑，自己的孩子自己却不了解，不知道该如何教育。在这里每一篇文章都是理论、案例分析、评论和方法，让父母们比较容易地学习和运用。阳阳是个聪明活泼的小男孩，平时也挺乖巧，可一旦家里来了客人，就完全变成了一个“人来疯”。这不，阳阳爸爸调到一家新公司，第一次邀请新同事来家里做客，客厅变成了阳阳心情表演的“大舞台”：
多线程 03：知识补充，静态代理与 Lambda 表达式的相关介绍，及其在多线程方面的应用蟾宫曲 Java 多线程 java 开发语言多线程静态代理 Lambda intellij-idea
一、概述记录时间[2024-08-16]前置知识：Java基础篇；Java面向对象多线程01：Java多线程学习导航，线程简介，线程相关概念的整理多线程02：线程实现，创建线程的三种方式，通过多线程下载图片案例分析异同（Thread，Runnable，Callable）Java多线程学习主要模块包括：线程简介；线程实现；线程控制；线程状态；线程同步；线程通信问题；拓展高级主题。本文是针对多线程的相
KVM+GFS分布式存储系统构建 KVM 高可用 wkysdhr 分布式
一、案例分析本案例主要使用KVM及GlusterFS技术,结合起来从而实现KVM高可用。利用GlusterFs分布式复制卷，对KVM虚拟机文件进行分布存储和冗余。分布式复制卷主要用于需要冗余的情况下把一个文件存放在两个或两个以上的节点,当其中一个节点数据丢失或者损坏之后，KVM仍然能够通过卷组找到另一节点上存储的虚拟机文件，以保证虚拟机正常运行。当节点修复之后，GlusterFS会自动同步同一组卷
RESTful API：架构风格与实现指南啊取名真困难 restful 前端架构 web 安全
摘要在当今的Web开发领域，RESTfulAPI已成为构建可扩展、易于维护的应用程序的关键技术。本文详细介绍了RESTfulAPI的架构风格、设计原则、实现步骤，并结合实际代码示例和案例分析，探讨了RESTfulAPI在现代Web服务中的应用。此外，文章还讨论了RESTfulAPI开发中的挑战、最佳实践以及安全性问题，为开发人员提供了实用的指导。关键词RESTfulAPI,Web服务,设计原则,实
【DevOps工具链整合】Jenkins、GitLab、Docker、Kubernetes 爱技术的小伙子 devops jenkins gitlab
DevOps工具链整合：Jenkins、GitLab、Docker、Kubernetes目录引言DevOps简介工具介绍JenkinsGitLabDockerKubernetes工具链整合的意义DevOps工具链整合实践环境准备GitLab的CI/CD集成Jenkins的使用Docker容器化Kubernetes部署整合中的挑战及解决方案案例分析结论引言在现代软件开发中，DevOps已经成为提升开
[机缘参悟-222] - 系统的重构源于被动的痛苦、源于主动的精进、源于进化与演进（软件系统、思维方式、亲密关系、企业系统、商业价值链、中国社会、全球）文火冰糖的硅基工坊重构
目录前言：系统的重构源于被动的痛苦、源于主动的精进、源于进化与演进一、软件系统的重构1、重构的定义与目的2、重构的时机与方法3、重构的注意事项4、重构的案例分析二、大脑思维的重构1、大脑思维重构的定义2、大脑思维重构的方法3、大脑思维重构的挑战与前景三、认知的重构1、定义2、目的3、方法四、实例五、总结四、婚姻家庭的重构1、婚姻家庭重构的背景2、婚姻家庭重构的必要性3、婚姻家庭重构的方法4、婚姻家
黄丽红日精进503/506 做自己小太阳
手机What？微信用的比较少了但是自己浏览器看视频还是看了好久Why？从哔哩哔哩转为浏览器了How？控制，控制不住就卸载培训What？今日份上午基本废了把案例分析笔记做的差不多了错题本也整理的差不多接下来就是看执业医师书*spss操作Why系统学习才有意义接下来复习案例分析抓选择题和数据分析How？明日（spss*选择题）行5.21.操作技能学习2.样品监测案例分析3.环境卫生案例分析4.…5.S
性格教育（六）方明晟
偏执的人总是缺乏灵活，他们经常对自己的能力估计过高，不能用平常的心态接受问题，解决问题。这样的人，在家里无法与亲人和睦相处，在外地也不能喝同事、朋友很好地交往。如何教会孩子学会灵活案例分析：一天，吉吉妈妈带着吉吉去买象棋。等红绿灯时，黄灯亮着，绿灯还没亮，可是许多行人已经开始往前走了，吉吉便要拉着妈妈的手过马路。妈妈立刻拽住了他，并问：“吉吉，妈妈叫教你的背的过马路的口诀是什么？”吉吉很流利地说出
Tushare库：Python金融数据分析的利器 eqa11 python 金融数据分析
文章目录Tushare库：Python金融数据分析的利器一、引言二、Tushare库的安装与基础应用1、安装Tushare2、基础用法1.1导入Tushare库1.2获取数据三、深入应用：案例分析1、股票收益策略模拟1.1数据获取与处理1.2策略模拟四、总结Tushare库：Python金融数据分析的利器一、引言在金融数据分析领域，Python因其强大的数据处理能力和丰富的库函数而备受青睐。Tus
oracle 扩容undo,【案例】Oracle RAC数据库undo使用率较高的解决思路办法南门居士-杜锦刚 oracle 扩容undo
天萃荷净Oracle研究中心案例分析：运维DBA反映Oracle数据库undo使用较大，结合案例分析undo使用问题。本站文章除注明转载外，均为本站原创：转载自lovewife&lovelife—Roger的Oracle技术博客本文链接地址:aboutUndoTablespaceusedHigh今天有朋友在问关于undo使用很高的问题,这个问题其实很常见了,上次也正好处理过一起,客户的3节点rac
经验笔记：NoSQL数据库及其缓存方法实践漆黑的莫莫数据库笔记 nosql 缓存
NoSQL数据库及其缓存方法实践经验笔记随着大数据时代的到来，传统的关系型数据库在处理大规模数据时面临诸多挑战，如扩展性不足、性能瓶颈等问题。NoSQL数据库因其在可扩展性、灵活性和性能方面的优势，逐渐成为解决这些问题的有效方案之一。本文将探讨NoSQL数据库的基本概念，并分享NoSQL缓存方法的实践经验，特别关注Redis作为缓存的案例分析。一、NoSQL数据库简介NoSQL数据库是非关系型数据
GreatSQL执行Update失败案例分析 GreatSQL社区 GreatSQL MySQL
GreatSQL执行Update失败案例分析一问题概述业务反馈在应用核心库的用户基本信息表执行部分update命令失败，报错如下：updatexxx.xxx_staffbasicinfosetstaffidstatus='04’wherestaffidin(select*fromduyuanyu.tmp_d_xiaoyuan)>1265Datatruncatedforcolumn'NOTMODST
GreatSQL执行Update失败案例分析 GreatSQL社区 GreatSQL MySQL
GreatSQL执行Update失败案例分析一问题概述业务反馈在应用核心库的用户基本信息表执行部分update命令失败，报错如下：updatexxx.xxx_staffbasicinfosetstaffidstatus='04’wherestaffidin(select*fromduyuanyu.tmp_d_xiaoyuan)>1265Datatruncatedforcolumn'NOTMODST
能源交通行业ITSM案例分析报告采和精灵能源运维
一、项目背景能源交通行业作为国民经济的重要支柱之一，其信息化水平直接影响到整个社会的运作效率和发展速度。然而，长期以来，该行业内的信息中心普遍面临“重建设轻运维”的问题，即在基础设施建设上的投入远大于后续的运维管理。这种状况导致信息中心在支撑大量业务系统的过程中，出现了“人多事杂设备乱”的现象，信息化支撑力量薄弱，运维效率低下，严重影响了企业的正常运营和对外服务的质量。在这种背景下，建设一个高效、
【python】python代码打包工具cx_Freeze的介绍、原理、用法及实战案例分析景天科技苑 python轻松入门基础语法到高阶实战教学 python 开发语言 cx_Freeze python代码打包 python打包成exe
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，PyQt5和Tkinter桌面开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生K
2017年系统架构师案例分析试题一帅次 #系统架构师案例分析需求分析软件构建软件工程设计规范性能优化规格说明书系统架构
目录案例【题目】【问题1】(12分)【问题2】(13分)答案【问题1】答案【问题2】答案相关推荐案例阅读以下关于软件架构评估的叙述，在答题纸上回答问题1和问题2。【题目】某单位为了建设健全的公路桥梁养护管理档案，拟开发一套公路桥梁在线管理系统。在系统的需求分析与架构设计阶段，用户提出的需求、质量属性描述和架构特性如下：(a)系统用户分为高级管理员、数据管理员和数据维护员等三类；(b)系统应该具备完
设计模式-03 设计模式-依赖倒转原则案例分析 jxusthusiwen CPP 设计模式设计模式
设计模式-03设计模式-依赖倒转原则案例分析目录设计模式-02设计模式-依赖倒转原则案例分析1.定义2.内涵3.案例对比4.注意事项5.最佳实践6.总结1.定义依赖倒转原则（DependencyInversionPrinciple，简称DIP）高层级的模块不能依赖底层级模块的，两种层级的模块应该依赖抽象，抽象层不能依赖具体实现层，具体实现应该依赖抽象通俗来说，DIP意味着：客户端代码（高层模块）不
开发团队如何应对突发的技术故障与危机：策略与实践倔强的石头_ 热点时事突发危机应对
博客主页：倔强的石头的CSDN主页Gitee主页：倔强的石头的gitee主页⏩文章专栏：《热点时事》期待您的关注目录引言一、快速响应与问题定位策略1.建立紧急响应团队2.利用自动化监控工具3.快速定位问题源头4.案例分析：网易云音乐故障定位二、建立健全的应急预案和备份机制1.制定详细应急预案2.定期进行应急演练3.建立数据备份和快速恢复机制4.技术架构优化与冗余设计结语引言在数字化浪潮汹涌的今天，
基于人工智能的智能客服系统嵌入式详谈人工智能
目录引言项目背景客服系统的现状与挑战AI在客服领域的应用前景系统设计系统架构模块划分关键技术与实现自然语言处理（NLP）对话管理语音识别与合成情感分析数据准备与训练数据收集数据预处理模型训练系统集成与部署前端接口设计后端服务实现系统集成部署方案测试与优化系统测试性能优化用户反馈与迭代应用场景与案例分析电子商务客服银行与金融服务医疗健康咨询常见问题及解决方案常见问题解决方案未来发展与展望结论1.引言
C# 爬虫技术：京东视频内容抓取的实战案例分析小白学大数据 python c#爬虫开发语言 python
摘要随着互联网技术的飞速发展，数据的获取和分析变得愈发重要。爬虫技术作为数据获取的重要手段之一，广泛应用于各个领域。本文将重点探讨C#语言在京东视频抓取中的实现过程，分析其技术细节，并提供相应的代码实现。引言京东作为中国领先的电商平台，拥有海量的商品信息和用户数据。通过爬虫技术，我们可以从京东网站抓取视频数据，用于市场分析、用户行为研究等。C#作为一种强大的编程语言，提供了丰富的网络编程接口，非常
医药医疗行业数字化转型数据架构设计方法论及典型案例数字化建设方案数字化转型数据治理主数据数据仓库大数据人工智能数据挖掘数据库架构
医药医疗行业数字化转型数据架构设计方法论及典型案例医药医疗行业数字化转型数据架构设计方法论及典型案例数字化转型背景与趋势医药行业现状及挑战数字化转型必要性发展趋势与前景展望数据架构设计方法论数据架构概述及重要性设计原则与策略制定实施步骤与关键技术典型案例分析：某大型药企数据架构实践项目背景与目标设定数据架构规划与设计过程实施效果及经验总结面临的挑战与解决方案数据质量管理问题及对策数据安全防护策略部
五星朝斗：星盘案例分析，群星射手座，喀戎5 铁树开花耶
2023年2月6日喀戎西：似乎医学方面有此说法，难道占星也是如此？喀戎东：万事万物都是如此，方法不一而足，自己能搞明白就是实用的法则。基因科学发展到今天，我们都知道人类延续的是基因，个体有生老病死的过程，如果加速放大基因的进程，是否也是如此，而我们在地球上的每一个人，都是基因链条上的活体显示，死亡之后由新成员接替繁衍，基因就会一直存在，基因或许会变异，或许会稳定保持自身特征。喀戎西：科学和占星算是
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

案例分析： 电商交易数据分析

电商交易数据分析

你可能感兴趣的:(案例分析)

案例分析：电商交易数据分析