高雅_GaoYa

如何写一份具有业务价值的分析报告

分享一篇对我很有启发的文章：只会环比下降3％的数据分析师还有救吗？
原作者信息如下：
作者简介
HeoiJin：立志透过数据看清世界的产品策划，专注爬虫、数据分析、产品策划领域。
万物皆营销 | 资本永不眠 | 数据恒真理
CSDN：https://me.csdn.net/weixin_40679090

一、前言

数据分析师们经常会收到“我这里有一份数据，你帮我分析分析呗”这类没有明确需求的任务，往往经过在我们一顿自认为是金牌讲师的操作之后，得到的反馈却是一个又一个的灵魂拷问：
- 这些我早知道了，你分析了些啥？
- 环比下降了3%，那所以呢，能不能给点有价值的结论？
- 你分析了一轮，我还是不知道下一步要怎么做？
其中的本质原因，就是我们只站在统计学的角度去分析，迷恋数值的游戏，而不是从业务的角色出发，通过数据解决业务问题。下面将用一个实战案例，与大家共同探讨如何撰写一份有业务价值的分析报告。

二、项目准备
- 语言：Python 3.7
- IDE ： Pycharm
- 库： Pandas、Numpy、matplotlib
- 分析框架：5w2h、增长率法
PS.
- 介于篇幅问题，本文着重讲解分析思路，代码仅展示核心知识点
- 完整代码和数据集请移步至文末链接或阅读原文
三、梳理数据，了解现状

3.1 数据字段梳理

本次样本数据集来自“天池”的婴儿用品信息，包含两个表trade（商品交易记录）和babyinfo（婴儿信息）
- trade表：29972行*7列
  - buy_mount （购买数量/销量）
  - user_id（用户id）
  - auction_id（购买行为编号）
  - cat1（商品所属的大类）
  - cat_id（cat1的子类，是更细分的类别）
  - property（商品属性）
  - day（购买时间）
- babyinfo表：945行*3列
  - user_id（用户id）
  - birthday（出生日期）
  - gender:性别（0 男孩，1 女孩，2性别不明）
3.2 指标梳理

这一步骤其实非常重要，梳理好指标的层级关系（结果指标、过程指标：串行/并行），我们才能知道哪些指标是面，哪些指标是点，才会有由面到点的深入分析。
- 结果指标：
  - 销量：buy_mount
- 维度：
  - 用户id：user_id（babyinfo.user_id=trade.user_id）
  - 购买时间：day（2012年7月2日-2015年2月5日）
  - 商品类别：（大类：cat1；小类：cat_id；商品属性：property）
  - 婴儿年龄：day（购买时间） - birthday（出生日期）
  - 性别：gender
注意：此数据集的分析文章，大都会以最基础的1-7岁对婴儿年龄划分为7个组别。但实际上，针对不同年龄段的婴儿，婴幼儿奶粉分为4个阶段：
- 1段：0-6个月（4-6月已可食用辅食）
- 2段：6-12个月（6月大：可食用糊状或泥状的食物；9月大：可食用有硬度食物）
- 3段：1-3岁
- 4段：3-7岁（已经符合入读公办幼儿园的年龄，此阶段奶类流质食物已经不是主流）
这里凸显出一个问题：数据分析师习惯性以统计学含义理解指标，而不是找指标背后的业务含义

3.3 数据清洗

销量数据的异常值是整一个分析当中影响最大的，数据录入错误或运营的刷单等行为，会让个别时间段的销量猛增，严重影响趋势的判断，因此先剔除销量中的异常值。

利用四分位和方差对销量数据情况进行了解，确定异常值范围。站在统计学的角度，把超过平均值3倍标准差的销量（即2.54+64*3=194.54罐）作为异常值是常规的做法，但站在业务的角度则不合理。

通过奶粉产品的净含量和各年龄段婴幼儿奶粉推荐食用量的估算，我们可以得到以下理论值数据：

（1段、2段食用量分别参考自美赞臣蓝臻婴儿配方奶粉 1段/2段，3段和4段的喂食频率改为每天1次，每次食用量依据为2段的单次用量）

从上表中可以看出，用量最大的4段全年龄段理论上最多食用110罐400g的奶粉，一次性购买194罐以上才算异常值明显不合理。另外翻查2014年婴幼儿奶粉相关调研报告，400g的奶粉产品均价在250元左右，一次性购买100罐400g奶粉需要2万5千元，对于任何家庭来说，都是不合理支出结构。

因此，衡量异常值，不能仅通过统计学意义，还需要结合业务的实际情况。

在没有内部业务数据支撑下，以行业报告作为补充对异常值进行划分。根据国双2018年本土婴幼儿奶粉电商消费研究的数据，在电商平台购买婴幼儿奶粉的消费者年均购买次数约为27次，“双十一”、“618”两个购物节是囤货高峰。

婴幼儿在0-1岁时，理论上一共需要81罐400g奶粉，假设用户除“双十一”、“618”外其他时间每次只购买1罐，那么两个购物节平均需要承担27罐奶粉，向上取整后，以单笔销量超过30罐奶粉作异常值处理。
```
df.drop(index=df[df['buy_mount']>30].index,inplace=True)

 
     
     
     
     
```
四、提出分析维度，确立标准

本次数据集，没有过程指标，结果指标只有销量一个。接下来的分析都将围绕销量情况如何，导致目前状况的原因是什么以及提升空间在什么地方进行分析。

通常我们会抛出这样的问题：现在的销量状况不好，要提高！！！~~（数据分析师日常用语）~~

在这个问题当中，有3个非常关键的词：现在、不好、高，分别对应了5w2h里面的when（需要分析的时间段），what（标准）以及How much（改进效果）

首先要确定的是经常会被混淆的名词/副词部分，即Who、Where、When部分。这里将时间范围锁定为2015年1月1日至2015年2月5日。

第二步就是要解决标准的问题。数据分析报告常常被批没屁用，缺乏标准是原罪。“环比下降3%”是日报和周报里面经常出现的废话之一（~~有被冒犯到，谢谢~~），但如果给3%加上一个标准或者业务含义，比如这周是双十一，但销量环比下降3%，就变成很严重的业务问题了。

因此，与利益相关人统一标准口径，对于数据分析至关重要，有了标准才能评判好坏优劣。在没有任何指标的情况下，可以采用趋势分析来确定指标，这里的标准定为当月同比增速必须高于上年同期同比增速或上年整体同比增速。
```
def YOY_2014(df):
    df=df.groupby(pd.Grouper(key='day',freq='Y')).sum()
    # .pct_change()常用于求同比增速度，默认向上一位找分母
    # 相似的api还有.diff(),可以用于求相邻两项的差值
    df['年同比增速']=df['buy_mount'].pct_change()
    print(df['buy_mount'])
    print(df['年同比增速'])

 
     
     
     
     
 
     
     
     
     
```
通过简单的计算，我们得知，2014年的同比增速为50.54%。那么这里可以把假定的问题翻译成具体的：2015年至今，销量同比增速低于目标的50.54%，需要将销量增速提至50.54%以上。

五、先找灰犀牛再寻黑天鹅

在准备这次分析的过程中，也研究了几份相同数据集不同分析角度的文章，其中一篇开头看到15年整体的销量断崖式下降后，在没有进一步锁定问题爆发的具体时间点的情况下，便假设是某个用户群体的复购下降而导致。结果分析一轮回到月的时间维度上，才发现是因为数据记录不全而导致的销量骤降，做了不少无用功。

多维度的分析，应该是一个金字塔式的分析路径：从一个维度的整体到局部，再引入另外一个维度的整体再到局部，而不是在多个维度间反复横跳。

初步规划的分析路径如下：
1. 观察各年度每月销量情况走势
2. 2015年1-2月的销量走势对比13年和14年，判断销量的好或差？
3. 如果销量差，问题出在什么地方
4. 如果销量差，还有多少缺口，有多少时间挽救，重要的挽救时间节点是什么时候？
5. 如果要冲销量，推广什么品类？
5.1 各年度销售情况

如果你按捺不住手中的ESP（Excel、SQL、Python）直奔2015年1-2月的数据，那么我只能说你只看到了第二层（~~老千层饼了~~）

观察上图，假设我们分析的目标时间段是e-f，两图的e-f都由15跌到13.5，但两种数据走势反映出的问题点是不一样的。左边是断崖式下降，要分析e-f之间出现了什么变化，而右边则是持续下降，只是e-f下降幅度较大，但关键的问题点在c-d-e。

因此先对整体数据的走势有了印象，才能更好地把握住问题的关键点，避免管中窥豹。

实现思路：
- 以购买日期为标准对数据进行分组聚合，并对时间进行降采样至月
- 分别提取每年各月的销售数据
```
# 分组聚合+降采样方法一：
df=df.groupby(pd.Grouper(key='day', freq='m')).sum()
# 分组聚合+降采样方法二：
df_1=df.groupby('day').sum().resample('m').sum()

 
     
     
     
     
```
观察数据可知，14年的销量走势与13年类似，并没有出现持续性下降的问题，因此可以把分析聚焦到各年度的1-2月数据进行分析。

除了15年2月销量由于数据不全而出现骤降外，2013年的2月也同样出现了环比骤降的情况，第一反应是春节导致的下降。翻查13年-15年的春节（初一到初七）时间如下：
- 2013年春节：2月9日-2月15日
- 2014年春节：1月30日-2月6日
- 2015年春节：2月19日-2月25日
可以得知，15年的春节时间与13年类似，都是完整分布在2月，可初步推出，15年2月的销量数据应该与13年类似。如果把15年2月的目标定为同比增长50%显然不尽合理，因此我们将时间线修改为春节前30天。

5.2 2015年春节前销量情况

调用往年春节前30日的销量情况，确认目前销量是否良好，并推测未来14日的走势如何，是否需要进一步准备推广计划。

实现思路：
- 以购买日期为标准对数据进行分组聚合，并对时间进行降采样至日
- 利用日期对数据进行分段切片
- 对分段数据进行求和并计算同比增速
```
def situation_2015_2(df):
    df=df.groupby(by=pd.Grouper(key=('day'),freq='D')).sum()['buy_mount']
    _y_2013=df['2013-1-10':'2013-2-15']
    _y_2014=df['2014-1-1':'2014-2-6']
    _y_2015=df['2015-1':'2015-2'][:-17:-1][::-1]
    df_1=pd.DataFrame(
        {
            '2013':_y_2013[:16].sum(),
            '2014':_y_2014[:16].sum(),
            '2015':_y_2015.sum(),
        }
    )
    df_1=pd.concat([df_1,df_1.pct_change(axis=1)])

 
     
     
     
     
```
由左图可以看到14年闰月初一到十五，同比增速为49.9%，而15年同时间段增速为43.2%，低于最低目标49.9%，销量状况不佳。

进一步计算2014年春节前30日的总销量为1057，同比增速57.06%，得到2015年春节前30日目标销量为1057*1.499=1584罐，而目前总销量为1080罐，还有504罐的缺口，平均每天36罐。

5.3 原因拆解

确定了现状及一级问题后，就要先着手分析问题的原因。但目前的问题是针对所有产品，人人都负责意味着没人负责，因此要进一步确认是那一条产品线出现问题。

观察可知，50008168大类（后称168大类）、50014815大类（后称815大类）都是销量在前茅但增长幅度都非常的低，是主要的问题点。而122650008大类（后称08大类）的增速接近目标值，且销量占比低，是次要的问题点。

这时候我们就可以拿着问题去跟这三条业务线相关负责人对线，把他们认为的原因作为新的假设，梳理成逻辑树的形式，再进行逐点通过分析数据验证，找到核心原因。这里的逻辑树采用营销中的两个经典模型：PEST和4P理论，但由于没有数据进一步支撑，不再进一步深挖原因。

5.4 推广计划分析

在真实的商业场景中，我们可以根据上一步中找到的核心原因，再基于ROI（投入产出比）去作进一步的资源调配。但在这个案例当中，并没有更多的数据进行支撑，不过我们可以基于上一年的的数据，对今年未来14天的走势做基本预测，发掘可能挽救销售量的机会。

5.4.1 确定推广时限

同样需要先了解整体销量走势，对比往年走势情况，才能预测出未来的销量走势会怎么样。

从往期销售曲线可以看到，接下来的销量会逐步下降，且年廿十开始，每日销量降至20以下。假设年廿四到年三十日均销量为15，那么接下来一周日均销量要达到57罐。因此，需要在接下来的一周之内，作出1-2轮的推广计划，年廿四或廿五作为保底冲刺节点。

5.4.2 确定资源分配

确定了推广计划的时间节点后，再考虑资源如何分配到不同的大类进行推广。这里需要分开不同产品来看销售曲线。

实现思路：
1. 对数据按大类和日期进行分类聚合
2. 通过时间戳进行切片获取相应时间段的数据
```
def marketing_plan_2015(df):
    df=df.groupby(by=[pd.Grouper(key=('day'),freq='D'),'cat1']).sum()['buy_mount']
    # .unstack()方法将复合索引的series转化为dataframe
    # 此方法也可以用于dataframe的行列转换
    df_2013=df.loc['2013-1-10':'2013-2-15'].unstack()
    df_2014=df.loc['2014-1-1':'2014-2-6'].unstack()
    df_2015=df.loc['2015-1-21':].unstack()

 
     
     
     
     
```
查看以日维度的销量数据，波动幅度会非常大，我们要知其然，更要知其所以然。因此要与相关业务部门确认上年同期的详细推广时间、内容、渠道等数据，才能准确地判断出，是自然增长还是推广带来的增长，从而给出更贴合实际的建议。
- **28大类：**2014年的数据当中，销量会有明显的波动周期，隔7-10天会出现一次陡增，需要对比推广计划，确定是活动推广周期还是自然增长。
  - 如果为自然增长，未来还会出现1-2次的陡增，单日销量估计在30左右。
  - 如果为活动推广所致，参考15年闰月初七至初九。在未来一周内进行一次同类推广活动，对数据监控后再作下一步推广计划
  - 作为今年销量最高的大类，可以选择其为推广计划中的核心产品
- 38大类：2013-2015销量数据都不是很稳定，但2015年有个别日期销量猛增，同样结合今年的推广计划，反推推广是否能够促进38大类的销量。如果有效，可尝试增加一定推广的期限。
- 168大类和815大类：根据过往数据，直到春节结束，销量会一直下降。参考过往这段时间是否有采取过推广计划。如果经过推广后依旧没有销量的增长，那么有富余资源的情况下再考虑推广这两类。
- 520大类：除了520大类在14年的年初六有大幅的增长外，其余时间两大类的销量都是非常的低，日均销量为个位数。520大类在15年的销量几乎没有，可以考虑参考14年的年初六进行一次小规模推广。
- 08大类：虽然看上去曲线很陡峭，但实际销量基本没超过个位数。结合过往推广计划进行判断，如果已经进行过推广，但销量依旧不乐观，则今年可以放弃08大类，不作推广。
六、汇报结果

每当作总结报告的时候，数分们都会焦头烂额地四处找模板来弥补建议空洞的窘境，核心的问题是仅站在统计学的角度去分析，就数论数，没有把业务含义和业务逻辑融入分析当中。只要分析过程中，进一步深挖数据的业务含义，总结与建议便是一件水到渠成的事，只需把分析过程的结论按一定逻辑框架展现出即可。
- 现状：春节前30日-16日共销售1080罐，同比增速为43.2%，略低于目标的50.54%，销售状况有待提高
- 问题：距离春节还有14天，有504罐的销量缺口，未来一周日均需要销售57罐，年廿四到年三十日均销量需15罐才能达到目标。
- 原因：168、815两个大类增速远低于目标值是核心原因，需要收集渠道等数据才能进一步定位更具体的原因
- 做法：
  1. 一周内做1-2论推广计划，年廿四或廿五作最后一波冲刺
  2. 28大类可作为主推产品
  3. 其次优先推广38大类、520大类
  4. 在资源有剩余的情况下，再考虑推广168大类、815大类及08大类
七、总结&反思

回顾整篇分析报告思路，有两点是突破结论只有环比下降3%的关键：
1. 数据分析不能局限于键盘内。一份有价值的分析报告是否具有价值，不是取决于ESP写得有多溜，而是取决于是否站在业务的角度去分析，以解决业务问题作为分析目标，以业务含义解读指标含义。ESP永远都只是工具。
2. 思维和方法论才是业务型数据分析师的立身之本。一开始抓住问题的关键，有清晰的分析思路，才能通过数据为每一步行动找到支撑，而不是仅通过描述现状后给出一个“要搞高"这类没有营养的建议。
希望这篇文章能够给到正在为分析报告发愁的小伙伴一点启发。如果各位小伙伴有什么想法或者建议，欢迎在评论区留言~我是HeoiJin，我们下次分享再会。

完整代码及相关数据集：https://github.com/heoijin/BAproject

参考资料：
1. 国双：2018年本土婴幼儿奶粉电商消费研究：http://www.199it.com/archives/788802.html
2. 实战案例：天猫电商数据分析应该怎么做？：https://mp.weixin.qq.com/s/oC45OqqitvdSkCeMuXTh_A
3. 电商婴儿用品数据分析(SQL)：https://zhuanlan.zhihu.com/p/65267687
4. 数据集来源：https://tianchi.aliyun.com/dataset/dataDetail?dataId=45

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
水平垂直居中的几种方法（总结） LJ小番茄 CSS_玄学语言 html javascript 前端 css css3
1.使用flexbox的justify-content和align-items.parent{display:flex;justify-content:center;/*水平居中*/align-items:center;/*垂直居中*/height:100vh;/*需要指定高度*/}2.使用grid的place-items:center.parent{display:grid;place-item
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
下载github patch到本地小米人er 我的博客 git patch
以下是几种从GitHub上下载以.patch结尾的补丁文件的方法：通过浏览器直接下载打开包含该.patch文件的GitHub仓库。在仓库的文件列表中找到对应的.patch文件。点击该文件，浏览器会显示文件的内容，在页面的右上角通常会有一个“Raw”按钮，点击它可以获取原始文件内容。然后在浏览器中使用快捷键（如Ctrl+S或者Command+S）将原始文件保存到本地，选择保存的文件名并确保后缀为.p
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
如果做到轻松在股市赚钱？只要坚持这三个原则。履霜之人
大A股里向来就有七亏二平一赚的说法，能赚钱的都是少数人。否则股市就成了慈善机构，人人都有钱赚，谁还要上班？所以说亏钱是正常的，或者说是应该的。那么那些赚钱的人又是如何做到的呢？普通人能不能找到捷径去分一杯羹呢？方法是有的，但要做到需要你有极高的自律。第一，控制仓位，散户最大的问题是追涨杀跌，只要涨起来，就把钱往股票上砸，然后被套，隔天跌的受不了，又一刀切，全部割肉。来来回回间，遍体鳞伤。所以散户首
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

如何写一份具有业务价值的分析报告

一、前言

二、项目准备

三、梳理数据，了解现状

3.1 数据字段梳理

3.2 指标梳理

3.3 数据清洗

四、提出分析维度，确立标准

五、先找灰犀牛 再寻黑天鹅

5.1 各年度销售情况

5.2 2015年春节前销量情况

5.3 原因拆解

5.4 推广计划分析

5.4.1 确定推广时限

5.4.2 确定资源分配

六、汇报结果

七、总结&反思

你可能感兴趣的:(分析方法,分析案例,python,数据分析)

五、先找灰犀牛再寻黑天鹅