HuanXiang1235

商业数据分析实战（酒卷隆志/里洋平）——第六章案例 D—多元回归分析如何通过各种广告的组合获得更多的用户

投放广告最优化问题
到目前为止我们已经在互联网上投放了《黑猫拼图》游戏的广告。但是为了获得更多的用户，我们决定也在传统媒体上（电视、杂志）上投放广告。基于过去其他游戏广告的数据，我们希望能够获得效果最好的广告投放方式，那么我们应该怎么做呢？

文章目录

商业数据分析实战（酒卷隆志/里洋平）——第六章案例 D—多元回归分析如何通过各种广告的组合获得更多的用户

现状和预期

互联网广告和传统媒体广告
整理现状和预期

发现问题

多元回归模型的分析方法

数据的收集

探讨和收集分析所需的数据

数据分析

电视、杂志的广告费和新用户数的散点图
进行多元回归分析
对多元回归模型的详细探讨

解决对策
小结
注：

# 加载python所需模块
import pandas as pd
from scipy.stats import chi2_contingency
import pandasql
import numpy as np #之后需要用到
import seaborn as sns
import matplotlib as mpl #设置环境变量
import matplotlib.pyplot as plt #绘图专用
import statsmodels.api as sm 
from statsmodels.stats.outliers_influence import summary_table
from mpl_toolkits.mplot3d import Axes3D #绘制3D图
mpl.rcParams['font.sans-serif'] = ['FangSong']
mpl.rcParams['axes.unicode_minus']=False

现状和预期

互联网广告和传统媒体广告

在互联网上投放广告，单价比较便宜，并且能够吸引到稳定的新注册用户。虽然互联网广告可以根据投入的成本预估效果，但相对于电视、杂志等传统媒体来说，它的受众数量是有限的，因此要想使用户达到一定数量，一般还是要在传统媒体上投放广告。然而，和互联网广告相比，传统媒体的广告成本要高得多。另外，如下图所示，根据广告投放媒体的属性不同，广告效果 CPI（Cost Per Install，获得一个新用户所需的成本）的变动也很大。

整理现状和预期

下面我们来整理一下现状和预期。首先，我们所面临的现状是广告效果 CPI 参差不齐。针对这种现状，在互联网广告方面，我们和 3 家公司保持着合作，而在传统媒体的电视和杂志上投放广告时，我们选择了一家广告公司进行合作。该广告公司建议我们，对于目前已合作的 10家左右的媒体，为了维持良好的合作关系，应避免连续 3 个月不投放广告的情况。根据这个建议，我们在各大传统媒体上都投放了广告。
　　这其中我们需要确定在电视和杂志上投放广告的合适比例（当然也可以让广告公司来替我们完成这项工作）。
　　总之，在本例中我们需要在已有合作关系的媒体中决定如何分配广告投放的比例，以达到“用较少的费用获得更多的用户”的目的。那么，基于现有的数据，我们需要弄清广告和获得用户数量之间的因果关系，并找出最合适的广告投放分配比例。下面我们先找出问题。

发现问题

根据下图所示的广告 CPI 的变化可知，本例中的问题是每月广告CPI 的波动较大。另一方面，互联网广告每获得一个用户的成本大约在100 日元。但是，互联网广告的覆盖范围比较有限，那些不怎么接触互联网的用户，平时可能只是偶尔使用一下 Facebook 或者 LINE，对于这些用户，可以借助电视或者杂志等传统媒体提高他们对产品的认知度。
　　然而，和互联网广告不同，电视和杂志属于间接型媒体，从某个用户通过电视广告了解某个产品并产生兴趣，一直到该用户尝试购买这个产品，中间存在着一定的时间间隔。可能是受此影响，电视或者杂志广告的 CPI 高达几千日元。例如，如下图所示，传统媒体广告的月平均CPI 在 2282 日元到 2774 日元之间波动。
　　如果仅仅是看数值，读者可能会觉得月平均 CPI 的差距并不大。但由于每获得一个用户的成本都很高，因此我们要尽可能地缩小这 500 日元的差距，如果可能的话，应尽量确保 CPI 保持在 2282 日元左右。我们将本例中的问题细化如下。
　　在传统媒体上的广告投放分配比例存在问题
　　→ 每月在电视和杂志上投放广告的比例有所不同
　　通过和广告部确认，我们了解到，虽然我们无法指定投放广告的电视或杂志媒体数量，但我们可以告诉广告公司分别投放在电视和杂志上的比率，因此
　　1. 基于过去的数据，明确在电视和杂志上投放广告的广告费和各自所获得的用户数之间的关系
　　2. 基于上述关系，确定以何种比例在电视和杂志上投放广告
　　至此，我们细化了问题，并确定了分析的步骤。那么，如何对电视和杂志的广告费与各自所获得的用户数之间的关系进行建模呢？

多元回归模型的分析方法

在前面的章节中，我们介绍了“交叉列表统计”“统计学假设检验”两种用于数据间关联性分析的方法。

原因	结果
大降价	销量大
派发的传单多	来店的顾客多
来店的顾客多	销售额大

如上表所述，通过明确各自的因果关系，可以判断诸如降价和销量之间是否存在关系。但是目前的分析仍然不能回答一些更具体的问题，例如“价格下降多少能够带来多大的销量增加”。在商业领域，通常的做法是在充分考虑成本的前提下预估一个结果，再采取相应的对策。也就是说，通常我们会先确定结果，再反过来考虑相应对策的成本。放在本次案例中，我们需要先构筑一个可以预估各广告媒体能带来的用户量的模型，再决定广告的投放方式。
　　此时就需要用到“回归分析 / 多元回归分析”。回归分析的思路非常简单，可以说是交叉列表统计的扩展。我们将数据描绘在图上，每个点表示一个数据，其中横坐标表示的变量称为自变量，纵坐标表示的变量称为因变量。然后我们在图上画出一条与这些数据点最为拟合的直线，根据这条直线上任何一点的横坐标（自变量）的值就可以得到纵坐标（因变量）的值，这就是线性回归分析。
　　例如，通过交叉列表统计，可以得知广告费花得越多，相应的新增用户就会越多。接下来我们就需要考虑能否对这种关系进行建模。具体来说，就是当我们知道了广告费用的预算之后，是否能够预估出由此可能带来的新用户数量。我们以下面左边的图为例来说明，图中的横轴表示广告费，纵轴表示新用户数。

如图所示，通过观察图中的所有数据，可以发现广告费和新用户数之间果然存在一定的关系。于是我们对此进行回归分析，并对这种关系建模，如右图所示。
　　图中的这条直线就是最简单的一种模型，该直线可以用下面的公式来表述。
　　新用户数 = β× 广告费 + α
　　回归分析就是根据现有的数据来估计 α 和 β 的值。根据从回归分析的结果得出的公式和各项指标，我们进行如下分析。
　　● 原因数据真的会对结果数据产生影响吗广告费（自变量）的变化真的会对新用户数（因变量）产生影响吗
　　● 如果确实有影响，那么这是一种怎样的关系呢

数据的收集

探讨和收集分析所需的数据

到目前为止，我们在互联网、电视和杂志 3 个广告媒体上开展了商业推广活动。使用过去实际的成果数据，我们就能够对各个广告媒体的效果进行分析。
　　在这 3 个广告媒体中，由于互联网广告的效果可以直接测定，因此哪个网站的广告有什么样的效果，其 CPI 很明确。然而，关于电视和杂志广告，我们只能获取总体的用户数增加了这类粗略的信息。因此，我们排除了互联网广告所带来的新用户，将剩余的新用户数和花费在电视以及杂志上的广告费作为分析用的数据。
　　经和市场部确认得知，这些数据一直都在用 Excel 管理，因此我们只需将必要的数据存入 CSV 文件，再将其读入到分析软件中即可。

《黑猫拼图》游戏在电视和杂志上投入的广告费和所获得的新用户数

data = pd.read_csv('../../data/ad_result.csv')
data = data.rename(columns={'month':'月份',
                           'tvcm':'电视广告费',
                           'magazine':'杂志广告费',
                           'install':'新用户数',})
data.head(10)

	月份	电视广告费	杂志广告费	新用户数
0	2013-01	6358	5955	53948
1	2013-02	8176	6069	57300
2	2013-03	6853	5862	52057
3	2013-04	5271	5247	44044
4	2013-05	6473	6365	54063
5	2013-06	7682	6555	58097
6	2013-07	5666	5546	47407
7	2013-08	6659	6066	53333
8	2013-09	6066	5646	49918
9	2013-10	10090	6545	59963

数据分析

首先，我们需要确认广告和新用户数之间是否存在关系。如果二者之间的关系不那么强，就不能断言用户数量的增加是由广告带来的。我们将数据之间的关系的强弱称为“相关性”。为了确认这种相关性，一般来说首先需要观察数据的散点图。

电视、杂志的广告费和新用户数的散点图

# pip install pyecharts   pip install pyecharts_snapshot
from pyecharts import options as opts
from pyecharts.charts import Scatter, Grid

scatter1 = (
    Scatter()
    .add_xaxis(data['电视广告费'])
    .add_yaxis("", data['新用户数'])
    .set_global_opts(title_opts=opts.TitleOpts(title="电视广告费和新用户数"),
                     toolbox_opts=opts.ToolboxOpts(orient='vertical',pos_left=0,pos_top='50%'),
                     xaxis_opts=opts.AxisOpts(
                         name='电视广告费', min_=5000, max_=10000),
                     yaxis_opts=opts.AxisOpts(
                         name='新用户数', min_=41000, max_=60000))
)
scatter2 = (
    Scatter()
    .add_xaxis(data['杂志广告费'])
    .add_yaxis("", data['新用户数'])
    .set_global_opts(title_opts=opts.TitleOpts(title="杂志广告费和新用户数",pos_right='5%'),
                     xaxis_opts=opts.AxisOpts(
                         name='杂志广告费', min_=5000, max_=7000),
                     yaxis_opts=opts.AxisOpts(
                         name='新用户数', min_=41000, max_=60000))
)
grid = (
    Grid(init_opts=opts.InitOpts(width='1300px', height='600px'))
    .add(scatter1, grid_opts=opts.GridOpts(pos_left="60%"))
    .add(scatter2, grid_opts=opts.GridOpts(pos_right="60%"))
)
grid.render_notebook()

无论是电视广告还是杂志广告，从散点图来看，随着投入的广告费用的增加，新获得的用户数也会增加，反应在图上就是数据点不断地向右上方延伸。既然明确了广告费和新用户数之间存在关系，下面我们就来着手进行回归分析。

进行多元回归分析

x = data.loc[:,['电视广告费','杂志广告费']]
y = data['新用户数']
x2 = sm.add_constant(x)
est = sm.OLS(y,x2)
est2 = est.fit()
est2.summary()

D:\programs\Anaconda3\envs\python3.6.5\lib\site-packages\scipy\stats\stats.py:1604: UserWarning: kurtosistest only valid for n>=20 ... continuing anyway, n=10
  "anyway, n=%i" % int(n))

OLS Regression Results
Dep. Variable:	新用户数	R-squared:	0.938
Model:	OLS	Adj. R-squared:	0.920
Method:	Least Squares	F-statistic:	52.86
Date:	Mon, 22 Jun 2020	Prob (F-statistic):	5.97e-05
Time:	22:31:50	Log-Likelihood:	-84.758
No. Observations:	10	AIC:	175.5
Df Residuals:	7	BIC:	176.4
Df Model:	2
Covariance Type:	nonrobust

	coef	std err	t	P>\|t\|	[0.025	0.975]
const	188.1743	7719.131	0.024	0.981	-1.81e+04	1.84e+04
电视广告费	1.3609	0.517	2.630	0.034	0.137	2.584
杂志广告费	7.2498	1.693	4.283	0.004	3.247	11.252

Omnibus:	0.992	Durbin-Watson:	0.881
Prob(Omnibus):	0.609	Jarque-Bera (JB):	0.795
Skew:	0.534	Prob(JB):	0.672
Kurtosis:	2.124	Cond. No.	1.63e+05

Warnings:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
[2] The condition number is large, 1.63e+05. This might indicate that there are
strong multicollinearity or other numerical problems.

● 多元回归模型的系数

params = pd.DataFrame(est2.params).rename(columns={0:'系数'})
params

	系数
const	188.174275
电视广告费	1.360921
杂志广告费	7.249809

根据上表的输出结果，我们可以得到下述关系。
　　新用户数 = 1.361 × 电视广告费 + 7.250 × 杂志广告费 + 188.174
　　从上式可以看出，如果不投放广告，则每月新增的用户数为大约188 人。如果在电视广告上投入 1 日元，就能够获得 1 名新用户。在杂志广告上投入 1 日元，则可获得 7 名新用户。也就是说，通过杂志广告来获得新用户的效率要远远高于电视广告。

对多元回归模型的详细探讨

对于上面的模型公式，我们再做进一步探讨。

① 残差的分布

#获取各个y值的残差
data_dict = {}
yt, data1, ss2 = summary_table(est2, alpha=0.05) # 置信水平alpha=5%，st数据汇总，data1数据详情，ss2数据列名
Residual = data1[:,8]
data_dict['最小值'] = np.min(Residual)
data_dict['第 1 四分位数'] = np.quantile(Residual,0.25)
data_dict['中值'] = np.quantile(Residual,0.5)
data_dict['第 3 四分位数'] = np.quantile(Residual,0.75)
data_dict['最大值'] = np.max(Residual)
data_dict = pd.DataFrame([data_dict])
data_dict

	最小值	第 1 四分位数	中值	第 3 四分位数	最大值
0	-1406.871108	-984.488813	-12.109952	432.818096	1985.841421

残差（预测值和实际值之差）的分布用四分位数的方式来表示，据此可以判断数据是否存在异常偏差。

② 多元回归模型的系数


df = pd.DataFrame({'预估值':est2.params
                  ,'标准误差': est2.tvalues
                  ,'t值': est2.pvalues
                  ,'p值': est2.bse}
                 )

df

	预估值	标准误差	t值	p值
const	188.174275	0.024378	0.981232	7719.130841
电视广告费	1.360921	2.630156	0.033905	0.517430
杂志广告费	7.249809	4.283126	0.003641	1.692644

上表总结了预估得到的常数项和斜率等数据。每一行的数据分别是预估值、标准误差、t 值、p 值，据此可以得知每个属性相应的斜率是多少，以及是否具有统计学意义。

③ 判定系数和自由度校正判定系数

判定系数：0.938，自由度校正判定系数：0.92
　　判定系数越接近于 1，表示这个模型拟合得越好。
　　观察①中的残差分布，我们发现，第 1 四分位数的绝对值要大于第3 四分位数的绝对值，这说明某些数据点的分布存在偏差，但由于③中自由度校正判定系数的值较高，因此现在的广告投放策略应该是没有问题的。

解决对策

本例中我们围绕如下问题进行了分析。
　　1. 通过各种传统媒体广告所获得的新用户数不尽相同（事实）
　　2. 每月获得的新用户数与在电视和杂志上的广告投放比例相关（假设）
　　3. 把握电视广告费和杂志广告费各自与获得的新用户数之间的关系
　　4. 基于这种关系，确定一个最佳的广告分配比例
　　基于上述问题设定，我们使用多元回归分析推导出了传统媒体广告和新用户数之间的关系，如下所示。
　　新用户数 = 1.361× 电视广告费 + 7.250× 杂志广告费 + 188.174
　　从上式可以看出，相比于电视广告，杂志广告的效果要更好一些。即便采取只投放杂志广告而不投放电视广告的极端行为，效果也不会太差。但是上述公式毕竟只是基于本例中的数据计算得出的，对于超出本例数据范围的值则不适用。
　　另外，如前所述，为了维持和广告公司的合作关系，我们不会对任何一家广告媒体连续 3 个月不投放任何广告。
　　因此，这回我们将按照下述比例来分配广告费用。
　　电视广告：4200 万日元
　　杂志广告：7500 万日元
　　根据上面的计算公式，我们可以得到如下结果。
　　60279 人 = 1.361×（4200 万日元） + 7.250 ×（7500 万日元）+ 188.174
　　也就是说，我们预期可以获得大约 6 万的新用户。

小结

本章介绍了数据分析中的多元回归分析。
　　对于那些成本较高的问题，该方法可用于最优化其效益成本比。尤其在商业领域，大家一般都更关注成本较高的事情，哪怕只提升了少许的效果，对于整体来说也可能起到很大的作用。这种情况下最适合使用多元回归分析，该方法能够预测出每种策略应该占多大比重。
　　在事前能预测大部分结果，且在实施阶段需要耗费高成本的情况下，多元回归分析是不二的选择。

分析流程	第6章中数据分析的成本
现状和预期	低
发现问题	低
数据的收集和加工	低
数据分析	中
解决对策	低

注：

本文文字内容主要来源于书籍：《数据分析实战》 [日] 酒卷隆志里洋平/著肖峰/译
本文代码是自己手打的
本文github地址：https://github.com/qq1044645270/data_analysis

介绍6款密码暴力破解工具网安导师小李程序员网络安全编程 web安全网络安全 tcp/ip php python java
暴力破解就是通过不断穷举可能的密码，直至密码验证成功，暴力破解分为密码爆破和密码喷洒，密码爆破就是不断的去尝试不同的密码，密码喷洒就是通过已知密码不断去尝试账号。下面介绍6款常见的暴力破解工具。01hydraHydra（九头蛇）是THC组织开发的，是一款非常流行的密码破解工具，可以对多种服务的账号和密码进行爆破，包括Web登录、数据库、SSH、FTP等服务，支持Linux、Windows、Mac平
下一代防火墙 999感冒灵. 网络安全
一.防火墙是什么1.防火墙的定义：防火墙是一个位于内部网络与外部网络之间的安全系统（网络中不同区域之间），是按照一定的安全策略建立起来的硬件或软件系统，用于流量控制的系统（隔离），保护内部网络资源免受威胁（保护）。防火墙的主要用于防止黑客对安全区域网络的攻击，保护内部网络的安全运行。2.防火墙基本性质：①安全区域和接口：一台防火墙具有多个接口每个接口属于一个安全区域，每个区域具有唯一的名称，所以防
发起请求并处理响应：`XHR` 与 `axios` 使用指南来啦[特殊字符]~
又又又要长脑子呐~了解到通过发起HTTP请求并在不刷新页面的情况下更新页面内容是一种常见的需求。学习使用XMLHttpRequest或axios来实现，现在进行对比两者，比较项目使用时候的优缺点，文末使用表格进行对比学习1.使用XHR实现下面是一个使用XMLHttpRequest发起GET请求并处理服务器响应的示例：html体验AI代码助手代码解读复制代码//创建一个新的XMLHttpReques
2024年最全kali无线渗透之用wps加密模式可破解wpa模式的密码12_kali wps，网络安全开发究竟该如何学习 2401_84558314 程序员 wps web安全学习
一、网安学习成长路线图网安所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。二、网安视频合集观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。三、精品网安学习书籍当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔
《密码爆破漏洞详解》——黑客必修的入门操作( 建议收藏 ) 2401_84573531 2024年程序员学习 python
隔壁老张:“狗剩啊,隔壁xx村的王姐家的女娃好漂亮,我想盗她qq啊,你帮我把”狗剩:“我不会呀”村里大妈:“那个狗剩啊,盗个qq号都不会,他妈妈还好意思说他是学网络安全当黑客的”密码爆破漏洞详解密码爆破介绍密码爆破使用场景密码爆破利用思路防范密码爆破密码的复杂性密码加密登录逻辑验证码登录次数限制密码爆破介绍密码爆破又叫暴力猜解,简单来说就是将密码逐个尝试,直到找出真正的密码为止,本质上是利用了穷举
Kali系统MSF模块暴力破解MySQL弱口令漏洞
一、实验环境1.攻击方：攻击环境使用KALI系统（使用虚拟机搭建）的Metasploit模块，msfconsole是metasploit中的一个工具，它集成了很多漏洞的利用的脚本，并且使用起来很简单的网络安全工具。这里要特别强调：被攻击的环境必须开启mysql远程登陆服务,通常MySQL开启的端口号是3306，故而一般情况下要求被攻击的服务器开启了3306端口号。2.被攻击MySQL环境：Wind
计算机网络（网页显示过程，TCP三次握手，HTTP1.0，1.1，2.0，3.0，JWT cookie）老虎0627 计算机网络计算机网络 tcp/ip 网络协议
前言最近一直在看后端开发的面经，里面涉及到了好多计算机网络的知识，在这里以问题的形式写一个学习笔记（其中参考了:JavaGuide和小林coding这两个很好的学习网站）1.当键入网址后，到网页显示，其间发生了什么？（1）首先浏览器会解析URL。（如确定协议像Http或Https）（2）然后通过DNS服务器把域名解析为IP地址。（找到服务器啦）（3）接着TCP协议三次握手和服务器建立连接。（客户端
在C#中，可以不实例化一个类而直接调用其静态字段就是有点傻 C#c#
这是因为静态成员（staticmembers）属于类本身，而不是类的实例。这是静态成员的核心特性1.静态成员属于类，而非实例当用static关键字修饰字段、方法或属性时，这些成员会绑定到类级别，而不是实例级别。它们在类加载时（通常是在程序启动或首次访问时）由CLR（公共语言运行时）分配内存并初始化，与是否创建实例无关。2.为什么不需要实例化？内存分配：静态字段的内存空间在程序运行期间只有一份，所有
MySQL分布式ID冲突详解：场景、原因与解决方案码不停蹄的玄黓 mysql 分布式数据库 ID冲突
引言在分布式系统开发中，你是否遇到过这样的崩溃时刻？——明明每个数据库实例的自增ID都从1开始，插入数据时却提示“Duplicateentry‘100’forkey‘PRIMARY’”；或者分库分表后，不同库里的订单ID竟然重复，业务合并时直接报错……这些问题的核心，都是分布式ID冲突。今天咱们就来扒一扒MySQL分布式ID冲突的常见场景、底层原因，以及对应的解决方案，帮你彻底避开这些坑！一、为什
2025.7.6总结天真小巫职场记录职场和发展
第天，Morningpower1.四四呼吸，做了10分钟。2.感恩环节:有两周没去新励成上课了，感谢今天早上去上了«当众讲话»，遇到了不少老朋友，聊的还蛮开心滴，满足了我的社交需求。其次，在台上做了个小面试，之前找工作都不知道面试多少轮了，今日还是有些小紧张，估计是太久没来上课了。最后是觉得各位大佬的阅历真丰富。也让我更明确自身的一个职业发展路线:技术->市场/管理->创业。将自己变为专才再变为复
MongoDB Rust驱动代码架构深度解析倪俪珍Phineas
MongoDBRust驱动代码架构深度解析mongo-rust-driverTheofficialMongoDBRustDriver项目地址:https://gitcode.com/gh_mirrors/mo/mongo-rust-driver前言本文将对MongoDB官方Rust驱动(mongo-rust-driver)的核心架构进行深入解析，帮助开发者理解其设计哲学和实现细节。我们将从客户端构
如何在YashanDB中管理数据模型变更数据库
在现代企业中，数据模型的变更管理扮演着关键角色。无论是扩展现有业务，还是应对新的需求，业务模型的改变往往需要相应的数据模型更新。如何有效地管理这些变更，确保数据的完整性、一致性及应用的高可用性，成为了数据架构师和开发者必须面对的重要问题。本文将详细探讨在YashanDB中管理数据模型变更的策略和方法，旨在提升对YashanDB数据库技术的理解及应用能力。数据模型变更管理的关键要素版本控制与变更日志
如何在YashanDB数据库中使用JSON数据类型？数据库
随着海量结构化与半结构化数据的快速增长，关系型数据库面临性能瓶颈和数据一致性的挑战。JSON作为一种灵活的半结构化数据格式，在多领域数据交换和存储中广泛应用。YashanDB作为支持多种存储结构和高性能事务处理的数据库产品，提供了对JSON数据类型的支持，以满足现代复杂业务对半结构化数据处理的需求。本文旨在基于YashanDB体系架构及存储引擎特性，深入解析JSON数据类型的技术原理与实现方式，为
如何在YashanDB数据库中实现数据查询优化数据库
在现代信息技术环境中，数据量的快速增长使得数据库的性能优化成为重要课题。如何提升查询速度，降低资源消耗，成为了数据库管理人员和开发者必须面对的挑战。有效的数据查询优化不仅能提高响应时间，还能显著提升用户体验与系统效率。在YashanDB数据库中，优化数据查询需从多个技术角度进行综合考量与实际应用。利用索引技术优化查询索引是提升数据库查询性能的常用手段。在YashanDB中，主要支持BTree索引、
如何在YashanDB数据库中实现数据模型的简化数据库
在现代数据库技术领域，数据模型的复杂性经常导致性能瓶颈和维护困惑。随着数据规模的增长和业务诉求的增加，复杂的数据结构、冗余的存储和不必要的关联关系都会影响整体数据库的性能和可维护性。特别是在面对动态变化的业务需求时，灵活性和扩展性成为关键因素。YashanDB提供了一系列功能强大的工具和机制，能够有效简化数据模型，提升数据库性能，并增强数据操作的灵活性。本文章旨在为数据库开发者和架构师提供技术洞见
如何在YashanDB数据库中实现复杂事务管理数据库
在现代数据库管理系统中，事务管理是一项关键功能。复杂的事务管理可以确保多条SQL操作的原子性、一致性、隔离性和持久性（ACID特性），减少数据的不一致和错误。尤其在高并发场景中，事务管理的机制与实现至关重要。因此，构建高效的事务管理系统，对于提升数据库的性能及应用程序的可靠性具有深远影响。YashanDB的事务特性YashanDB数据库支持全面的事务管理功能，通过多版本并发控制（MVCC）、事务隔
深入解析BEM架构：架构级全局样式管理方案 neon1204 前端方案分析和实践架构前端 css webpack
深入解析BEM架构：架构级全局样式管理方案在前端开发领域，CSS架构一直是影响项目可维护性和可扩展性的关键因素。随着SPA应用的普及，传统CSS管理方式的缺陷在开发中暴露出明显的问题：样式冲突、选择器权重失控、命名污染等，从代码质量和开发效率角度出发可以借鉴一些优秀的案例。各种组件库（element、antd、vant…）使用多了能发现它们的样式就是采取的BEM（Block,Element,Mod
如何在YashanDB数据库中管理用户权限数据库
在数据库管理系统中，用户权限的管理是保障数据安全和系统稳定运行的关键环节。合理的权限控制能有效防止未经授权的访问和误操作，同时满足业务需求的灵活性。对于YashanDB数据库，充分理解其权限体系与管理机制，有助于构建安全、稳定且高效的数据库应用环境。本文将深入解析YashanDB中用户权限管理的技术原理、实现功能和最佳实践。YashanDB的用户与角色机制YashanDB管理权限的核心实体为“用户
如何在YashanDB数据库中进行高效的JSON数据存储数据库
随着业务对非结构化和半结构化数据存储需求的增加，JSON数据类型逐渐成为数据库支持的关键特性。然而，JSON数据的高效存储与访问面临性能瓶颈、一致性保障及空间利用率等挑战。YashanDB作为现代企业级数据库，需提供有效的机制解决上述难题，从而满足实时查询、高并发访问及数据一致性的需求。本文针对YashanDB数据库的体系架构、存储引擎及索引机制，深入分析如何实现高效的JSON数据存储与访问，旨在
如何在YashanDB数据库中高效处理海量数据数据库
在现代数据库技术中，海量数据的管理和处理成为了一个普遍存在的挑战。随着数据规模的不断扩大，性能瓶颈、数据一致性问题以及易用性需求等问题日益凸显。这些挑战促使企业寻求更为高效的解决方案，以支撑海量数据的存储、分析与挖掘。YashanDB作为一款专为处理海量数据而设计的数据库，凭借其高可扩展性、高并发性能和高可用性，提供了一系列技术手段以应对这些挑战。本文旨在探讨如何在YashanDB中高效地管理和处
如何有效管理YashanDB的访问控制数据库
引言在当今数字化的业务环境中，数据安全性和访问控制是数据库管理的核心问题。随着数据规模的不断扩大，以及对数据隐私和合规性的要求日益增强，如何有效管理数据库的访问权限已成为企业面临的重大挑战。YashanDB作为一个高性能的数据库管理系统，具备丰富的访问控制功能，但同时也带来了复杂的管理需求。本篇文章将深入探讨YashanDB的访问控制机制，包括用户管理、角色权限、身份认证及其他相关策略，旨在为数据
如何在YashanDB数据库中保持数据一致性与完整性数据库
在现代数据库管理系统中，确保数据的一致性与完整性是面临的主要挑战之一。这一挑战在高并发、高要求的数据操作场景中尤为突出。YashanDB作为一种高性能的分布式数据库，采用了多种技术手段以保持数据的一致性与完整性。本文将深入探讨YashanDB中实现数据一致性与完整性的核心技术原理，适用于对高并发和复杂事务有一定理解的数据库管理员（DBA）和开发人员。事务管理与ACID特性事务是数据库操作的基本单元
如何实现YashanDB中的数据冗余处理数据库
数据冗余是数据库管理中的一个重要话题，直接影响到数据的可用性与可靠性。在高并发场景下，数据冗余能够有效防止数据丢失，并提升系统的容灾能力。YashanDB作为一款高性能的数据库产品，通过灵活的结构和多种部署方式，实现了数据冗余处理。本文将详细探讨YashanDB中实现数据冗余处理的技术细节，为数据库管理员和开发人员提供理论支持和实践指导。YashanDB的数据冗余机制单机部署中的数据冗余在单机部署
如何确保YashanDB数据库的性能稳定？数据库
在当今数据量激增的背景下，数据库的性能稳定性成为企业技术架构成功的关键因素之一。数据库面临的挑战包括性能瓶颈、数据一致性问题及并发访问的影响。为了应对这些问题，YashanDB作为一种新兴的数据库管理系统，提供了先进的架构和功能，旨在为高性能和高可用性提供保障。本文将详细探讨确保YashanDB数据库性能稳定性的方法，旨在为数据库管理员、系统架构师及IT技术负责人提供实用建议，实现企业数据处理的高
如何设计基于YashanDB数据库的高效查询数据库
在当今数据驱动的业务环境中，提高数据库查询性能已经成为各类企业面临的重大挑战。随着数据量的快速增长，许多机构遭遇了性能瓶颈、数据一致性问题和查询响应延迟等一系列问题。在这样的背景下，优化数据库架构、提高查询效率迫在眉睫。本文将集中在YashanDB数据库的查询设计上，提供技术分析和操作指导，以帮助开发人员设计高效的查询策略，实现优越的性能。YashanDB的体系架构YashanDB支持多种部署形态
如何实现YashanDB数据库的负载均衡数据库
在现代应用中，数据库的性能直接影响整个系统的效率和用户体验。因此，数据库的负载均衡成为了设计和部署中不可忽视的重要环节。YashanDB是一个新兴的数据库系统，其支持多种架构和配置，适合不同的业务场景。通过合理实现YashanDB的负载均衡，可以有效提升系统的并发处理能力、降低响应时间及提高可用性。YashanDB的架构概述YashanDB支持多种部署模式，包括单机（主备）部署、分布式集群部署以及
Python多线程vs多进程：一场关于效率的“宫斗戏“，谁才是你的真命天子？
清晨的咖啡还冒着热气，你盯着监控面板上飙升的CPU使用率，键盘敲出的代码在"多线程"和"多进程"之间反复横跳——这可能是每个Python开发者都会经历的"效率抉择时刻"。当项目从"能跑就行"进化到"必须快跑"，多线程与多进程这对"欢喜冤家"就会跳出来，用各自的"十八般武艺"让你挑花眼。今天咱们就来扒开表象，从底层机制到实战案例，彻底搞懂这对CP的爱恨纠葛。一、GIL：多线程头顶的"紧箍咒"要聊多线
【mongodb】mongodb数据备份与恢复向往风的男子运维日常 DBA mongodb 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
c++求同构数 *Allen* c++算法数据结构
题目描述所谓同构数是指这样的数，即它出现在它的平方数的右端。例如，5的平方是25（即5×5=25），5是25右端的数，那么5就是同构数。又如，25的平方是625（即25×25=625），同理25也是同构数。找出通过键盘输入的两个正整数N和M（0usingnamespacestd;intn,m,t,s,a[100],b[100],sum,s1,s2,k;intmain(){cin>>n>>m;for
MySQL使用POINT类型+空间索引快速过滤区域
在MySQL中使用POINT类型和空间索引来快速过滤区域数据是一种非常有效的策略，尤其是在处理地理位置信息时。POINT类型是MySQL空间数据类型之一，用来表示二维空间中的点。通过使用空间索引（例如R-tree索引），可以显著提高查询性能，尤其是在处理大量地理数据时。1.创建空间表和空间索引首先，你需要有一个包含POINT类型字段的表，并为这个字段创建空间索引。下面是一个示例：CREATETAB
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

商业数据分析实战（酒卷隆志/里洋平）——第六章案例 D—多元回归分析 如何通过各种广告的组合获得更多的用户

商业数据分析实战（酒卷隆志/里洋平）——第六章案例 D—多元回归分析如何通过各种广告的组合获得更多的用户

文章目录

现状和预期

互联网广告和传统媒体广告

整理现状和预期

发现问题

多元回归模型的分析方法

数据的收集

探讨和收集分析所需的数据

数据分析

电视、杂志的广告费和新用户数的散点图

进行多元回归分析

对多元回归模型的详细探讨

解决对策

小结

注：

你可能感兴趣的:(商业数据分析实战（酒卷隆志/里洋平）——第六章案例 D—多元回归分析 如何通过各种广告的组合获得更多的用户)

商业数据分析实战（酒卷隆志/里洋平）——第六章案例 D—多元回归分析如何通过各种广告的组合获得更多的用户

你可能感兴趣的:(商业数据分析实战（酒卷隆志/里洋平）——第六章案例 D—多元回归分析如何通过各种广告的组合获得更多的用户)