wzy0623

MADlib——基于SQL的数据挖掘解决方案（11）——回归之线性回归

一、回归方法简介

事物之间的关系可以抽象为变量之间的关系。变量之间的关系可以分为两类：一类叫确定关系，也叫函数关系，其特征是：一个变量随着其它变量的确定而确定。另一类关系叫相关关系，变量之间的关系很难用一种精确的方法表示出来。例如，通常人的年龄越大血压越高，但人的年龄和血压之间没有确定的数量关系，人的年龄与血压之间的关系就是相关关系。回归方法就是处理变量之间相关关系的一种数学方法。其解决问题的大致步骤如下;

收集一组包含因变量和自变量的数据；
选定因变量和自变量之间的模型，即一个数学式子，利用数据按照一定规则（如最小二乘）计算模型中的系数；
利用统计分析方法对不同的模型进行比较，找出效果最好的模型；
判断得到的模型是否适合于这组数据；
利用模型对因变量做出预测或解释。

回归在数据挖掘中是最为基础的方法，也是应用领域和应用场景最多的方法，只要是量化型问题，我们一般都会先尝试用回归方法俩研究会分析。下面给出回归的数学定义。

令D指包含N个观测的数据集。每个对应于第i个观测的属性集，又称解释变量（explanatoryvariable）或自变量，而对应于目标变量（targetvariable），或称因变量。回归任务的解释变量可以是离散的或连续的。

回归（regression）是一个任务，它学习一个把每个属性集x映射到一个输出y的目标函数（target function）f。回归的目标是找到一个可以以最小误差拟合输入数据的目标函数。回归任务的误差函数（error function）可以用绝对误差和或平方误差和表示：

二、一元线性回归

1. 最小二乘法

设Y是一个可观测的随机变量，它受到一个非随机变量因素x和随机误差ε影响。若Y与x有如下线性关系：

且ε的均值E(x)=0，方差，其中是固定的未知参数，称为回归系数（regression coefficient），Y称为因变量，x称为自变量，则称此Y与x之间的函数关系表达式为一元线性回归模型。利用最小二乘法可以得到回归模型参数的最小二乘估计，估计公式为：

其中，。

于是就可以建立经验模型：

2. 分析回归误差

某些数据可能包含x和y的测量误差。此外，可能存在一些混杂因素影响因变量y，但未包含在模型中。正因为如此，回归任务中的因变量y可能是非确定的，也就是说，即使提供相同属性集x，它也可能产生不同的值。

我们可以使用概率方法对这类情况建模，其中y被看作一个随机变量：

测量误差和模型误差都被一个随机误差ε所吸收。通常假定数据中的随机误差出现是独立的，并且服从某种概率分布。

例如，如果随机误差来自一个均值为0、方差为的正态分布，则

这表明最小化蕴含地假定随机误差来自一个正态分布。此外，可以证明最能最小化这类误差的常数模型是均值，即。

另一种典型的误差概率模型使用拉普拉斯分布：

这表明最小化绝对误差蕴含地假定随机误差服从拉普拉斯分布。这种情况下的最佳常量模型对应于，y的中位数。

误差平方和的定义公式为：

线性回归的目标就是找出参数(），它们最小化误差平方和SSE。

除SSE之外，我们还可以定义另外两种误差：

SST称为总平方和，而SSR称为回归平方和。在使用平均值估计因变量时，SST表示预测误差，而SSR代表回归模型的误差量。SST、SSE和SSR之间的关系为：SST = SSE + SSR。

3. 分析拟合的满意度

对于得到的回归方程形式，通常需要进行回归效果的评价，当有几种回归结果后，还通常需要加以比较以选出较好的方程，常用的准则有：

（1）决定系数，其数学定义为：

称为决定系数。显然<=1，大表示观测值与拟合值比较靠近，也就意味着从整体上看，n个点的散布离曲线较近。因此大的方程为好。

（2）剩余标准差s，其数学定义为：

s称为剩余标准差，可以将s看成是平均残差平方和的算术根，自然其值小的方程为好。其实上面两个准则所选方程总是一致的，因为s小必有残差平方和小，从而必定大。不过，这两个量从两个角度给出我们定量的概念。的大小给出了总体上拟合程度的好坏，s给出了观测点与回归曲线偏离的一个量值。所以，通常在实际问题中两者都求出，供使用者从不同角度去认识所拟合的曲线回归。

（3） F检验，其数学表达式为：

如果满足，则认为变量y与x有显著的线性关系。

三、多元线性回归

设Y是一个可观测的随机变量，它受到p（p>0）个非随机变量和随机误差ε的影响。若Y与有如下线性关系：

其中，是固定的未知参数，称为回归系数；ε是均值为0、方差为的随机变量；Y称为被解释变量；称为解释变量。此模型称为多元线性回归模型。

自变量是非随机的且可精确观测，随机误差ε代表其随机因素对因变量Y产生的影响。对于总体的n组观测值，应满足式：

其中，相互独立，且设，记

则模型可用矩阵形式表示为：

其中，Y称为观测向量；X称为设计矩阵；ω称为待估计向量；ε是不可观测的n维随机向量，它的分量相互独立，假定。

建立多元线性回归建模的基本步骤如下：

对问题进行分析，选择因变量与解释变量，作出因变量与各解释变量的散点图，初步设定线性回归模型的参数个数。
输入因变量与自变量的观测数据（y,X），计算参数的估计。
分析数据的异常点情况。
作显著性检验，若通过，则对模型作预测。
对模型进一步研究，如残差的正态性检验、残差的异方差检验、残差的自相关检验等。

四、MADlib的线性回归相关函数

1. 训练函数

（1）语法

linregr_train( source_table,  
               out_table,  
               dependent_varname,  
               independent_varname,  
               grouping_cols,  
               heteroskedasticity_option  
             )

（2）参数

参数名称	数据类型	描述
source_table	VARCHAR	包含训练数据的源表名。
out_table	VARCHAR	包含模型的输出表名。主输出表列和概要输出表列如表2、3所示。
dependent_varname	VARCHAR	训练数据中因变量列的名称。
independent_varname	VARCHAR	评估使用的自变量的表达式列表，一般显式地由包括一个常数1项的自变量列表提供。
grouping_cols（可选）	VARCHAR	缺省值为NULL。和SQL中的“GROUP BY”类似，是一个将输入数据集分成离散组的表达式，每个组运行一个回归。此值为NULL时，将不使用分组，并产生一个单一的结果模型。
heteroskedasticity_option（可选）	BOOLEAN	缺省值为FALSE。设置成TRUE时会计算并返回模型的异方差。

表1 linregr_train函数参数说明

列名	数据类型	描述
<...>	TEXT	当使用分组选项时，表示分组列。
coef	FLOAT8[]	回归系数向量。
r2	FLOAT8	模型确定的R平方系数。
std_err	FLOAT8[]	系数的标准方差向量。
t_stats	FLOAT8[]	系数的t-统计量向量。
p_values	FLOAT8[]	系数的P值向量。
odds_ratios	FLOAT8[]	比值比exp(ci)。
condition_no	FLOAT8	X*X矩阵的条件数。高条件数说明结果中的一些数值不稳定，产生的模型不可靠。这通常是由于底层设计矩阵中有相当多的共线性造成的，在这种情况下可能更适合使用其它回归技术（如弹性网络回归）。
bp_stats	FLOAT8	当设置了heteroskedacity参数时，表示异方差的Breush-Pagan统计。
bp_p_value	FLOAT8	当设置了heteroskedacity参数时，表示Breush-Pagan计算的P值。
num_rows_processed	INTEGER	每个分组中实际使用的行数。
num_missing_rows_skipped	INTEGER	训练时跳过的行数。如果自变量或因变量包含NULL值，则该行在每组计算时被跳过。

表2 linregr_train函数主输出表列说明

训练函数在产生输出表的同时，还会创建一个名为_summary的概要表，具有以下列：

列名	数据类型	描述
source_table	TEXT	源数据表名称。
out_table	TEXT	输出表名。
dependent_varname	TEXT	因变量名。
independent_varname	TEXT	自变量名。
num_rows_processed	INTEGER	用于计算的总行数。
num_missing_rows_skipped	INTEGER	由于空值跳过的总行数。

表3 linregr_train函数概要输出表列说明

2. 预测函数

（1）语法

linregr_predict(coef, col_ind)

（2）参数

coef：FLOAT8[]类型，回归系数向量。

col_ind：FLOAT8[]类型，包含自变量列名索引的数组。

五、线性回归示例

1. 一元线性回归

（1）问题提出

近10年来，某市社会商品零售总额与职工工资总额（单位：亿元）的数据见表4，请建立社会商品零售总额与职工工资总额数据的回归模型。

职工工资总额	23.8	27.6	31.6	32.4	33.7	34.9	43.2	52.8	63.8	73.4
商品零售总额	41.4	51.8	61.7	67.9	68.7	77.5	95.9	137.4	155.0	175.0

表4 商品零售总额与职工工资总额

该问题只有两个变量，是典型的一元回归问题，先要确定是否是线性的，当确定是线后就可以利用MADlib的线性回归函数建立它们之间的回归模型。从图1所示的数据散点图上看到，两个变量的数据的确接近一条线上，因此可以判断这些数据近似成线性关系。

图1 职工工资总额和商品零售总额关系趋势图

（2）调用训练函数建立模型

-- 建立表并添加数据  
drop table if exists t1;  
create table t1 (a float, b float);  
insert into t1 values  
(23.8,41.4),(27.6,51.8),(31.6,61.7),(32.4,67.9),(33.7,68.7),  
(34.9,77.5),(43.2,95.9),(52.8,137.4),(63.8,155.0),(73.4,175.0);  
  
-- 训练线性模型  
drop table if exists t1_linregr, t1_linregr_summary;  
select madlib.linregr_train( 't1',  
                             't1_linregr',  
                             'b',  
                             'array[1, a]'  
                           );  
  
-- 查看结果模型  
\x on  
select * from t1_linregr;

结果：

-[ RECORD 1 ]------------+-----------------------------------------------------------------------------
coef                     | {-23.5493464974992,2.79912144049615}
r2                       | 0.986778045431921
std_err                  | {5.10282699272296,0.114555208049907}
t_stats                  | {-4.61496079155387,24.4346938750851}
p_values                 | {0.0017214811063928,8.40137971469318e-09}
condition_no             | 127.169076670091
num_rows_processed       | 10
num_missing_rows_skipped | 0
variance_covariance      | {{26.038843317662,-0.54748720824343},{-0.54748720824343,0.0131228956913574}}

从结果看，r2的值接近于1，而p_values的值足够小，说明模型较好。

（3）利用预测函数估计残差

残差在数理统计中是指实际观察值与估计值（拟合值）之间的差。“残差”蕴含了有关模型基本假设的重要信息。如果回归模型正确的话，我们可以将残差看作误差的观测值。它应符合模型的假设条件，且具有误差的一些性质。利用残差所提供的信息，来考察模型假设的合理性及数据的可靠性称为残差分析。

\x off  
select a, b, predict, b - predict residual  
  from (select t1.*,  
               madlib.linregr_predict(m.coef,array[1, a]) as predict  
          from t1, t1_linregr m) t;

结果：

  a   |   b   |     predict      |      residual       
------+-------+------------------+---------------------
 23.8 |  41.4 | 43.0697437863091 |   -1.66974378630913
 27.6 |  51.8 | 53.7064052601945 |    -1.9064052601945
 31.6 |  61.7 | 64.9028910221791 |   -3.20289102217909
 32.4 |  67.9 |  67.142188174576 |      0.757811825424
 33.7 |  68.7 |  70.781046047221 |   -2.08104604722101
 34.9 |  77.5 | 74.1399917758164 |    3.36000822418363
 43.2 |  95.9 | 97.3726997319344 |   -1.47269973193441
 52.8 | 137.4 | 124.244265560697 |    13.1557344393026
 63.8 |   155 | 155.034601406155 | -0.0346014061550477
 73.4 |   175 | 181.906167234918 |   -6.90616723491809
(10 rows)

2. 多元线性回归

（1）问题提出

某科学基金会希望估计从事某研究的学者的年薪Y与他们的研究成果（论文、著作等）的质量指标X1、从事研究的时间X2、能成功获得资助的指标X3之间的关系，为此按一定的实验设计方法调查了24位研究学者，得到如表5所示的数据（i为学者序号），试建立Y与X1、X2、X3之间关系的数学模型，并得出有关结论和作统计分析。

I	1	2	3	4	5	6	7	8	9	10	11	12
Xi1	3.5	5.3	5.1	5.8	4.2	6.0	6.8	5.5	3.1	7.2	4.5	4.9
Xi2	9	20	18	33	31	13	25	30	5	47	25	11
Xi3	6.1	6.4	7.4	6.7	7.5	5.9	6.0	4.0	5.8	8.3	5.0	6.4
Yi	33.2	40.3	38.7	46.8	41.4	37.5	39.0	40.7	30.1	52.9	38.2	31.8
I	13	14	15	16	17	18	19	20	21	22	23	24
Xi1	8.0	6.5	6.6	3.7	6.2	7.0	4.0	4.5	5.9	5.6	4.8	3.9
Xi2	23	35	39	21	7	40	35	23	33	27	34	15
Xi3	7.6	7.0	5.0	4.4	5.5	7.0	6.0	3.5	4.9	4.3	8.0	5.8
Yi	43.3	44.1	42.5	33.6	34.2	48.0	38.0	35.9	40.4	36.8	45.2	35.1

表5 从事某研究的学者的相关指标数据

该问题是典型的多元回归问题，但能否应用多元回归，最好先通过数据可视化判断它们之间的变化趋势，如果近似满足线性关系，则可以利用线性回归方法对该问题进行回归。

（2）作出因变量Y与各自变量的样本散点图

作散点图的目的是观察因变量Y与各自变量间是否有比较好的线性关系，以便选择恰当的数学模型形式。图2分别为年薪Y与成果质量指标X1、研究工作时间X2、获得资助的指标X3之间的散点图。从图中可以看出这些点大致分布在一条直线旁边，因此有比较好的线性关系，可以采用线性回归。

图2 因变量Y与各自变量的样本散点图

（3）调用训练函数建立模型

-- 建立表并添加数据  
drop table if exists t1;  
create table t1 (x1 float, x2 float, x3 float, y float);  
insert into t1 values  
(3.5,9,6.1,33.2), (5.3,20,6.4,40.3), (5.1,18,7.4,38.7),  
(5.8,33,6.7,46.8), (4.2,31,7.5,41.4), (6.0,13,5.9,37.5),  
(6.8,25,6.0,39.0), (5.5,30,4.0,40.7), (3.1,5,5.8,30.1),  
(7.2,47,8.3,52.9), (4.5,25,5.0,38.2), (4.9,11,6.4,31.8),  
(8.0,23,7.6,43.3), (6.5,35,7.0,44.1), (6.6,39,5.0,42.5),  
(3.7,21,4.4,33.6), (6.2,7,5.5,34.2), (7.0,40,7.0,48),  
(4.0,35,6.0,38.0), (4.5,23,3.5,35.9), (5.9,33,4.9,40.4),  
(5.6,27,4.3,36.8), (4.8,34,8.0,45.2), (3.9,15,5.8,35.1);  
  
-- 训练线性模型  
drop table if exists t1_linregr, t1_linregr_summary;  
select madlib.linregr_train( 't1',  
                             't1_linregr',  
                             'y',  
                             'array[1, x1, x2, x3]'  
                           );  
  
-- 查看结果模型  
\x on  
select * from t1_linregr;

结果：

-[ RECORD 1 ]------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
coef                     | {17.4360844805194,1.11937123487486,0.321549680035209,1.33338805066807}
r2                       | 0.913094894036178
std_err                  | {2.01313917062048,0.323340769702551,0.0365410911568227,0.294934722021009}
t_stats                  | {8.66114212816461,3.46189327100506,8.79967373320137,4.52095989760436}
p_values                 | {3.34622308123056e-08,0.00246297144041073,2.59478249724937e-08,0.000208347220434948}
condition_no             | 162.923246160157
num_rows_processed       | 24
num_missing_rows_skipped | 0
variance_covariance      | {{4.05272932028652,-0.308664994654568,0.0010662360168379,-0.382166636046883},{-0.308664994654568,0.104549253351838,-0.00506182989810972,-0.0207961107291977},{0.0010662360168379,-0.00506182989810972,0.00133525134293122,-0.00120729338355019},{-0.382166636046883,-0.0207961107291977,-0.00120729338355019,0.0869864902536095}}

从训练结果中看到，回归系数b=(17.4361,1.1194,0.3215,1.3334)，相关系数的平方r2=0.9131，t检验对应的概率p值很小。因此我们得到初步的回归方程为：

由结果对模型的判断：

对相关系数R的评价：本例R的绝对值为0.9556，表明线性相关性较强。
p值检验：p<0.05（预定显著水平），说明因变量y与自变量之间有显著的线性相关关系。

两种推断方法推断的结果一致，说明因变量与自变量之间存在较强的线性关系，线性回归模型可用。

（4）利用预测函数估计残差

\x off  
select x1, x2, x3, y, predict, y - predict residual   
  from (select t1.*,  
               madlib.linregr_predict(m.coef, array[1, x1, x2, x3]) as predict  
          from t1, t1_linregr m) t;

结果：

 x1  | x2 | x3  |  y   |     predict      |      residual       
-----+----+-----+------+------------------+---------------------
 3.5 |  9 | 6.1 | 33.2 | 32.3814980319735 |   0.818501968026474
 5.3 | 20 | 6.4 | 40.3 |  38.333429150336 |      1.966570849664
 5.1 | 18 | 7.4 | 38.7 | 38.7998435939587 | -0.0998435939586741
 5.8 | 33 | 6.7 | 46.8 | 43.4732770234316 |    3.32672297656843
 4.2 | 31 | 7.5 | 41.4 | 42.1058941280958 |  -0.705894128095842
   6 | 13 | 5.9 | 37.5 | 36.1994472291679 |     1.3005527708321
 6.8 | 25 |   6 |   39 | 41.0868791825571 |   -2.08687918255711
 5.5 | 30 |   4 | 40.7 | 38.5726688760597 |    2.12733112394031
 3.1 |  5 | 5.8 | 30.1 | 30.2475344026823 |  -0.147534402682325
 7.2 | 47 | 8.3 | 52.9 | 51.6755131538182 |    1.22448684618178
 4.5 | 25 |   5 | 38.2 | 37.1789372916769 |    1.02106270832314
 4.9 | 11 | 6.4 | 31.8 | 34.9917335360692 |   -3.19173353606917
   8 | 23 | 7.6 | 43.3 | 43.9204461854054 |  -0.620446185405434
 6.5 | 35 |   7 | 44.1 | 45.2999526631148 |   -1.19995266311481
 6.6 | 39 |   5 | 42.5 |  44.031312405407 |   -1.53131240540699
 3.7 | 21 | 4.4 | 33.6 | 34.1972087532353 |  -0.597208753235293
 6.2 |  7 | 5.5 | 34.2 | 33.9606681756644 |   0.239331824335615
   7 | 40 |   7 |   48 | 47.4673866807283 |   0.532613319271704
   4 | 35 |   6 |   38 | 41.1681365252596 |    -3.1681365252596
 4.5 | 23 | 3.5 | 35.9 | 34.5357558556043 |    1.36424414439566
 5.9 | 33 | 4.9 | 40.4 | 41.1851156557165 |  -0.785115655716531
 5.6 | 27 | 4.3 | 36.8 |  38.119973374642 |   -1.31997337464198
 4.8 | 34 |   8 | 45.2 | 44.4088599344604 |   0.791140065539594
 3.9 | 15 | 5.8 | 35.1 | 34.3585281909343 |   0.741471809065693
(24 rows)

你可能感兴趣的:(BI)

vue制作导航栏html,Vue实现导航栏菜单 DataQueen vue制作导航栏html
本文实例为大家分享了Vue实现导航栏菜单的具体代码，供大家参考，具体内容如下这里是刚学习vue的时候，没有用vue的任何UI组件库写的导航栏菜单。menu.html导航栏左项目名称您好，用户！v-bind:class="{checked:index==nowIndex}"v-on:click="setTab('menu',index,menus)">{{menu.text}}菜单一的内容菜单二的内
AScript自动化脚本游戏辅助系列教程 jinglong.zha 自动化脚本自动化运维 ascript 懒人精灵 easyclick python 游戏辅助开发
Python自动化脚本开发，AScript零基础从入门到精通，游戏脚本，自动化脚本，python核心与进阶实战教程AScript基础-python核心与进阶课程简介_哔哩哔哩_bilibiliAScript基础-python核心与进阶课程简介是Python自动化脚本开发，AScript零基础从入门到精通，游戏脚本，自动化脚本，python核心与进阶实战教程的第1集视频，该合集共计35集，视频收藏或
Java零基础入门笔记：(3)程序控制 Sherlock Ma Java Java入门 java 笔记开发语言程序人生学习方法改行学it 跳槽
前言本笔记是学习狂神的java教程，建议配合视频，学习体验更佳。【狂神说Java】Java零基础学习视频通俗易懂_哔哩哔哩_bilibiliScanner对象之前我们学的基本语法中我们并没有实现程序和人的交互，但是Java给我们提供了这样一个工具类，我们可以获取用户的输入。Scanner类是Java中的一个实用工具类，位于java.util包中，主要用于从用户输入、文件或其他输入源中读取数据。它提
Java零基础入门笔记：(4)方法 Sherlock Ma Java Java入门 java 笔记开发语言学习方法改行学it 跳槽程序人生
前言本笔记是学习狂神的java教程，建议配合视频，学习体验更佳。【狂神说Java】Java零基础学习视频通俗易懂_哔哩哔哩_bilibili第1-2章：Java零基础入门笔记：(1-2)入门（简介、基础知识）-CSDN博客第3章：Java零基础入门笔记：(3)程序控制-CSDN博客--方法何谓方法Java方法是语句的集合，它们在一起执行一个功能。方法是解决一类问题的步骤的有序组合方法包含于类或对象
Pytorch实现之利用特征分布的差异来指导GAN的训练这张生成的图像能检测吗优质GAN模型训练自己的数据集 GAN系列 pytorch 生成对抗网络人工智能神经网络深度学习计算机视觉机器学习
简介简介：FIDGAN通过将FID损失引入GAN的训练过程，显著提升了生成图像的质量。其核心思想是利用特征分布的差异来指导生成器的训练，同时通过使用轻量级的MobileNet-v3提高了计算效率。这种方法在图像生成任务中具有广泛的应用前景。论文题目：FIDGAN:AGenerativeAdversarialNetworkwithAnInceptionDistance（FIDGAN：具有初始距离的生
Wi-Fi 8（802.11bn）的超高可靠性特性介绍 WPG大大通 QUALCOMM产线大大通 wifi 无线网络自动化网络安全应用前景
Wi-Fi8，即IEEE802.11bn标准，是继Wi-Fi7之后的下一代无线网络技术。这项新技术的目标是提供超高可靠性(UltraHighReliability的无线网域连接，特别适用于对低延迟和高稳定性有严格要求的应用，如扩增实境/虚拟实境（AR/VR）、工业自动化和远端医疗手术等。Wi-Fi8的主要特点包括：1.提高吞吐量：使通过MAC数据服务测得的吞吐量提高25%。2.降低延迟：减少25%
Vulkan hanpfei Android 图形系统
Android7.0添加了对Vulkan的支持，一个高性能3D图形的低开销跨平台API。像OpenGLES一样，Vulkan提供了在应用中创建高质量，实时图形的工具。Vulkan的优势包括CPU开销降低及支持SPIR-VBinaryIntermediate语言。片上系统生产商（SoCs）比如GPU独立硬件供应商（IHVs）可以为Android编写Vulkan驱动；OEMs简单地需要为特定的硬件集成
Linux运维常见问题排查 Hadesls Linux 1024程序员节
1.Linux系统安装初始状态时>找不到硬盘，无法进入下一步安装解决方法：进入BIOS/COMS设置，找到硬盘设置相关选项，并设置为兼容模式。2.Linux系统安装时，在硬盘分区完成后>无法继续安装解决方法：硬盘分区不符合安装要求，可能忘记创建根分区或swap交换分区。这一点与Windows系统安装有区别。3.Linux系统安装时，软件包选择困惑，安装完成后发现有组件未按需求安装；解决方法：对Li
CentOS7搭建DNS服务器配置详解 Hadesls Linux 服务器网络运维
CentOS7搭建DNS服务器配置详解1、安装BIND服务器软件并启动yum-yinstallbindbind*systemctlstartnamed.service#启动服务systemctlenablenamed#设为开机启动2、查看named进程是否正常启动ps-eaf|grepnamed#检查进程ss-nult|grep:53#检查监听端口3、开放TCP和UDP的53端口firewall-
十五、K8S-持久卷PV和PVC 繁华依在 k8s kubernetes docker 容器
目录一、感念：1、PersistentVolume(PV)2、PersistentVolumeClaim(PVC)二、PV和PVC工作原理1、资源供应（Provisioning）2、资源绑定（Binding）3、资源使用（Using）4、资源回收（Reclaiming）1、保留数据：2、Deleted（删除数据）：3、Recycled(回收策略)：5、PVC资源扩容三、PV详解1、存储容量（Cap
同步&异步日志系统-设计模式 2401_82609762 设计模式
六大原则单⼀职责原则（SingleResponsibilityPrinciple）类的职责应该单⼀，⼀个⽅法只做⼀件事。职责划分清晰了，每次改动到最⼩单位的⽅法或类。使⽤建议：两个完全不⼀样的功能不应该放⼀个类中，⼀个类中应该是⼀组相关性很⾼的函数、数据的封装⽤例：⽹络聊天：⽹络通信&聊天，应该分割成为⽹络通信类&聊天类开闭原则（OpenClosedPrinciple）对扩展开放，对修改封闭使⽤建
阿里云 MaxCompute MaxQA 开启公测，解锁近实时高效查询体验阿里云大数据AI技术阿里云云原生 MaxCompute 大数据实时数仓
随着实时、近实时数据分析需求的持续增长，查询响应时间在现代数据分析和业务应用中变得越来越重要。为减少查询响应时间，提升数据效率，阿里云云原生大数据计算服务MaxCompute推出MaxQA（原MCQA2.0）查询加速功能，在独享的查询加速资源池的基础上，对管控链路、查询优化器、执行引擎、存储引擎以及缓存机制等多个环节进行全面优化，显著减少了查询响应时间，适用于BI场景、交互式分析以及近实时数仓等对
教程 | Ventoy全攻略：2025最新安装与使用教程，打造万能多系统启动盘 The god of big data 教程神器？三叉戟？虚拟系统系统架构
一、Ventoy简介与核心优势Ventoy是一款开源免费的多系统启动盘工具，支持Windows、Linux、macOS等操作系统及各类维护工具。其最大特点是无需反复格式化U盘，只需将ISO/WIM/IMG等镜像文件直接拷贝至U盘即可启动，且支持LegacyBIOS与UEFI双模式。相较于传统工具，Ventoy的优势包括：多系统兼容性：支持超1000种ISO镜像，涵盖主流操作系统及工具（如Windo
什么是BIO、NIO、AIO？ PLuto777_ nio java aio
在高性能的IO体系设计中，BIO、NIO、AIO的概念，常常会让我们感到困惑不解。在Java面试中，我们也经常会被问到这个问题。譬如：BIO、NIO、AIO的概念同步/异步、阻塞/非阻塞的区别NIO如何实现多路复用功能BIOBIO全称是BlockingIO，是JDK1.4之前的传统IO模型，本身是同步阻塞模式。线程发起IO请求后，一直阻塞IO，直到缓冲区数据就绪后，再进入下一步操作。针对网络通信都
上位机知识篇---sbit、bit、sfr Ronin-Lotus 上位机操作篇程序代码篇嵌入式硬件篇单片机嵌入式硬件 c sbit bit sfr 蓝桥杯
文章目录前言1.sbit的使用语法特点作用范围存储位置用途示例代码2.bit的使用语法特点作用范围存储位置用途示例代码3.sbit与bit的区别4.综合示例5.注意事项sbit的适用范围：bit的存储限制编译器支持6.总结sbitbit7.sfr的使用1.sfr的语法2.sfr的作用访问硬件资源提高代码可读性简化代码：3.8051单片机中常见的SFR4.sfr的使用示例示例1：控制GPIO端口示例
完成注册登陆系统中的登录部分代码 ILL11IIL python
#注册登录系统importhashlibimportjsonimportos.path#读取本地的所有账户数据defload_account():#如果保存用户账户的文件存在，则读取文件中的用户信息，反之说明之前从未有用户注册过，返回空字典即可ifos.path.exists("account.txt"):returnjson.load(open("account.txt"))else:retur
python如果忘了符号链接指向的是哪个版本，可以这样做 Jasper张环境安装常用工具 python 自动化
如果不确定python3指向哪个版本，可以通过以下命令查看：ls-l/opt/homebrew/bin/python3jasper.zhang@localhost~%ls-l/opt/homebrew/bin/python3lrwxr-xr-x1jasper.zhangadmin4021515:32/opt/homebrew/bin/python3->../Cellar/[email protected]/3
使用brew install python时提示Unversioned symlinks Jasper张常用工具环境安装 python mac
继续安装新环境，在使用brewinstallpython时，在最后安装完成时提示：==>[email protected]/opt/homebrew/bin/python3Unversionedsymlinks`python`,`python-config`,`pip`etc.pointingto`python3`,`python3-config`,`pip3`etc.,
文件包含lfi.php使用三和三千万网络安全安全
使用这个脚本的前提是有文件包含点，也可以访问到phpinfo页面#!/usr/bin/pythonimportsysimportthreadingimportsocketdefsetup(host,port):TAG="SecurityTest"PAYLOAD="""%s\r')?>\r"""%TAGREQ1_DATA="""-----------------------------7dbff1d
设计模式的 7 大原则码农爱java 设计模式设计模式设计模式原则原理设计模式7大原则 Java 面试
什么是设计模式？设计模式即DesignPatterns，是指在软件开发过程中，针对反复出现的问题所总结归纳出的通用解决方案，设计模式是经过无数经验的积累和经验的总结得出的通用解决方案，设计模式都遵守了很多原则，这些原则可以提高代码的可重用性、可维护性和可扩展性。设计模式的7大设计原则单一职能原则（SingleResponsibilityPrincipleSRP）单一职能原则一个类应该只有一个引起变
BIM Revit新功能“批量链接”（粉丝Free提需求）广州明周科技 BIM 建筑模型 Revit revit bim revit二次开发 c#深度学习统一建模语言建筑模型
❤-----❤又是进步的一天啊❤------❤#简介批量链接功能说明：一键清空已有链接：用户可以通过点击此按钮，快速清空当前项目中所有已存在的Revit链接。此功能适用于需要重置链接状态或清除不必要链接的场景。一键重新载入链接：此按钮用于重新加载所有已链接的Revit项目文件，确保项目中显示的链接信息是最新的。适用于需要同步或更新链接内容的情况。修改时间显示：数据表格新增了一列“修改时间”，用于显
flash_atten库安装失败心平气和不要慌 python 开发语言
在使用tinyllava时，需要安装flash_atten库，直接pipinstallflash_atten安装出现无法安装且安装速度慢的情况，下面是解决方案。1.查询对应版本（cuda，python等），直接下载对应whl文件。地址：https://github.com/Dao-AILab/flash-attention/releases?page=52.安装，这里我选择abiFALSE版本的才
flash-attention安装教程深度求索者深度学习人工智能
flash-attention不仅能加快速度，还可以节省显存。安装方法如下：首先搞清楚你的python什么版本，torch什么版本，cuda什么版本，操作系统是什么。例如我下载的是：flash_attn-2.7.0.post2+cu12torch2.3cxx11abiTRUE-cp310-cp310-linux_x86_64.whl我的操作系统是Linux，Python3.10，cuda12，to
Mysql误删表中数据与误删表的恢复方法 XCZHONGS mysql
查看数据库是否开启binlog日志mysql>showvariableslike'%log_bin%';+---------------------------------+---------------------------------------+|Variable_name|Value|+---------------------------------+-----------------
Android14 AOSP 允许system分区和vendor分区应用进行AIDL通信冬瓜神君 android binder
在Android14上，出于种种原因，system分区的应用无法和vendor分区的应用直接通过AIDL的方法进行通信，但是项目的某个功能又需要如此。好在Binder底层其实是支持的，只是在上层进行了屏蔽。修改frameworks/native/libs/binder/BpBinder.cpp文件，找到status_tBpBinder::transact方法，屏蔽相关判断语句或者错误返回即可。如下
Kafka topic、producer、consumer的基础使用病妖 Kafka kafka big data 分布式
文章目录Kafka初级前言1.topic的增删改查2.生产者的消息发送3.消费者消费数据Kafka初级前言关于kafka的集群安装这里就先跳过，如果需要相关资料以及学习视频的可以在留言下留下联系信息（邮箱、微信、qq都可），我们直接从kafka的学习开始，这是初级阶段，这篇博主主要讲述kafka的命令行操作。1.topic的增删改查创建主题：切换到kafka的相关目录，进行以下命令行操作bin/k
perl特殊变量内置 qq_27292549
Perl语言中定义了一些特殊的变量，通常以$,@,或%作为前缀，例如：$_。很多特殊的变量有一个很长的英文名，操作系统变量$!可以写为$OS_ERROR。如果你想使用英文名的特殊变量需要在程序头部添加useEnglish;。这样就可以使用具有描述性的英文特殊变量。1#!/usr/bin/perlusewarnings;@array=qw(abcd);foreach(@array){print$_,
50道题快速复习MySQL之准备篇比奇堡的天没有云速通MySQL mysql oracle 数据库
文章目录1.创建数据库表2.创建表数据本文旨在帮助大家快速复习MySQL,共有4张表,50道题.本篇文章在做讲解50道题目之前，先将数据库表以及表中的数据创建好。1.创建数据库表建表语句如下，分别是学生表，课程表，教师表和成绩表。#–1.学生表#Student(s_id,s_name,s_birth,s_sex)–学生编号,学生姓名,出生年月,学生性别CREATETABLE`Student`(`s
python dag调度系统开发_DAG（有向无环图）动态作业调度程序 weixin_39913628 python dag调度系统开发
IneedtomanagealargeworkflowofETLtasks,whichexecutiondependsontime,dataavailabilityoranexternalevent.Somejobsmayfailduringexecutionoftheworkflowandthesystemshouldhavetheabilitytorestartafailedworkflowb
RNA-seq 差异分析的细节详解 (8) 后端
引言本系列将开展全新的转录组分析专栏，主要针对使用DESeq2时可能出现的问题和方法进行展开描述。想要学习更多内容可以添加文末的学习交流群或客服QQ:941844452。Wald检验的各个步骤DESeq函数依次运行以下函数：dds<-estimateSizeFactors(dds)dds<-estimateDispersions(dds)dds<-nbinomWaldTest(dds)用于估计尺寸
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb