Postgresql中国用户会

在PostgreSQL中用线性回归分析linear regression做预测

Postgres2015全国用户大会将于11月20至21日在北京丽亭华苑酒店召开。本次大会嘉宾阵容强大，国内顶级PostgreSQL数据库专家将悉数到场，并特邀欧洲、俄罗斯、日本、美国等国家和地区的数据库方面专家助阵:

Postgres-XC项目的发起人铃木市一(SUZUKI Koichi)
Postgres-XL的项目发起人Mason Sharp
pgpool的作者石井达夫(Tatsuo Ishii)
PG-Strom的作者海外浩平(Kaigai Kohei)
Greenplum研发总监姚延栋
周正中(德哥), PostgreSQL中国用户会创始人之一
汪洋，平安科技数据库技术部经理
……

 
       2015年度PG大象会报名地址：http://postgres2015.eventdove.com/
PostgreSQL中国社区： http://postgres.cn/
PostgreSQL专业1群： 3336901（已满）
PostgreSQL专业2群： 100910388
PostgreSQL专业3群： 150657323

首选来个线性回归分析linear regression, 最小二乘法least-squares-fit的小故事(取自百度) :

1801年，意大利天文学家朱赛普·皮亚齐发现了第一颗小行星谷神星。经过40天的跟踪观测后，由于谷神星运行至太阳背后，使得皮亚齐失去了谷神星的位置。随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星，但是根据大多数人计算的结果来寻找谷神星都没有结果。时年24岁的高斯也计算了谷神星的轨道。奥地利天文学家海因里希·奥尔伯斯根据高斯计算出来的轨道重新发现了谷神星。

高斯使用的最小二乘法的方法发表于1809年他的著作《天体运动论》中。

法国科学家勒让德于1806年独立发现“最小二乘法”，但因不为世人所知而默默无闻。

勒让德曾与高斯为谁最早创立最小二乘法原理发生争执。

1829年，高斯提供了最小二乘法的优化效果强于其他方法的证明，因此被称为高斯-马尔可夫定理.

上面的故事说明通过已有数据可以对未来的数据进行预测. 但是预测结果是否准确有不确定因素, 所以需要不断的调整和校验.

如何做回归分析呢? (取自百度)

研究一个或多个随机变量Y1 ，Y2 ，…，Yi与另一些变量X1、X2，…，Xk之间的关系的统计方法，又称多重回归分析。通常称Y1，Y2，…，Yi为因变量，X1、X2，…，Xk为自变量。回归分析是一类数学模型，特别当因变量和自变量为线性关系时，它是一种特殊的线性模型。最简单的情形是一个自变量和一个因变量，且它们大体上有线性关系，这叫一元线性回归，即模型为Y=a+bX+ε，这里X是自变量，Y是因变量，ε是随机误差，通常假定随机误差的均值为0，方差为σ^2（σ^2大于0）σ^2与X的值无关。若进一步假定随机误差遵从正态分布，就叫做正态线性模型。一般的情形，它有k个自变量和一个因变量，因变量的值可以分解为两部分：一部分是由于自变量的影响，即表示为自变量的函数，其中函数形式已知，但含一些未知参数；另一部分是由于其他未被考虑的因素和随机性的影响，即随机误差。当函数形式为未知参数的线性函数时，称线性回归分析模型；当函数形式为未知参数的非线性函数时，称为非线性回归分析模型。当自变量的个数大于1时称为多元回归，当因变量个数大于1时称为多重回归。

回归分析的主要内容为：

①从一组数据出发，确定某些变量之间的定量关系式，即建立数学模型并估计其中的未知参数。估计参数的常用方法是最小二乘法。

②对这些关系式的可信程度进行检验。

③在许多自变量共同影响着一个因变量的关系中，判断哪个（或哪些）自变量的影响是显著的，哪些自变量的影响是不显著的，将影响显著的自变量入模型中，而剔除影响不显著的变量，通常用逐步回归、向前回归和向后回归等方法。

④利用所求的关系式对某一生产过程进行预测或控制。回归分析的应用是非常广泛的，统计软件包使各种回归方法计算十分方便。

在回归分析中，把变量分为两类。一类是因变量，它们通常是实际问题中所关心的一类指标，通常用Y表示；而影响因变量取值的的另一类变量称为自变量，用X来表示。

回归分析研究的主要问题是：

（1）确定Y与X间的定量关系表达式，这种表达式称为回归方程；

（2）对求得的回归方程的可信度进行检验；

（3）判断自变量X对因变量Y有无影响；

（4）利用所求得的回归方程进行预测和控制。

一个例子 :

例如，如果要研究质量和用户满意度之间的因果关系，从实践意义上讲，产品质量会影响用户的满意情况，因此设用户满意度为因变量，记为Y；质量为自变量，记为X。根据图8－3的散点图，可以建立下面的线性关系： Y=A+BX+§

式中：A和B为待定参数，A为回归直线的截距；B为回归直线的斜率，表示X变化一个单位时，Y的平均变化情况；§为依赖于用户满意度的随机误差项。

对于经验回归方程： y=0.857+0.836x

回归直线在y轴上的截距为0.857、斜率0.836，即质量每提高一分，用户满意度平均上升0.836分；或者说质量每提高1分对用户满意度的贡献是0.836分。

在PostgreSQL中提供了回归分析的一些聚合函数,

`regr_avgx(Y, X)`	`double precision`	`double precision`	average of the independent variable (`sum(X)/N`)
`regr_avgy(Y, X)`	`double precision`	`double precision`	average of the dependent variable (`sum(Y)/N`)
`regr_count(Y, X)`	`double precision`	`bigint`	number of input rows in which both expressions are nonnull
`regr_intercept(Y, X)`	`double precision`	`double precision`	y-intercept of the least-squares-fit linear equation determined by the (`X`, `Y`) pairs
`regr_r2(Y, X)`	`double precision`	`double precision`	square of the correlation coefficient
`regr_slope(Y, X)`	`double precision`	`double precision`	slope of the least-squares-fit linear equation determined by the (`X`, `Y`) pairs
`regr_sxx(Y, X)`	`double precision`	`double precision`	`sum(X^2) - sum(X)^2/N` ("sum of squares" of the independent variable)
`regr_sxy(Y, X)`	`double precision`	`double precision`	`sum(XY) - sum(X) sum(Y)/N` ("sum of products" of independent times dependent variable)
`regr_syy(Y, X)`	`double precision`	`double precision`	`sum(Y^2) - sum(Y)^2/N` ("sum of squares" of the dependent variable)

本文会用到如下几个 :

regr_intercept, 计算截距.

regr_slope, 计算斜率.

regr_r2, 计算相关性, 相关性越高, 说明这组数据用于预估的准确度越高.

下面来举个例子 :

将最近一年的某个业务的日访问量数据统计放到一张测试表.

利用这一年的数据进行一元回归分析, 要预测的是因变量, 用作预测的是自变量. 因为要预测的数据未发生, 所以我们可以把时间交错一下, 就可以作为自变量来使用.

例如下面这组数据, 自变量就是数据下移一行产生的. :

因变量 | 自变量

48000 | 54624

47454 | 48000

56766 | 47454

60488 | 56766

58191 | 60488

57443 | 58191

54277 | 57443

55508 | 54277

52716 | 55508

63748 | 52716

43462 | 63748

44248 | 43462

40145 | 44248

如果影响的因素较多, 需要做多元回归, 你可以选择PostgreSQL R语言插件来分析.

本文做的是一元回归的例子, 接下来进入测试 :

创建一张过去365天的某业务的日下载量数据表.


     
     
     
     
      
      
      
      digoal=> create table test as select row_number() over(order by dt) as rn,cnt from 
     
     
     
     
     
     
     
     
      
      
      
               (select date(createtime) as dt, count(*) as cnt from tbl_app_download where createtime>=( date(now())-366 ) and createtime<( date(now())-1 ) group by date(createtime)) as t;
     
     
     
     
     
     
     
     
      
      
      
      SELECT 365

数据大概是这样的

digoal=> select * from test;

....

329 | 36293

330 | 40886

331 | 34465

332 | 30785

333 | 33318

334 | 34480

....

接下来我们要来测试在不同数据范围内的回归的线性相关性,

例如最近362天的数据交错后的回归线性相关性.

digoal=> select count(*),regr_r2(t.cnt,test.cnt) from

(select rn-1 as rn,cnt from test) as t,test where t.rn=test.rn and test.rn>2;

count | regr_r2

-------+-------------------

362 | 0.835282212765017

(1 row)

但是如果时间放大到最近363天, 相关性就降低到 0.32915622582628了

digoal=> select count(*),regr_r2(t.cnt,test.cnt) from

(select rn-1 as rn,cnt from test) as t,test where t.rn=test.rn and test.rn>1;

count | regr_r2

-------+------------------

363 | 0.32915622582628

(1 row)

我们要不断的尝试来得到更好的相关性, 当获得最高的相关性(接近1)时, 预测数据最准确.

接下来我们看看以上两个时间段产生的截距和斜率的预测准确度.

截距

digoal=> select count(*),regr_intercept(t.cnt,test.cnt) from

(select rn-1 as rn,cnt from test) as t,test where t.rn=test.rn and test.rn>2;

count | regr_intercept

-------+------------------

362 | 6274.25023499543

(1 row)

斜率

digoal=> select count(*),regr_slope(t.cnt,test.cnt) from

(select rn-1 as rn,cnt from test) as t,test where t.rn=test.rn and test.rn>2;

count | regr_slope

-------+-------------------

362 | 0.906861594725424

(1 row)

使用自变量 44248 推测因变量40145.

使用公式推测的结果为46401.062078405991152

digoal=> select 44248*0.906861594725424+6274.25023499543;

?column?

-----------------------

46401.062078405991152

(1 row)

准确度 :

digoal=> select 40145/46401.062078405991152;

?column?

------------------------

0.86517416200873079820

(1 row)

当我们使用另一组截距和斜率时, 准确度最低是 0.32915622582628. 所以得到的预测结果可能不及以上的.

截距

digoal=> select count(*),regr_intercept(t.cnt,test.cnt) from

(select rn-1 as rn,cnt from test) as t,test where t.rn=test.rn and test.rn>1;

count | regr_intercept

-------+------------------

363 | 49279.0342891155

(1 row)

斜率

digoal=> select count(*),regr_slope(t.cnt,test.cnt) from

(select rn-1 as rn,cnt from test) as t,test where t.rn=test.rn and test.rn>1;

count | regr_slope

-------+-------------------

363 | 0.292250474909646

(1 row)

预测结果

digoal=> select 44248*0.292250474909646+49279.0342891155;

?column?

-----------------------

62210.533302917516208

(1 row)

准确度

digoal=> select 40145/62210.533302917516208;

?column?

------------------------

0.64530872616900233730

(1 row)

最后再提一下另外几个和回归相关的函数 :

`regr_avgx(Y, X)`	`double precision`	`double precision`	average of the independent variable (`sum(X)/N`)
`regr_avgy(Y, X)`	`double precision`	`double precision`	average of the dependent variable (`sum(Y)/N`)
`regr_count(Y, X)`	`double precision`	`bigint`	number of input rows in which both expressions are nonnull

`regr_sxx(Y, X)`	`double precision`	`double precision`	`sum(X^2) - sum(X)^2/N` ("sum of squares" of the independent variable)
`regr_sxy(Y, X)`	`double precision`	`double precision`	`sum(XY) - sum(X) sum(Y)/N` ("sum of products" of independent times dependent variable)
`regr_syy(Y, X)`	`double precision`	`double precision`	`sum(Y^2) - sum(Y)^2/N` ("sum of squares" of the dependent variable)

regr_avgx(y, x)其实就是算x的平均值(数学期望), y在这里没有任何作用.

regr_avgy(y, x)其实就是算y的平均值(数学期望) , x在这里没有任何作用.

regr_count(y, x) 计算x和y都不是空的记录数.

另外三个是辅助函数, 计算诊断统计信息(总方差, 总协方差).


    
    
    
    
     
     
     
     regr_sxx(y, x)  :  sum(X^2) - sum(X)^2/N 
    
    
    
    
    
    
    
    
     
     
     
     regr_sxy(y, x)  :  sum(X*Y) - sum(X) * sum(Y)/N
    
    
    
    
    
    
    
    
     
     
     
     regr_syy(y, x)  :  sum(Y^2) - sum(Y)^2/N 
    
    
    
    
    
    
    
    
     
     
     
     
      
      
      
      REGR_SXY, REGR_SXX, REGR_SYY are auxiliary functions that are used to compute various diagnostic statistics.
     
     
     
     
     
     
     
     
      
      
      
      REGR_SXX makes the following computation after the elimination of null (expr1, expr2) pairs:
     
     
     
     
     
     
     
     
      
      
      
      REGR_COUNT(expr1, expr2) * VAR_POP(expr2)
     
     
     
     
     
     
     
     
      
      
      
      

     
     
     
     
     
     
     
     
      
      
      
      REGR_SYY makes the following computation after the elimination of null (expr1, expr2) pairs:
     
     
     
     
     
     
     
     
      
      
      
      REGR_COUNT(expr1, expr2) * VAR_POP(expr1)
     
     
     
     
     
     
     
     
      
      
      
      

     
     
     
     
     
     
     
     
      
      
      
      REGR_SXY makes the following computation after the elimination of null (expr1, expr2) pairs:
     
     
     
     
     
     
     
     
      
      
      
      REGR_COUNT(expr1, expr2) * COVAR_POP(expr1, expr2)

验证regr_sxx, sxy, syy.


    
    
    
    
     
     
     
     postgres=# select regr_sxx(y,x), REGR_COUNT(y,x)*VAR_POP(x) from (values(2,400),(6,401),(7,400),(3,400),(1000,488)) as t(x,y);
    
    
    
    
    
    
    
    
     
     
     
      regr_sxx |      ?column?       
    
    
    
    
    
    
    
    
     
     
     
     ----------+---------------------
    
    
    
    
    
    
    
    
     
     
     
      792833.2 | 792833.200000000000
    
    
    
    
    
    
    
    
     
     
     
     (1 row)
    
    
    
    
    
    
    
    
     
     
     
     

    
    
    
    
    
    
    
    
     
     
     
     postgres=# select regr_sxy(y,x), REGR_COUNT(y,x)*COVAR_POP(x,y) from (values(2,400),(6,401),(7,400),(3,400),(1000,488)) as t(x,y);
    
    
    
    
    
    
    
    
     
     
     
      regr_sxy | ?column? 
    
    
    
    
    
    
    
    
     
     
     
     ----------+----------
    
    
    
    
    
    
    
    
     
     
     
       69885.6 |  69885.6
    
    
    
    
    
    
    
    
     
     
     
     (1 row)
    
    
    
    
    
    
    
    
     
     
     
     

    
    
    
    
    
    
    
    
     
     
     
     postgres=# select regr_syy(y,x), REGR_COUNT(y,x)*VAR_POP(y) from (values(2,400),(6,401),(7,400),(3,400),(1000,488)) as t(x,y);
    
    
    
    
    
    
    
    
     
     
     
      regr_syy |       ?column?        
    
    
    
    
    
    
    
    
     
     
     
     ----------+-----------------------
    
    
    
    
    
    
    
    
     
     
     
        6160.8 | 6160.8000000000000000
    
    
    
    
    
    
    
    
     
     
     
     (1 row)

好了, 先写到这里, 你还可以尝试更多的折腾玩法.

自动选择最优相关的例子如下 .


    
    
    
    
     
     
     
     => select * from test order by to_char desc limit 10;
  to_char   | count  
------------+--------
 2015030123 | 149496
 2015030122 | 165320
 2015030121 | 167663
 2015030120 | 161071
 2015030119 | 145570
 2015030118 | 133155
 2015030117 | 133962
 2015030116 | 130484
 2015030115 | 126182
 2015030114 | 122998
(10 rows)

=> do language plpgsql $$                         
declare 
  r2_1 numeric := 0; 
  r2_2 numeric := 0; 
  var int;
  inter numeric;
  slope numeric;
  inter_2 numeric;
  slope_2 numeric;
  realv numeric;
  predicv numeric;
  offset_var int := 0; -- 最后一个值的预测值
begin
  for i in 1..450 loop
    with t1 as (select row_number() over(order by to_char) as rn,count from test order by to_char desc offset offset_var), 
         t2 as (select row_number() over(order by to_char)-1 as rn,count from test order by to_char desc offset offset_var)  
      select regr_intercept(t2.count,t1.count),regr_slope(t2.count,t1.count),regr_r2(t1.count,t2.count) into inter,slope,r2_1 from t1,t2 where t1.rn=t2.rn and t1.rn>i; 
    if r2_1>r2_2 then 
      inter_2:=inter;
      slope_2:=slope;
      r2_2:=r2_1; 
      var:=i;
    end if; 
  end loop; 

  raise notice '%, %, %, %', var, inter_2,slope_2,r2_2;
  select slope_2*count+inter_2 into predicv from test order by to_char desc offset offset_var+1 limit 1;
  select count into realv from test order by to_char desc offset offset_var limit 1;
  raise notice '%, %', realv, predicv;
end;
$$;
NOTICE:  436, 16599.0041292694, 0.896184690654355, 0.925125327496365
NOTICE:  149496, 164756.257188247368600
DO

=> select 149496/164756.2;
        ?column?        
------------------------
 0.90737708201572990880
(1 row)

=> do language plpgsql $$                         
declare 
  r2_1 numeric := 0; -- 相关性
  r2_2 numeric := 0; -- 最大相关性
  var int;  --  样本数量
  inter_1 numeric;  --  截距
  slope_1 numeric;  --  斜率
  inter_2 numeric;  --  最大相关性截距
  slope_2 numeric;  --  最大相关性斜率
  realv numeric;    --  真实数据
  predicv numeric;  --  预测数据
  offset_var int := 1;   -- 倒数第二个值的预测值, 不停迭代, 最后计算所有的实际值和预测值的corr, 看看相似度如何?
begin
  for i in 1..450 loop
    with t1 as (select row_number() over(order by to_char) as rn,count from test order by to_char desc offset offset_var), 
         t2 as (select row_number() over(order by to_char)-1 as rn,count from test order by to_char desc offset offset_var) 
      select regr_intercept(t2.count,t1.count),regr_slope(t2.count,t1.count),regr_r2(t1.count,t2.count) into inter_1,slope_1,r2_1 from t1,t2 where t1.rn=t2.rn and t1.rn>i;
    if r2_1>r2_2 then 
      inter_2 := inter_1;
      slope_2 := slope_1;
      r2_2 := r2_1;
      var := i;
    end if;
  end loop;

  raise notice '样本数量%, 截距%, 斜率%, 相关性%', var, round(inter_2,4), round(slope_2,4), round(r2_2,4);
  select slope_2*count+inter_2 into predicv from test order by to_char desc offset offset_var+1 limit 1;
  select count into realv from test order by to_char desc offset offset_var limit 1;
  raise notice '真实数据%, 预测数据%, 本次预测偏差,%%%', realv, round(predicv), abs(1-round(predicv/realv,4))*100;
end;
$$;
NOTICE:  样本数量436, 截距10109.8500, 斜率0.9573, 相关性0.9476
NOTICE:  真实数据165320, 预测数据170611, 本次预测偏差,%3.2000
DO

校验函数

=> create or replace function check_predict(IN ov int, OUT rv numeric, OUT pv numeric, OUT dev numeric) returns record as $$

declare

r2_1 numeric := 0; -- 相关性

r2_2 numeric := 0; -- 最大相关性

var int; -- 样本数量

inter_1 numeric; -- 截距

slope_1 numeric; -- 斜率

inter_2 numeric; -- 最大相关性截距

slope_2 numeric; -- 最大相关性斜率

realv numeric; -- 真实数据

predicv numeric; -- 预测数据

offset_var int := ov; -- 倒数第二个值的预测值, 不停迭代, 最后计算所有的实际值和预测值的corr, 看看相似度如何?

lps int := 0;

begin

select count(*)-offset_var-4 into lps from test; -- 循环不要超过总样本数, 同时至少给2个样本.

for i in 1..lps loop

with t1 as (select row_number() over(order by to_char) as rn,to_char,count from test order by to_char desc offset offset_var),

t2 as (select row_number() over(order by to_char)-1 as rn,to_char,count from test order by to_char desc offset offset_var)

select regr_intercept(t2.count,t1.count),regr_slope(t2.count,t1.count),regr_r2(t1.count,t2.count) into inter_1,slope_1,r2_1 from t1,t2 where t1.rn=t2.rn and t1.rn>i;

if r2_1>r2_2 then

inter_2 := inter_1;

slope_2 := slope_1;

r2_2 := r2_1;

var := i;

end if;

end loop;

raise notice '样本数量%, 截距%, 斜率%, 相关性%', var, round(inter_2,4), round(slope_2,4), round(r2_2,4);

select slope_2*count+inter_2 into predicv from test order by to_char desc offset offset_var+1 limit 1;

select count into realv from test order by to_char desc offset offset_var limit 1;

raise notice '真实数据%, 预测数据%, 本次预测偏差%%%', realv, round(predicv), abs(1-round(predicv/realv,4))*100;

rv := realv;

pv := round(predicv);

dev := abs(1-round(predicv/realv,4));

return;

end;

$$ language plpgsql;

校验测试 :

=> select check_predict(i) from generate_series(1,100) t(i);

NOTICE: 样本数量436, 截距10109.8500, 斜率0.9573, 相关性0.9476

NOTICE: 真实数据165320, 预测数据170611, 本次预测偏差%3.2000

NOTICE: 样本数量436, 截距6909.3635, 斜率0.9872, 相关性0.9419

NOTICE: 真实数据167663, 预测数据165922, 本次预测偏差%1.0400

NOTICE: 样本数量436, 截距8151.8730, 斜率0.9754, 相关性0.9249

NOTICE: 真实数据161071, 预测数据150145, 本次预测偏差%6.7800

NOTICE: 样本数量436, 截距14388.5296, 斜率0.9135, 相关性0.9275

NOTICE: 真实数据145570, 预测数据136026, 本次预测偏差%6.5600

NOTICE: 样本数量437, 截距30451.0167, 斜率0.7726, 相关性0.9570

NOTICE: 真实数据133155, 预测数据133953, 本次预测偏差%0.6000

NOTICE: 样本数量446, 截距343.4262, 斜率1.0262, 相关性0.9785

NOTICE: 真实数据133962, 预测数据134241, 本次预测偏差%0.2100

NOTICE: 样本数量437, 截距31491.5019, 斜率0.7616, 相关性0.9494

NOTICE: 真实数据130484, 预测数据127596, 本次预测偏差%2.2100

NOTICE: 样本数量438, 截距48512.9273, 斜率0.6126, 相关性0.9484

NOTICE: 真实数据126182, 预测数据123864, 本次预测偏差%1.8400

NOTICE: 样本数量438, 截距50299.8161, 斜率0.5940, 相关性0.9526

NOTICE: 真实数据122998, 预测数据124578, 本次预测偏差%1.2800

NOTICE: 样本数量442, 截距33561.3690, 斜率0.7444, 相关性0.9983

NOTICE: 真实数据125052, 预测数据125119, 本次预测偏差%0.0500

NOTICE: 样本数量438, 截距50126.2968, 斜率0.5954, 相关性0.9475

NOTICE: 真实数据123000, 预测数据121572, 本次预测偏差%1.1600

NOTICE: 样本数量438, 截距52640.6564, 斜率0.5687, 相关性0.9400

NOTICE: 真实数据119991, 预测数据118710, 本次预测偏差%1.0700

NOTICE: 样本数量438, 截距55198.2911, 斜率0.5404, 相关性0.9301

NOTICE: 真实数据116182, 预测数据118363, 本次预测偏差%1.8800

NOTICE: 样本数量438, 截距43721.8498, 斜率0.6665, 相关性0.9845

NOTICE: 真实数据116887, 预测数据116082, 本次预测偏差%0.6900

NOTICE: 样本数量1, 截距4661.3951, 斜率0.9464, 相关性0.8978

NOTICE: 真实数据108562, 预测数据98517, 本次预测偏差%9.2500

NOTICE: 样本数量1, 截距4675.5276, 斜率0.9460, 相关性0.8979

NOTICE: 真实数据99168, 预测数据82725, 本次预测偏差%16.5800

NOTICE: 样本数量432, 截距39520.3078, 斜率0.4823, 相关性0.9201

NOTICE: 真实数据82505, 预测数据74942, 本次预测偏差%9.1700

NOTICE: 样本数量432, 截距31502.3387, 斜率0.5457, 相关性0.9985

NOTICE: 真实数据73450, 预测数据72804, 本次预测偏差%0.8800

NOTICE: 样本数量432, 截距30417.7790, 斜率0.5542, 相关性0.9989

NOTICE: 真实数据75681, 预测数据76143, 本次预测偏差%0.6100

NOTICE: 样本数量432, 截距31775.6232, 斜率0.5440, 相关性0.9992

NOTICE: 真实数据82509, 预测数据82187, 本次预测偏差%0.3900

NOTICE: 样本数量1, 截距4622.2503, 斜率0.9465, 相关性0.8993

NOTICE: 真实数据92670, 预测数据111447, 本次预测偏差%20.2600

NOTICE: 样本数量1, 截距4531.6850, 斜率0.9481, 相关性0.9003

NOTICE: 真实数据112865, 预测数据145539, 本次预测偏差%28.9500

NOTICE: 样本数量412, 截距19211.5611, 斜率0.8778, 相关性0.9590

NOTICE: 真实数据148731, 预测数据150848, 本次预测偏差%1.4200

NOTICE: 样本数量412, 截距18806.5399, 斜率0.8820, 相关性0.9580

NOTICE: 真实数据149961, 预测数据156169, 本次预测偏差%4.1400

NOTICE: 样本数量412, 截距17050.6057, 斜率0.8991, 相关性0.9603

NOTICE: 真实数据155748, 预测数据161289, 本次预测偏差%3.5600

NOTICE: 样本数量412, 截距14830.5241, 斜率0.9202, 相关性0.9607

NOTICE: 真实数据160430, 预测数据155939, 本次预测偏差%2.8000

NOTICE: 样本数量412, 截距16540.9704, 斜率0.9034, 相关性0.9574

NOTICE: 真实数据153344, 预测数据150240, 本次预测偏差%2.0200

NOTICE: 样本数量412, 截距17692.1060, 斜率0.8917, 相关性0.9532

NOTICE: 真实数据147997, 预测数据140772, 本次预测偏差%4.8800

NOTICE: 样本数量414, 截距41717.5731, 斜率0.6980, 相关性0.9736

NOTICE: 真实数据138023, 预测数据137013, 本次预测偏差%0.7300

NOTICE: 样本数量414, 截距42191.4454, 斜率0.6933, 相关性0.9722

NOTICE: 真实数据136535, 预测数据135075, 本次预测偏差%1.0700

NOTICE: 样本数量414, 截距42836.5141, 斜率0.6866, 相关性0.9716

NOTICE: 真实数据133978, 预测数据133909, 本次预测偏差%0.0500

NOTICE: 样本数量414, 截距42868.4919, 斜率0.6863, 相关性0.9698

NOTICE: 真实数据132634, 预测数据136891, 本次预测偏差%3.2100

NOTICE: 样本数量414, 截距39356.6117, 斜率0.7213, 相关性0.9849

NOTICE: 真实数据136998, 预测数据137674, 本次预测偏差%0.4900

NOTICE: 样本数量418, 截距-98886.5041, 斜率1.7965, 相关性0.9925

NOTICE: 真实数据136303, 预测数据136431, 本次预测偏差%0.0900

NOTICE: 样本数量414, 截距41274.0892, 斜率0.7011, 相关性0.9848

NOTICE: 真实数据130987, 预测数据130817, 本次预测偏差%0.1300

NOTICE: 样本数量414, 截距41537.1100, 斜率0.6983, 相关性0.9803

NOTICE: 真实数据127722, 预测数据129731, 本次预测偏差%1.5700

NOTICE: 样本数量414, 截距35567.9284, 斜率0.7625, 相关性0.9901

NOTICE: 真实数据126303, 预测数据124949, 本次预测偏差%1.0700

NOTICE: 样本数量414, 截距41599.7365, 斜率0.6944, 相关性0.9993

NOTICE: 真实数据117218, 预测数据117405, 本次预测偏差%0.1600

NOTICE: 样本数量413, 截距1686.3033, 斜率1.1262, 相关性0.8957

NOTICE: 真实数据109160, 预测数据110726, 本次预测偏差%1.4300

NOTICE: 样本数量412, 截距-126088.7154, 斜率2.7998, 相关性0.9671

NOTICE: 真实数据96823, 预测数据97097, 本次预测偏差%0.2800

NOTICE: 样本数量408, 截距36426.6219, 斜率0.5003, 相关性0.9205

NOTICE: 真实数据79716, 预测数据72776, 本次预测偏差%8.7100

NOTICE: 样本数量408, 截距29915.3284, 斜率0.5522, 相关性0.9813

NOTICE: 真实数据72658, 预测数据69530, 本次预测偏差%4.3100

NOTICE: 样本数量409, 截距30542.2158, 斜率0.5286, 相关性0.9970

NOTICE: 真实数据71739, 预测数据71377, 本次预测偏差%0.5100

NOTICE: 样本数量408, 截距21294.1724, 斜率0.6206, 相关性0.9985

NOTICE: 真实数据77243, 预测数据76786, 本次预测偏差%0.5900

NOTICE: 样本数量1, 截距4921.7169, 斜率0.9414, 相关性0.8898

NOTICE: 真实数据89412, 预测数据109386, 本次预测偏差%22.3400

NOTICE: 样本数量406, 截距-771730.9711, 斜率6.1383, 相关性0.9650

NOTICE: 真实数据110972, 预测数据112269, 本次预测偏差%1.1700

NOTICE: 样本数量388, 截距15580.3852, 斜率0.9001, 相关性0.9520

NOTICE: 真实数据144014, 预测数据149237, 本次预测偏差%3.6300

NOTICE: 样本数量388, 截距14377.9729, 斜率0.9129, 相关性0.9524

NOTICE: 真实数据148483, 预测数据151688, 本次预测偏差%2.1600

NOTICE: 样本数量388, 截距13455.2553, 斜率0.9226, 相关性0.9497

NOTICE: 真实数据150405, 预测数据156324, 本次预测偏差%3.9400

NOTICE: 样本数量402, 截距71505.3386, 斜率0.5561, 相关性0.9759

NOTICE: 真实数据154850, 预测数据155607, 本次预测偏差%0.4900

NOTICE: 样本数量388, 截距11270.4334, 斜率0.9451, 相关性0.9387

NOTICE: 真实数据151244, 预测数据144638, 本次预测偏差%4.3700

NOTICE: 样本数量388, 截距14060.3682, 斜率0.9147, 相关性0.9332

NOTICE: 真实数据141118, 预测数据129415, 本次预测偏差%8.2900

NOTICE: 样本数量390, 截距36957.1231, 斜率0.7099, 相关性0.9656

NOTICE: 真实数据126106, 预测数据125617, 本次预测偏差%0.3900

NOTICE: 样本数量390, 截距37150.1505, 斜率0.7077, 相关性0.9636

NOTICE: 真实数据124896, 预测数据128489, 本次预测偏差%2.8800

NOTICE: 样本数量390, 截距34760.7660, 斜率0.7330, 相关性0.9714

NOTICE: 真实数据129061, 预测数据128477, 本次预测偏差%0.4500

NOTICE: 样本数量390, 截距35229.1317, 斜率0.7280, 相关性0.9667

NOTICE: 真实数据127849, 预测数据128208, 本次预测偏差%0.2800

NOTICE: 样本数量392, 截距4342.9938, 斜率1.0018, 相关性0.9702

NOTICE: 真实数据127715, 预测数据129117, 本次预测偏差%1.1000

NOTICE: 样本数量393, 截距-32076.9878, 斜率1.3312, 相关性0.9964

NOTICE: 真实数据124554, 预测数据124206, 本次预测偏差%0.2800

NOTICE: 样本数量393, 截距-19541.0766, 斜率1.2152, 相关性1.0000

NOTICE: 真实数据117397, 预测数据117404, 本次预测偏差%0.0100

NOTICE: 样本数量390, 截距47549.0400, 斜率0.5872, 相关性0.9902

NOTICE: 真实数据112693, 预测数据111435, 本次预测偏差%1.1200

NOTICE: 样本数量390, 截距50098.4943, 斜率0.5560, 相关性0.9977

NOTICE: 真实数据108804, 预测数据108821, 本次预测偏差%0.0200

NOTICE: 样本数量390, 截距50042.2813, 斜率0.5567, 相关性0.9964

NOTICE: 真实数据105623, 预测数据105973, 本次预测偏差%0.3300

NOTICE: 样本数量1, 截距5273.1579, 斜率0.9358, 相关性0.8782

NOTICE: 真实数据100474, 预测数据89115, 本次预测偏差%11.3100

NOTICE: 样本数量1, 截距5280.4763, 斜率0.9354, 相关性0.8785

NOTICE: 真实数据89591, 预测数据72087, 本次预测偏差%19.5400

NOTICE: 样本数量384, 截距30325.0273, 斜率0.5354, 相关性0.9387

NOTICE: 真实数据71422, 预测数据64918, 本次预测偏差%9.1100

NOTICE: 样本数量386, 截距37631.4820, 斜率0.4029, 相关性0.9941

NOTICE: 真实数据64616, 预测数据64377, 本次预测偏差%0.3700

NOTICE: 样本数量384, 截距20707.7226, 斜率0.6191, 相关性0.9961

NOTICE: 真实数据66389, 预测数据65428, 本次预测偏差%1.4500

NOTICE: 样本数量384, 截距17341.5766, 斜率0.6472, 相关性0.9978

NOTICE: 真实数据72238, 预测数据72772, 本次预测偏差%0.7400

NOTICE: 样本数量1, 截距5202.6036, 斜率0.9363, 相关性0.8805

NOTICE: 真实数据85644, 预测数据102774, 本次预测偏差%20.0000

NOTICE: 样本数量382, 截距-211937.8855, 斜率2.3700, 相关性0.9232

NOTICE: 真实数据104207, 预测数据107341, 本次预测偏差%3.0100

NOTICE: 样本数量363, 截距10473.2297, 斜率0.9328, 相关性0.9381

NOTICE: 真实数据134716, 预测数据144319, 本次预测偏差%7.1300

NOTICE: 样本数量363, 截距8082.7467, 斜率0.9608, 相关性0.9426

NOTICE: 真实数据143484, 预测数据153571, 本次预测偏差%7.0300

NOTICE: 样本数量379, 截距90033.9242, 斜率0.4106, 相关性0.9539

NOTICE: 真实数据151426, 预测数据150648, 本次预测偏差%0.5100

NOTICE: 样本数量363, 截距3555.4288, 斜率1.0121, 相关性0.9344

NOTICE: 真实数据147628, 预测数据148068, 本次预测偏差%0.3000

NOTICE: 样本数量377, 截距-22855.0642, 斜率1.3040, 相关性0.9608

NOTICE: 真实数据142781, 预测数据143858, 本次预测偏差%0.7500

NOTICE: 样本数量363, 截距8135.3139, 斜率0.9564, 相关性0.9081

NOTICE: 真实数据127852, 预测数据116232, 本次预测偏差%9.0900

NOTICE: 样本数量363, 截距11650.2051, 斜率0.9095, 相关性0.9209

NOTICE: 真实数据113022, 预测数据107993, 本次预测偏差%4.4500

NOTICE: 样本数量366, 截距43850.9025, 斜率0.5911, 相关性0.9231

NOTICE: 真实数据105932, 预测数据109352, 本次预测偏差%3.2300

NOTICE: 样本数量366, 截距41459.4112, 斜率0.6193, 相关性0.9421

NOTICE: 真实数据110807, 预测数据111147, 本次预测偏差%0.3100

NOTICE: 样本数量366, 截距41099.7207, 斜率0.6234, 相关性0.9330

NOTICE: 真实数据112531, 预测数据107192, 本次预测偏差%4.7400

NOTICE: 样本数量366, 截距45144.8340, 斜率0.5733, 相关性0.9910

NOTICE: 真实数据106011, 预测数据105444, 本次预测偏差%0.5400

NOTICE: 样本数量366, 截距45652.0542, 斜率0.5670, 相关性0.9907

NOTICE: 真实数据105170, 预测数据104365, 本次预测偏差%0.7600

NOTICE: 样本数量368, 截距57233.9599, 斜率0.4495, 相关性0.9969

NOTICE: 真实数据103554, 预测数据103401, 本次预测偏差%0.1500

NOTICE: 样本数量368, 截距58816.4609, 斜率0.4327, 相关性0.9999

NOTICE: 真实数据102706, 预测数据102719, 本次预测偏差%0.0100

NOTICE: 样本数量366, 截距45837.1316, 斜率0.5648, 相关性0.9874

NOTICE: 真实数据101460, 预测数据101473, 本次预测偏差%0.0100

NOTICE: 样本数量366, 截距45788.3201, 斜率0.5655, 相关性0.9787

NOTICE: 真实数据98505, 预测数据97660, 本次预测偏差%0.8600

NOTICE: 样本数量1, 截距5430.0126, 斜率0.9322, 相关性0.8723

NOTICE: 真实数据91734, 预测数据83227, 本次预测偏差%9.2700

NOTICE: 样本数量1, 截距5423.3347, 斜率0.9320, 相关性0.8726

NOTICE: 真实数据83453, 预测数据66847, 本次预测偏差%19.9000

NOTICE: 样本数量360, 截距30435.2931, 斜率0.4928, 相关性0.9223

NOTICE: 真实数据65904, 预测数据59957, 本次预测偏差%9.0200

NOTICE: 样本数量360, 截距25313.6494, 斜率0.5394, 相关性0.9738

NOTICE: 真实数据59911, 预测数据58046, 本次预测偏差%3.1100

NOTICE: 样本数量360, 截距22789.5261, 斜率0.5623, 相关性0.9761

NOTICE: 真实数据60677, 预测数据57848, 本次预测偏差%4.6600

NOTICE: 样本数量360, 截距14289.6380, 斜率0.6383, 相关性1.0000

NOTICE: 真实数据62350, 预测数据62309, 本次预测偏差%0.0700

NOTICE: 样本数量1, 截距5349.6991, 斜率0.9328, 相关性0.8743

NOTICE: 真实数据75224, 预测数据94495, 本次预测偏差%25.6200

NOTICE: 样本数量1, 截距5276.8974, 斜率0.9345, 相关性0.8761

NOTICE: 真实数据95563, 预测数据124211, 本次预测偏差%29.9800

NOTICE: 样本数量339, 截距10611.8990, 斜率0.9248, 相关性0.9273

NOTICE: 真实数据127277, 预测数据132503, 本次预测偏差%4.1100

NOTICE: 样本数量339, 截距9346.7583, 斜率0.9398, 相关性0.9270

NOTICE: 真实数据131802, 预测数据141158, 本次预测偏差%7.1000

NOTICE: 样本数量354, 截距45602.8301, 斜率0.6964, 相关性0.9378

NOTICE: 真实数据140259, 预测数据142531, 本次预测偏差%1.6200

NOTICE: 样本数量354, 截距22118.2940, 斜率0.8984, 相关性0.9995

NOTICE: 真实数据139179, 预测数据139044, 本次预测偏差%0.1000

NOTICE: 样本数量339, 截距7066.6202, 斜率0.9646, 相关性0.9085

NOTICE: 真实数据130151, 预测数据123330, 本次预测偏差%5.2400

NOTICE: 样本数量352, 截距788258.5127, 斜率-6.1054, 相关性0.9259

NOTICE: 真实数据120531, 预测数据120243, 本次预测偏差%0.2400

check_predict

------------------------

(165320,170611,0.0320)

(167663,165922,0.0104)

(161071,150145,0.0678)

(145570,136026,0.0656)

(133155,133953,0.0060)

(133962,134241,0.0021)

(130484,127596,0.0221)

(126182,123864,0.0184)

(122998,124578,0.0128)

(125052,125119,0.0005)

(123000,121572,0.0116)

(119991,118710,0.0107)

(116182,118363,0.0188)

(116887,116082,0.0069)

(108562,98517,0.0925)

(99168,82725,0.1658)

(82505,74942,0.0917)

(73450,72804,0.0088)

(75681,76143,0.0061)

(82509,82187,0.0039)

(92670,111447,0.2026)

(112865,145539,0.2895)

(148731,150848,0.0142)

(149961,156169,0.0414)

(155748,161289,0.0356)

(160430,155939,0.0280)

(153344,150240,0.0202)

(147997,140772,0.0488)

(138023,137013,0.0073)

(136535,135075,0.0107)

(133978,133909,0.0005)

(132634,136891,0.0321)

(136998,137674,0.0049)

(136303,136431,0.0009)

(130987,130817,0.0013)

(127722,129731,0.0157)

(126303,124949,0.0107)

(117218,117405,0.0016)

(109160,110726,0.0143)

(96823,97097,0.0028)

(79716,72776,0.0871)

(72658,69530,0.0431)

(71739,71377,0.0051)

(77243,76786,0.0059)

(89412,109386,0.2234)

(110972,112269,0.0117)

(144014,149237,0.0363)

(148483,151688,0.0216)

(150405,156324,0.0394)

(154850,155607,0.0049)

(151244,144638,0.0437)

(141118,129415,0.0829)

(126106,125617,0.0039)

(124896,128489,0.0288)

(129061,128477,0.0045)

(127849,128208,0.0028)

(127715,129117,0.0110)

(124554,124206,0.0028)

(117397,117404,0.0001)

(112693,111435,0.0112)

(108804,108821,0.0002)

(105623,105973,0.0033)

(100474,89115,0.1131)

(89591,72087,0.1954)

(71422,64918,0.0911)

(64616,64377,0.0037)

(66389,65428,0.0145)

(72238,72772,0.0074)

(85644,102774,0.2000)

(104207,107341,0.0301)

(134716,144319,0.0713)

(143484,153571,0.0703)

(151426,150648,0.0051)

(147628,148068,0.0030)

(142781,143858,0.0075)

(127852,116232,0.0909)

(113022,107993,0.0445)

(105932,109352,0.0323)

(110807,111147,0.0031)

(112531,107192,0.0474)

(106011,105444,0.0054)

(105170,104365,0.0076)

(103554,103401,0.0015)

(102706,102719,0.0001)

(101460,101473,0.0001)

(98505,97660,0.0086)

(91734,83227,0.0927)

(83453,66847,0.1990)

(65904,59957,0.0902)

(59911,58046,0.0311)

(60677,57848,0.0466)

(62350,62309,0.0007)

(75224,94495,0.2562)

(95563,124211,0.2998)

(127277,132503,0.0411)

(131802,141158,0.0710)

(140259,142531,0.0162)

(139179,139044,0.0010)

(130151,123330,0.0524)

(120531,120243,0.0024)

(100 rows)

预测曲线 :

预测误差 :

以下是拿贵州茅台的日收盘价格做的第二天收盘价格一元回归预测以及校验图,

[参考]

1. http://www.math.zju.edu.cn/ligangliu/Courses/MathematicalModeling_2005-2006/Syllabus/chapter_10.pdf

2. http://210.28.216.200/cai/tongji/html/main.htm

3. http://zh.wikipedia.org/wiki/%E6%9C%80%E5%B0%8F%E4%BA%8C%E4%B9%98%E6%B3%95

4. http://baike.baidu.com/view/145440.htm

5. http://baike.baidu.com/view/139822.htm

6. http://en.wikipedia.org/wiki/Simple_linear_regression

7. http://docs.oracle.com/cd/B28359_01/server.111/b28286/functions139.htm

8. http://www.postgresql.org/docs/9.4/static/functions-aggregate.html

9. http://v.ku6.com/playlist/index_6598382.html

10. http://cos.name/tag/%E5%9B%9E%E5%BD%92%E5%88%86%E6%9E%90/

11. http://my.oschina.net/u/1047640/blog/198956

你可能感兴趣的:(转载,数据挖掘)

SecureCRT & SecureFX 9.6.1 for macOS, Linux, Windows - 终端仿真和文件传输 securecrt
SecureCRT&SecureFX9.6.1formacOS,Linux,Windows-跨平台的多协议终端仿真和文件传输请访问原文链接：https://sysin.org/blog/securecrt-9/查看最新版。原创作品，转载请保留出处。作者主页：sysin.orgSecureCRT客户端运行于Windows、Mac和Linux，将坚如磐石的终端仿真与强大的加密、广泛的身份验证选项以及S
ORACLE与SQL SERVER的区别 nanzhuhe 文章笔记数据库 Oracle
ORACLE与SQLSERVER的区别转载自：https://www.cnblogs.com/chuncn/archive/2009/01/28/1381262.html体系结构ORACLE的文件体系结构为：数据文件.DBF（真实数据）日志文件.RDO控制文件.CTL参数文件.ORASQLSERVER的文件体系结构为：.MDF（数据字典）.NDF（数据文件）.LDF（日志文件）ORACLE存储结构
Python电子书教程汇总 iteye_3941 python
From:http://bathome.net/thread-15554-1-1.html[转载教程]Python电子书教程汇总（2012-02-16更新）简明Python教程(AByteofPython)_1.20_中文版pdfhttp://www.rayfile.com/zh-cn/files/6cdcc561-58b2-11e1-ad5e-0015c55db73d/Python语言从入门到精
第03讲原理探究，了解爬虫的基本原理 roc_lpy Python
转载于拉勾教育-52讲轻松搞定网络爬虫-崔庆才1.爬虫概述我们可以把互联网比作一张大网，而爬虫（即网络爬虫）便是在网上爬行的蜘蛛。如果把网的节点比作一个个网页，爬虫爬到这就相当于访问了该页面，获取了其信息。可以把节点间的连线比作网页与网页之间的链接关系，这样蜘蛛通过一个节点后，可以顺着节点连线继续爬行到达下一个节点，即通过一个网页继续获取后续的网页，这样整个网的节点便可以被蜘蛛全部爬行到，网站的数
设计模式简介智想天开设计模式技术文章设计模式
本文章为原创，禁止未经授权的转载。对应公众号地址：设计模式简介，更多内容请关注公众号：智想天开1.什么是设计模式？设计模式是一套被反复使用、多数人知晓的、经过分类编目的代码设计经验。它们不是具体的代码，而是解决特定类型问题的通用方案。设计模式旨在提供一种高效、可维护和可扩展的方式来构建软件系统。关键点：重用：通过使用设计模式，可以避免重复造轮子，提升开发效率。沟通：设计模式提供了标准化的术语，促进
[转载]Nodejs 利用 express 框架获取接口参数柒柒公子呐 node.js
Express是一个基于Node.js平台，快速、开放、极简的web开发框架Expresss是一个第三方模块（在npm上可以下载），在使用它之前要先去下载它，在下载包之前要先创建项目，并通过npminit创建package.json文件。1、get接口参数req.query属性express框架会自动收集get方式从url地址中传递的查询字符串参数，并自动保存在req对象的query属性中。我们直
Hive 查看partition 以及msck 修复分区 dgsdaga3026010 大数据
#checktable的partitionhive>showpartitionstable_name;如果是外部表，不小心把表给删除了，可以适用下命令重新关联表和数据[MSCKREPAIRTABLE]全量修复分区hive>msckrepairtabletable_name;转载于:https://www.cnblogs.com/TendToBigData/p/10501178.html
Python编程与在线医疗平台数据挖掘与数据应用交互性研究 Allen_LVyingbo 数智化医院2025 python 数据挖掘
一、引言1.1研究背景与意义在互联网技术飞速发展的当下，在线医疗平台如雨后春笋般涌现，为人们的就医方式带来了重大变革。这些平台打破了传统医疗服务在时间和空间上的限制，使患者能够更加便捷地获取医疗资源。据相关报告显示，中国基于互联网的医疗保健行业已进入新的发展阶段，2023年中国在线医疗服务增长显著，高质量医院和在线医疗平台取得了长足进步，在线医疗的用户规模也在持续扩大，其中在线咨询服务的用户占比较
Cortex-M3(转) oldbalck 嵌入式操作系统系统架构
原来一直在Cortex-A8上做相关算法的开发和移植，最近要在Cortex-M3上实现一小功能，所以要了解一下Cortex-M3架构，在网上看到这篇blog不错，特转载一下。http://blog.mcuol.com/User/share_119/Article/39534_1.htm首先，在学习Cortex-M3时，我们必须要知道必要的缩略语。整理如下：AMBA:先进单片机总线架构ADK:AMB
QT ListView 记录 weixin_30872157 数据库
http://www.cnblogs.com/chenxuelian/archive/2009/12/22/1629601.html转载于:https://www.cnblogs.com/whisht/archive/2012/06/12/3085088.html
气象海洋水文领域Python机器学习及深度学习实践应用能力提升 AAIshangyanxiu 农林生态遥感编程算法统计语言大气科学 python 机器学习深度学习
Python是功能强大、免费、开源，实现面向对象的编程语言，能够在不同操作系统和平台使用，简洁的语法和解释性语言使其成为理想的脚本语言。除了标准库，还有丰富的第三方库，Python在数据处理、科学计算、数学建模、数据挖掘和数据可视化方面具备优异的性能。上述优势使得Python在气象、海洋、地理、气候、水文和生态等地学领域的科研和工程项目中得到广泛应用。可以预见未来Python将成为气象、海洋和水文
Python人工智能气象岁月如歌，青春不败气象学 python 人工智能开发语言
Python是功能强大、免费、开源，实现面向对象的编程语言，在数据处理、科学计算、数学建模、数据挖掘和数据可视化方面具备优异的性能，这些优势使得Python在气象、海洋、地理、气候、水文和生态等地学领域的科研和工程项目中得到广泛应用。可以预见未来Python将成为的主流编程语言之一。一：Python和科学计算基础1.1Python安装1.1.1Python在气象中的应用1.1.2Anaconda解
Cisco ACI Simulator 6.1(1f)F - ACI 模拟器 cisco
CiscoACISimulator6.1(1f)F-ACI模拟器ApplicationCentricInfrastructure(ACI)SimulatorSoftware请访问原文链接：https://sysin.org/blog/cisco-acisim-6/查看最新版。原创作品，转载请保留出处。作者主页：sysin.orgACISimulator介绍思科以应用为中心的基础设施(ACI)被概念
NetBackup Virtual Appliance 5 - 领先的企业备份和恢复解决方案备份与恢复
NetBackupVirtualAppliance5-领先的企业备份和恢复解决方案The#1enterprisebackupandrecoverysolution.请访问原文链接：https://sysin.org/blog/veritas-netbackup-virtual-appliance-5/查看最新版。原创作品，转载请保留出处。作者主页：sysin.org备份和恢复软件解决方案领导者Ve
国产替代 | 星环科技Sophon替代SAS，助力大型国有银行智能化营销数据挖掘
分布式架构的｜国产智能分析工具在银行交易中，20%的头部优质客户会给银行贡献80%的利润，而赢得一个新客户的成本是保留一个老客户的5至6倍。某大型国有银行在面临此类数据挖掘的业务时，使用的是SAS产品。由于SAS是集中式的，对单台服务器要求太高，算力无法支撑需求，且无法支持可视化的机器学习，对于业务人员来说使用门槛过高。在经过产品选型后，决定采用星环科技的智能分析工具Sophon替换原有SAS，用
KDD 2024 | 美团技术团队精选论文解读 & 论文分享会预告美团机器学习深度学习
ACMSIGKDD（KnowledgeDiscoveryandDataMining，简称KDD）是数据挖掘领域的国际顶级会议。KDDCup比赛是由SIGKDD主办的数据挖掘研究领域的国际顶级赛事，从1997年开始，每年举办一次，是目前数据挖掘领域最有影响力的赛事。本文精选了美团技术团队被KDD2024收录的5篇长文进行解读，覆盖了用户意图感知、机器学习&运筹优化、在线控制实验、联合广告模型、实时调
使用 Docker 安装 MongoDB 数据库 dockermongodb
byemanjusakafromhttps://www.emanjusaka.com/2024/01/docker-create-mongo-db彼岸花开可奈何本文欢迎分享与聚合，全文转载请留下原文地址。Docker安装命令dockerrun-d--namemongo--restart=always--privileged=true-p27017:27017-v/opt/doc/data:/dat
ThrustMaster HOTAS WARTHOG飞行摇杆评测孙卡电子地图飞行仿真操作系统传感器产品测试
本文及图片为3GO-353/Mickey原创,欢迎转载,但请注明原帖地址,谢谢!感谢东莞哈德提供摇杆评测.在国内，在飞行模拟外设经营的几年以来，Saitek几乎一直独占天下。但接触多几年飞行模拟的玩家，特别是现代空战方向的飞友，一定都记得HOTASCougar，一个1：1按照美国F-16战斗机上的操纵杆设计的全金属飞行摇杆，被不少人称为其是现代战机最高端最真实的摇杆。它就是来自ThrustMast
【C#深度学习之路】如何使用C#读取pickle类型的大模型文件来瓶霸王防脱发 C#深度学习之路 c#机器学习
【C#深度学习之路】如何使用C#读取pickle类型的大模型文件背景Pickle文件的结构及读取思路读取方法以压缩文件的方式加载Pickle类型文件读取Header的内容读取tensor的权重值该方法的不足总结本文为原创文章，若需要转载，请注明出处。原文地址：https://blog.csdn.net/qq_30270773/article/details/141367057项目对应的Github
【C#深度学习之路】如何使用C#实现Yolov8模型的训练和推理来瓶霸王防脱发 C#深度学习之路 c#机器学习图像处理视觉检测 YOLO
【C#深度学习之路】如何使用C#实现Yolov8模型的训练和推理项目背景算法实现模型结构项目展望写在最后项目下载链接本文为原创文章，若需要转载，请注明出处。原文地址：https://blog.csdn.net/qq_30270773/article/details/143529308项目对应的Github地址：https://github.com/IntptrMax/YoloSharpC#深度学习
【C#深度学习之路】如何使用C#实现Yolov11模型的训练和推理来瓶霸王防脱发 C#深度学习之路 c#深度学习 YOLO
【C#深度学习之路】如何使用C#实现Yolov11模型的训练和推理项目背景算法实现模型结构项目展望写在最后项目下载链接本文为原创文章，若需要转载，请注明出处。原文地址：https://blog.csdn.net/qq_30270773/article/details/143722404项目对应的Github地址：https://github.com/IntptrMax/YoloSharpC#深度学
转载一片Mac电脑iterm2配置rz、sz命令超级实用抹了岁月的杀猪刀 bash linux
rz、sz是什么意思？rz即recv-zmodem，receivezmodem接收协议（对服务器），对本机表现为上传。sz即send-zmodem，sendzmodem发送协议（对服务器），对本机表现为下载。zmodem是一种传输协议（属于SecureCRT），该协议只能可靠地传输大小不超过4GB的文件核心文件iterm2-recv-zmodem.sh#!/bin/bash#Author:Matt
如何在Windows系统下搭建GitLab Daniel的万事通杂货铺 gitlab
版权声明：本文为博主原创文章，遵循CC4.0BY-SA版权协议，转载请附上原文出处链接和本声明。本文链接：https://blog.csdn.net/weixin_44789022/article/details/135450056————————————————版权声明：本文为博主原创文章，遵循CC4.0BY-SA版权协议，转载请附上原文出处链接和本声明。原文链接：https://blog.cs
macOS Sequoia 15.2 发布下载，带来 Apple 智能重大更新 macos
macOSSequoia15.2(24C101)正式版ISO、IPSW、PKG下载iPhone镜像、Safari浏览器重大更新和AppleIntelligence等众多全新功能令Mac使用体验再升级请访问原文链接：https://sysin.org/blog/macOS-Sequoia/查看最新版。原创作品，转载请保留出处。作者主页：sysin.orgmacOSSequoia15.2(24C101
MDX语言的数据库交互 Linux520小飞鱼包罗万象 golang 开发语言后端
使用MDX语言进行数据库交互的深入探讨引言在当今数据驱动的时代，数据分析和数据挖掘的需求不断增加。多维数据分析工具和语言应运而生，其中MDX（多维表达式，MultidimensionalExpressions）便是一种非常重要的工具。MDX主要用于查询多维数据集（如OLAP数据立方体），在商业智能和数据仓库领域得到了广泛应用。本文将深入探讨MDX的基本概念、语法、应用场景以及与其他数据库交互的方式
macOS Sequoia 15.1.1 (24B91 | 24B2091) 正式版 ISO、IPSW、PKG 下载 macos
macOSSequoia15.1.1(24B91|24B2091)正式版ISO、IPSW、PKG下载iPhone镜像、Safari浏览器重大更新和AppleIntelligence等众多全新功能令Mac使用体验再升级请访问原文链接：https://sysin.org/blog/macOS-Sequoia/查看最新版。原创作品，转载请保留出处。作者主页：sysin.orgmacOSSequoia15
Oracle 迁移到 OB 过程中的函数改造案例
作者：杨敬博，爱可生DBA团队成员，一位会摄影、会铲屎、会打球、会骑车、生活可以自理的DBA。审校及补充：胡呈清，官永强，程柳润。爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。本文约1300字，预计阅读需要4分钟。问题描述客户源数据库（Oracle）中有使用XMLAGG函数对列拼接的需求。通过查询官方文档发现OceanBase3.x版本不支持XMLAGG相关函数，故使
python pycharm 书籍_一份超级完整实用的 PyCharm 图解教程，8K 字赶紧收藏起来 weixin_39841717 python pycharm 书籍
转载自今日头条：Python之眼PyCharm是一种PythonIDE，可以帮助程序员节约时间，提高生产效率。那么具体如何使用呢？本文从PyCharm安装到插件、外部工具、专业版功能等进行了一一介绍，希望能够帮助到大家。在本文中，我们并不会提供非常完善的指南，但是会介绍PyCharm最主要的一些能力，了解这些后，后面就需要我们在实践中再具体学习了。本文将介绍：PyCharm安装在PyCharm中写
C++：实现聚类算法（附带源码） Katie。 c c++实现算法算法聚类支持向量机
项目介绍聚类是无监督学习中一种常用的算法，用于将数据集中的对象分组（称为簇），使得同一簇中的对象相似度较高，而不同簇之间的对象相似度较低。在许多领域，如数据挖掘、图像处理和模式识别等，聚类算法都有广泛应用。在本项目中，我们将实现最常见的聚类算法之一——K均值聚类（K-MeansClustering）。该算法的目标是通过迭代的方式将数据集划分为K个簇，每个簇由其中心（均值）表示。项目实现思路输入参数
服务器是什么？ weixin_34258782
====转载于:https://www.cnblogs.com/Chamberlain/p/10739300.html
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts