Postgresql中国用户会

PostgreSQL aggregate function 3 : Aggregate Functions for Ordered-Set

Postgres2015全国用户大会将于11月20至21日在北京丽亭华苑酒店召开。本次大会嘉宾阵容强大，国内顶级PostgreSQL数据库专家将悉数到场，并特邀欧洲、俄罗斯、日本、美国等国家和地区的数据库方面专家助阵:

Postgres-XC项目的发起人铃木市一(SUZUKI Koichi)
Postgres-XL的项目发起人Mason Sharp
pgpool的作者石井达夫(Tatsuo Ishii)
PG-Strom的作者海外浩平(Kaigai Kohei)
Greenplum研发总监姚延栋
周正中(德哥), PostgreSQL中国用户会创始人之一
汪洋，平安科技数据库技术部经理
……

 
       2015年度PG大象会报名地址：http://postgres2015.eventdove.com/
PostgreSQL中国社区： http://postgres.cn/
PostgreSQL专业1群： 3336901（已满）
PostgreSQL专业2群： 100910388
PostgreSQL专业3群： 150657323

之前写了两篇关于一般聚合和统计类聚合的函数的用法,

http://blog.163.com/digoal@126/blog/static/16387704020152223539859/

http://blog.163.com/digoal@126/blog/static/1638770402015224124337/

本文主要讲一下分组排序聚合的例子.

Table 9-51. Ordered-Set Aggregate Functions

Function	Direct Argument Type(s)	Aggregated Argument Type(s)	Return Type	Description
`mode() WITHIN GROUP (ORDER BYsort_expression)`		any sortable type	same as sort expression	returns the most frequent input value (arbitrarily choosing the first one if there are multiple equally-frequent results)
`percentile_cont(fraction) WITHIN GROUP (ORDER BY sort_expression)`	`double precision`	`double precision`or `interval`	same as sort expression	continuous percentile: returns a value corresponding to the specified fraction in the ordering, interpolating between adjacent input items if needed
`percentile_cont(fractions) WITHIN GROUP (ORDER BY sort_expression)`	`double precision[]`	`double precision`or `interval`	array of sort expression's type	multiple continuous percentile: returns an array of results matching the shape of the `fractions`parameter, with each non-null element replaced by the value corresponding to that percentile
`percentile_disc(fraction) WITHIN GROUP (ORDER BY sort_expression)`	`double precision`	any sortable type	same as sort expression	discrete percentile: returns the first input value whose position in the ordering equals or exceeds the specified fraction
`percentile_disc(fractions) WITHIN GROUP (ORDER BY sort_expression)`	`double precision[]`	any sortable type	array of sort expression's type	multiple discrete percentile: returns an array of results matching the shape of the `fractions`parameter, with each non-null element replaced by the input value corresponding to that percentile

All the aggregates listed in Table 9-51 ignore null values in their sorted input. For those that take a fraction parameter, the fraction value must be between 0 and 1; an error is thrown if not. However, a null fraction value simply produces a null result.

mode比较好理解, 就是取分组中出现频率最高的值或表达式, 如果最高频率的值有多个, 则随机取一个.


    
    
    
    
     
     
     
     
      
      
      
      postgres=# create table test(id int, info text);
     
     
     
     
     
     
     
     
      
      
      
      CREATE TABLE
     
     
     
     
    
    
    
    
    
    
    
    
     
     
     
     
      
      
      
      postgres=# insert into test values (1,'test1');
     
     
     
     
     
     
     
     
      
      
      
      INSERT 0 1
     
     
     
     
     
     
     
     
      
      
      
      postgres=# insert into test values (1,'test1');
     
     
     
     
     
     
     
     
      
      
      
      INSERT 0 1
     
     
     
     
     
     
     
     
      
      
      
      postgres=# insert into test values (1,'test2');
     
     
     
     
     
     
     
     
      
      
      
      INSERT 0 1
     
     
     
     
     
     
     
     
      
      
      
      postgres=# insert into test values (1,'test3');
     
     
     
     
     
     
     
     
      
      
      
      INSERT 0 1
     
     
     
     
     
     
     
     
      
      
      
      postgres=# insert into test values (2,'test1');
     
     
     
     
     
     
     
     
      
      
      
      INSERT 0 1
     
     
     
     
     
     
     
     
      
      
      
      postgres=# insert into test values (2,'test1');
     
     
     
     
     
     
     
     
      
      
      
      INSERT 0 1
     
     
     
     
     
     
     
     
      
      
      
      postgres=# insert into test values (2,'test1');
     
     
     
     
     
     
     
     
      
      
      
      INSERT 0 1
     
     
     
     
     
     
     
     
      
      
      
      postgres=# insert into test values (3,'test4');
     
     
     
     
     
     
     
     
      
      
      
      INSERT 0 1
     
     
     
     
     
     
     
     
      
      
      
      postgres=# insert into test values (3,'test4');
     
     
     
     
     
     
     
     
      
      
      
      INSERT 0 1
     
     
     
     
     
     
     
     
      
      
      
      postgres=# insert into test values (3,'test4');
     
     
     
     
     
     
     
     
      
      
      
      INSERT 0 1
     
     
     
     
     
     
     
     
      
      
      
      postgres=# insert into test values (3,'test4');
     
     
     
     
     
     
     
     
      
      
      
      INSERT 0 1
     
     
     
     
    
    
    
    
    
    
    
    
     
     
     
     
      
      
      
      postgres=# insert into test values (3,'test4');
     
     
     
     
     
     
     
     
      
      
      
      INSERT 0 1
     
     
     
     
     
     
     
     
      
      
      
      postgres=# select * from test;
     
     
     
     
     
     
     
     
      
      
      
       id | info  
     
     
     
     
     
     
     
     
      
      
      
      ----+-------
     
     
     
     
     
     
     
     
      
      
      
        1 | test1
     
     
     
     
     
     
     
     
      
      
      
        1 | test1
     
     
     
     
     
     
     
     
      
      
      
        1 | test2
     
     
     
     
     
     
     
     
      
      
      
        1 | test3
     
     
     
     
     
     
     
     
      
      
      
        2 | test1
     
     
     
     
     
     
     
     
      
      
      
        2 | test1
     
     
     
     
     
     
     
     
      
      
      
        2 | test1
     
     
     
     
     
     
     
     
      
      
      
        3 | test4
     
     
     
     
     
     
     
     
      
      
      
        3 | test4
     
     
     
     
     
     
     
     
      
      
      
        3 | test4
     
     
     
     
     
     
     
     
      
      
      
        3 | test4
     
     
     
     
     
     
     
     
      
      
      
        3 | test4
     
     
     
     
     
     
     
     
      
      
      
      (12 rows)

取出所有数据中, 出现频率最高的info, 有可能是test1也有可能是test4, 因为他们的出现频率一致.

mode的返回结果数据类型和order by后面的表达式一致.

postgres=# select mode() within group (order by info) from test;

mode

-------

test1

(1 row)

如果按INFO来分组的话, 取出出现频率最高的info, 实际上这个操作是没有任何意义的, 返回值就是所有记录的info的唯一值.

postgres=# select mode() within group (order by info) from test group by info;

mode

-------

test1

test2

test3

test4

(4 rows)

按id来分组, 取出组内出现频率最高的info值, 这个是有意义的.

postgres=# select mode() within group (order by info) from test group by id;

mode

-------

test1

test4

(3 rows)

id=1 , 出现频率最高的info是test1. 出现2次.

如下 :

postgres=# select id,info,count(*) from test group by id,info;

id | info | count

----+-------+-------

1 | test1 | 2

1 | test3 | 1

3 | test4 | 5

1 | test2 | 1

2 | test1 | 3

(5 rows)

如果要返回mode()并返回频率次数. 可以使用row_number()窗口来实现. 如下.


    
    
    
    
     
     
     
     postgres=# select id,info,cnt from (select id,info,cnt,row_number() over(partition by id order by cnt desc) as rn from (select id,info,count(*) cnt from test group by id,info) t) t where t.rn=1;
    
    
    
    
    
    
    
    
     
     
     
      id | info  | cnt 
    
    
    
    
    
    
    
    
     
     
     
     ----+-------+-----
    
    
    
    
    
    
    
    
     
     
     
       1 | test1 |   2
    
    
    
    
    
    
    
    
     
     
     
       2 | test1 |   3
    
    
    
    
    
    
    
    
     
     
     
       3 | test4 |   5
    
    
    
    
    
    
    
    
     
     
     
     (3 rows)

其他, mode的返回结果数据类型和order by后面的表达式一致.

postgres=# select mode() within group (order by id) from test;

mode

------

(1 row)

postgres=# select mode() within group (order by id+1) from test;

mode

------

(1 row)

另外还有4个函数是和数据分布有关的, 需要指定从0到1的分布位置. 返回排序后, 在指定分布位置的值或表达式的值.

src/backend/utils/adt/orderedsetaggs.c

if (percentile < 0 || percentile > 1 || isnan(percentile))

ereport(ERROR,

(errcode(ERRCODE_NUMERIC_VALUE_OUT_OF_RANGE),

errmsg("percentile value %g is not between 0 and 1",

percentile)));

同时还需要注意区分连续分布和离散分布.


    
    
    
    
     
     
     
     postgres=# create table test(id int, info text);
    
    
    
    
    
    
    
    
     
     
     
     CREATE TABLE
    
    
    
    
    
    
    
    
     
     
     
     postgres=# insert into test values (1,'test1');
    
    
    
    
    
    
    
    
     
     
     
     INSERT 0 1
    
    
    
    
    
    
    
    
     
     
     
     postgres=# insert into test values (2,'test2');
    
    
    
    
    
    
    
    
     
     
     
     INSERT 0 1
    
    
    
    
    
    
    
    
     
     
     
     postgres=# insert into test values (3,'test2');
    
    
    
    
    
    
    
    
     
     
     
     INSERT 0 1
    
    
    
    
    
    
    
    
     
     
     
     postgres=# insert into test values (4,'test2');
    
    
    
    
    
    
    
    
     
     
     
     INSERT 0 1
    
    
    
    
    
    
    
    
     
     
     
     postgres=# insert into test values (5,'test2');
    
    
    
    
    
    
    
    
     
     
     
     INSERT 0 1
    
    
    
    
    
    
    
    
     
     
     
     postgres=# insert into test values (6,'test2');
    
    
    
    
    
    
    
    
     
     
     
     INSERT 0 1
    
    
    
    
    
    
    
    
     
     
     
     postgres=# insert into test values (7,'test2');
    
    
    
    
    
    
    
    
     
     
     
     INSERT 0 1
    
    
    
    
    
    
    
    
     
     
     
     postgres=# insert into test values (8,'test3');
    
    
    
    
    
    
    
    
     
     
     
     INSERT 0 1
    
    
    
    
    
    
    
    
     
     
     
     postgres=# insert into test values (100,'test3');
    
    
    
    
    
    
    
    
     
     
     
     INSERT 0 1
    
    
    
    
    
    
    
    
     
     
     
     postgres=# insert into test values (1000,'test4');
    
    
    
    
    
    
    
    
     
     
     
     INSERT 0 1
    
    
    
    
    
    
    
    
     
     
     
     postgres=# select * from test;
    
    
    
    
    
    
    
    
     
     
     
       id  | info  
    
    
    
    
    
    
    
    
     
     
     
     ------+-------
    
    
    
    
    
    
    
    
     
     
     
         1 | test1
    
    
    
    
    
    
    
    
     
     
     
         2 | test2
    
    
    
    
    
    
    
    
     
     
     
         3 | test2
    
    
    
    
    
    
    
    
     
     
     
         4 | test2
    
    
    
    
    
    
    
    
     
     
     
         5 | test2
    
    
    
    
    
    
    
    
     
     
     
         6 | test2
    
    
    
    
    
    
    
    
     
     
     
         7 | test2
    
    
    
    
    
    
    
    
     
     
     
         8 | test3
    
    
    
    
    
    
    
    
     
     
     
       100 | test3
    
    
    
    
    
    
    
    
     
     
     
      1000 | test4
    
    
    
    
    
    
    
    
     
     
     
     (10 rows)

取连续分布的中位数可以用 percentile_cont(0.5)来获得.

postgres=# select percentile_cont(0.5) within group (order by id) from test;

percentile_cont

-----------------

5.5

(1 row)

这个5.5是怎么计算来的呢? 参考本文末尾 :

If (CRN = FRN = RN) then the result is

(value of expression from row at RN)

Otherwise the result is

(CRN - RN) * (value of expression for row at FRN) +

(RN - FRN) * (value of expression for row at CRN)

解释 :


    
    
    
    
     
     
     
     
      
      
      
      N = 当前分组的行数 = 10
     
     
     
     
     
     
     
     
      
      
      
      RN = (1+传入参数*(N-1)) = (1+0.5*(10-1)) = 5.5
     
     
     
     
     
     
     
     
      
      
      
      CRN = ceiling(RN) = 6
     
     
     
     
     
     
     
     
      
      
      
      FRN = floor(RN) = 5
     
     
     
     
     
     
     
     
      
      
      
      value of expression for row at FRN : 当前分组内第FRN行的值 = 5
     
     
     
     
     
     
     
     
      
      
      
      value of expression for row at CRN : 当前分组内第CRN行的值 = 6
     
     
     
     
     
     
     
     
      
      
      
      所以最终中位数值 : 
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
           (CRN - RN) * (value of expression for row at FRN) +
      
      
      
      
      
      
      
      
       
       
       
           (RN - FRN) * (value of expression for row at CRN) = 
      
      
      
      
     
     
     
     
    
    
    
    
    
    
    
    
     
     
     
     (6-5.5)*(5) + (5.5 - 5)*(6) = 5.5;

使用info分组 :

postgres=# select percentile_cont(0.5) within group (order by id),info from test group by info;

percentile_cont | info

-----------------+-------

1 | test1

4.5 | test2

54 | test3

1000 | test4

(4 rows)

验证这个值4.5 | test2 :

2 | test2

3 | test2

4 | test2

5 | test2

6 | test2

7 | test2

N = 当前分组的行数 = 6

RN = (1+传入参数*(N-1)) = (1+0.5*(6-1)) = 3.5

CRN = ceiling(RN) = 4

FRN = floor(RN) = 3

value of expression for row at FRN : 当前分组内第FRN行的值 = 4

value of expression for row at CRN : 当前分组内第CRN行的值 = 5

所以最终中位数值 :

(CRN - RN) * (value of expression for row at FRN) +

(RN - FRN) * (value of expression for row at CRN) =

(4-3.5)*(4) + (3.5 - 3)*(5) = 4.5;

当输入参数为数组时, 返回值也是数组, 如下 :

postgres=# select percentile_cont(array[0.5, 1]) within group (order by id) from test;

percentile_cont

-----------------

{5.5,1000}

(1 row)

接下来看一下稀疏分布 :

返回行号大于等于指定百分比的值或表达式值.

例如 :

postgres=# select id from test;

------

100

1000

(10 rows)

当前组一共10行, 取位置在0.5的.即行号>=0.5*10的第一行的值或表达式的值.

postgres=# select percentile_disc(0.5) within group (order by id) from test;

percentile_disc

-----------------

(1 row)

postgres=# select percentile_disc(0.5) within group (order by id^2) from test;

percentile_disc

-----------------

(1 row)

输入0.11, 表示行号返回>=1.1的第一行的值.

postgres=# select percentile_disc(0.11) within group (order by id) from test;

percentile_disc

-----------------

(1 row)

再看个例子

postgres=# select id,info,count(*) over (partition by info) from test;

id | info | count

------+-------+-------

1 | test1 | 1

2 | test2 | 6

3 | test2 | 6

4 | test2 | 6

5 | test2 | 6

6 | test2 | 6

7 | test2 | 6

8 | test3 | 2

100 | test3 | 2

1000 | test4 | 1

(10 rows)

取分组的数据, 主要看test2 这个组一共有6行, 0.3*6=1.8, 所以它需要取第二行的数据.

postgres=# select info,percentile_disc(0.3) within group (order by id) from test group by info;

info | percentile_disc

-------+-----------------

test1 | 1

test2 | 3

test3 | 8

test4 | 1000

(4 rows)

[注意]

最终计算的是表达式的分布数, 而不是计算列值的分布数后再计算表达式.

验证如下 :

或者你可以看代码 :

postgres=# select percentile_cont(0.5) within group (order by id^2),info from test group by info;

percentile_cont | info

-----------------+-------

1 | test1

20.5 | test2

5032 | test3

1000000 | test4

(4 rows)

postgres=# select percentile_cont(0.5) within group (order by id),info from test group by info;

percentile_cont | info

-----------------+-------

1 | test1

4.5 | test2

54 | test3

1000 | test4

(4 rows)

postgres=# select 4.5^2;

?column?

---------------------

20.2500000000000000

(1 row)

postgres=# select 54^2;

?column?

----------

2916

(1 row)

[参考]

1. http://www.postgresql.org/docs/devel/static/functions-aggregate.html

2. http://blog.163.com/digoal@126/blog/static/16387704020152223539859/

3. http://blog.163.com/digoal@126/blog/static/1638770402015224124337/

4. http://blog.163.com/digoal@126/blog/static/16387704020137124851944

5. src/backend/utils/adt/orderedsetaggs.c

6. 算法 :


    
    
    
    
     
     
     
     PERCENTILE_CONT函数解释 : 
    
    
    
    
    
    
    
    
     
     
     
     The result of PERCENTILE_CONT is computed by linear interpolation between values after ordering them. Using the percentile value (P) and the number of rows (N) in the aggregation group, you can compute the row number you are interested in after ordering the rows with respect to the sort specification. This row number (RN) is computed according to the formula RN = (1+(P*(N-1)). The final result of the aggregate function is computed by linear interpolation between the values from rows at row numbers CRN = CEILING(RN) and FRN = FLOOR(RN).
    
    
    
    
    
    
    
    
     
     
     
     

    
    
    
    
    
    
    
    
     
     
     
     The final result will be:
    
    
    
    
    
    
    
    
     
     
     
     

    
    
    
    
    
    
    
    
     
     
     
       If (CRN = FRN = RN) then the result is
    
    
    
    
    
    
    
    
     
     
     
         (value of expression from row at RN)
    
    
    
    
    
    
    
    
     
     
     
       Otherwise the result is
    
    
    
    
    
    
    
    
     
     
     
         (CRN - RN) * (value of expression for row at FRN) +
    
    
    
    
    
    
    
    
     
     
     
         (RN - FRN) * (value of expression for row at CRN)
    
    
    
    
    
    
    
    
     
     
     
     

    
    
    
    
    
    
    
    
     
     
     
     
      
      
      
      PERCENTILE_DISC函数解释 : 
     
     
     
     
     
     
     
     
      
      
      
      The first expr must evaluate to a numeric value between 0 and 1, because it is a percentile value. This expression must be constant within each aggregate group. The ORDER BY clause takes a single expression that can be of any type that can be sorted.
     
     
     
     
     
     
     
     
      
      
      
      

     
     
     
     
     
     
     
     
      
      
      
      For a given percentile value P, PERCENTILE_DISC sorts the values of the expression in the ORDER BY clause and returns the value with the smallest CUME_DIST value (with respect to the same sort specification) that is greater than or equal to P.
     
     
     
     
    
    
    
    
    
    
    
    
     
     
     
     

    
    
    
    
    
    
    
    
     
     
     
     MEDIAN(中位数)详解, Oracle有单独的计算中位数的函数, 实际上就是PERCENTILE_CONT(0.5) : 
    
    
    
    
    
    
    
    
     
     
     
     MEDIAN is an inverse distribution function that assumes a continuous distribution model. It takes a numeric or datetime value and returns the middle value or an interpolated value that would be the middle value once the values are sorted. Nulls are ignored in the calculation.
    
    
    
    
    
    
    
    
     
     
     
     

    
    
    
    
    
    
    
    
     
     
     
     This function takes as arguments any numeric data type or any nonnumeric data type that can be implicitly converted to a numeric data type. If you specify only expr, then the function returns the same data type as the numeric data type of the argument. If you specify the OVER clause, then Oracle Database determines the argument with the highest numeric precedence, implicitly converts the remaining arguments to that data type, and returns that data type.
    
    
    
    
    
    
    
    
     
     
     
     The result of MEDIAN is computed by first ordering the rows. Using N as the number of rows in the group, Oracle calculates the row number (RN) of interest with the formula RN = (1 + (0.5*(N-1)). The final result of the aggregate function is computed by linear interpolation between the values from rows at row numbers CRN = CEILING(RN) and FRN = FLOOR(RN).
    
    
    
    
    
    
    
    
     
     
     
     

    
    
    
    
    
    
    
    
     
     
     
     The final result will be:
    
    
    
    
    
    
    
    
     
     
     
     

    
    
    
    
    
    
    
    
     
     
     
     if (CRN = FRN = RN) then
    
    
    
    
    
    
    
    
     
     
     
           (value of expression from row at RN)
    
    
    
    
    
    
    
    
     
     
     
        else
    
    
    
    
    
    
    
    
     
     
     
           (CRN - RN) * (value of expression for row at FRN) +
    
    
    
    
    
    
    
    
     
     
     
           (RN - FRN) * (value of expression for row at CRN)

技术大佬和普通程序员改bug的区别！程序员干货站大数据编程语言 java 人工智能数据分析
阅读本文大概需要2min文/强哥；未经授权禁止转载在我这么多年的工作生涯里，难免遇到那些工作糊弄的开发同事，随意编程的实习生，不够细致的测试，缺乏专业度的产品...产品的体验，取决于多个环节的把控，但很多情况下，由于bug严重影响体验，或者直接造成产品事故的，那么开发想甩锅都甩不掉！今天就给大家从几方面讲讲，经验丰富的程序员，是怎么debug的！1、并不是所有bug都需要修复修bug有个前提，那就
【网络安全 | 漏洞挖掘】通过控制台调试实现登录秋说 web安全漏洞挖掘
未经许可，不得转载。文章目录正文在安全测试过程中，我留意到一个特殊现象：当登录出现错误时，相关请求包并不经过BurpSuite。那么此时账号密码是储存在前端的，我通过调试即可实现登录管理员账户。正文由于系统设定，输入错误的账号和密码会弹出“账号密码错误”的提示。基于此，我在代码中“账号密码错误”提示的相关位置设置了断点，截图如下：随后，我刷新浏览器页面，输入错误的账号和密码，然后点击登录按钮，操作
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
网络不可达 shenmu84 网络服务器运维
导致此问题原因较多，我只针对一种情况进行讨论，如果和文中症状不同，另寻他处，或者死马当活马医（？）如需转载，标记出处症状：1.ping命令网络不可达2.ifconfig中网卡ens33看不到你的ipV4地址原因:网卡掉线了解决办法：查看网卡名称：（比如上图就是我的ens33网卡没有ipv4地址，那就是它）iplinkshow我的用这个命令关闭并开启网卡sudoifconfigdownsudoifc
小白学AI量化：DeepSeek+Python构建强大的金融数据挖掘与多维分析机器人老余捞鱼 AI顾投高级策略 AI探讨与学习人工智能 python 金融 deepseek
作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话：在机构主导的量化交易时代，普通投资者如何用一杯奶茶的钱（15元/天）打造专业级智能量化产品？本文将为您揭秘一个革命性的解决方案——基于国产大模型DeepSeek和Python构建的智能数据挖掘分析机器人。它不仅适用于通用网页数据抓取，更能深度应用于金融领域，精准捕捉市场信号。本文“干货”很多，请务必耐心读完。一、颠覆认知的性价比革命1.
数据挖掘实战-基于机器学习的垃圾邮件检测模型艾派森数据挖掘实战合集数据挖掘机器学习人工智能 python
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
HarmonyOS Next 应用性能优化实战 SameX-4869 harmonyos 性能优化华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）中应用性能优化的技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、性能评估指标与工具（一）关键性能评估指标CPU使用率CPU使用率是衡量应用在运行过程中对CPU资源占用情况的重要指标。一个高效的Ha
HarmonyOS Next 企业级移动办公应用构建 SameX-4869 harmonyos 华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）在企业级移动办公应用构建中的应用，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。第一章：应用场景与架构规划一、常见应用场景及要求任务管理在企业办公中，任务管理是核心场景之一。员工需要能够创建任务，详细描述任务
记录:(error) NOAUTH Authentication required...【解决方案】 bug菌¹ 全栈Bug调优(实战版)#CSDN问答解惑(全栈版)redis连接报错 Authentication
‍作者：bug菌✏️博客：CSDN、掘金等公众号：猿圈奇妙屋特别声明：原创不易，转载请附上原文出处链接和本文声明，谢谢配合。版权声明：文章里可能部分文字或者图片来源于互联网或者百度百科，如有侵权请联系bug菌处理。一、前言环境版本：centos7.6+redis6.2.6+xshell5二、排错通过xshell5远程连接阿里云服务器，内核是cent
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略一个处女座的程序猿资深文章(前沿/经验/创新)DataScience ML 数据科学数据科学的生命周期机器学习
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略导读：本文章是博主在数据科学和机器学习领域，先后实战过几百个应用案例之后的精心总结，应该是完全覆盖了数据科学的整个生命周期及其各个阶段的要点。其中机器学习领域六大阶段更是在整个数据科学生命周期中扮演着极其重要的角色。同时，因为涉及到博主出书中出版社要求在
OpenGL ES 如何渲染 16bit 图像？字节流动 OpenGL ES 3.0 OpenGLES 音视频图形渲染 Android c++
未经作者（微信ID：Byte-Flow）允许，禁止转载文章首发于公众号：字节流动最近有不少读者私信问OpenGLES如何处理16bit图像（P010）？然后我直接贴给他们一段在OpenGL环境下验证过的上传16bit图像数据的代码glTexImage2D(GL_TEXTURE_2D,0,GL_R16UI,width,height,0,GL_RED_INTEGER,GL_UNSIGNED_SHORT
HarmonyOS Next 安全机制深度剖析 SameX-4869 harmonyos 华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）的安全机制相关技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。第一章：安全体系架构一、整体架构介绍HarmonyOSNext的安全体系架构犹如一座坚固的城堡，从多个层面为系统和应用提供全方位的保护。它
Windows 11 24H2 中文版、英文版 (x64、ARM64) 下载 (2025 年 3 月更新) windows
Windows1124H2中文版、英文版(x64、ARM64)下载(2025年3月更新)Windows11,version24H2EnterpriseArm64x64(updatedMar2025)请访问原文链接：https://sysin.org/blog/windows-11/查看最新版。原创作品，转载请保留出处。作者主页：sysin.org全新Windows体验，让您与热爱的人和事物离得更近
EnerVerse：智元机器人提出首个机器人4D世界模型，在动作规划任务中达到SOTA水平强化学习曾小健机器人
EnerVerse：智元机器人提出首个机器人4D世界模型，在动作规划任务中达到SOTA水平PNP机器人PNP机器人2025年02月10日21:04上海本文来自：公众号智元机器人https://sites.google.com/view/enerverse，出于学术/技术分享进行转载，如有侵权，联系删文。EnerVerse的科研核心团队由智元机器人研究院的具身算法精英组成。黄思渊，作为上海交通大学与
Docker国内设置镜像加速下载地址黯然神伤888 docker docker
原先当我们配置好阿里云的镜像服务后，通过dockerpull拉取镜像很方便，但是随着阿里这方面的相关政策调整后，发现很多拉取镜像都出现了问题，无法正常拉取，自己构建镜像又嫌烦。正好在简书上看到有个老铁发了其他docker加速地址，试了下挺管用，就转载保存下分享给大家，如果使用阿里云镜像服务无法拉起镜像的话，可以试试下面的镜像地址1、目的国内的镜像很容易被屏蔽，导致dockerpull失败，需要手动
python基于Django的旅游景点数据分析及可视化的设计与实现 7blk7 qq2295116502 python django 数据分析
目录项目介绍技术栈具体实现截图Scrapy爬虫框架关键技术和使用的工具环境等的说明解决的思路开发流程爬虫核心代码展示系统设计论文书写大纲详细视频演示源码获取项目介绍大数据分析是现下比较热门的词汇，通过分析之后可以得到更多深入且有价值的信息。现实的科技手段中，越来越多的应用都会涉及到大数据随着大数据时代的到来，数据挖掘、分析与应用成为多个行业的关键,本课题首先介绍了网络爬虫的基本概念以及技术实现方法
数据分析面临的三大挑战该如何解决銨靜菂等芐紶数据挖掘大数据数据分析
转载自品略图书馆http://www.pinlue.com/article/2020/09/0712/2611202048648.html有效的分析已成为决定性因素，很明显，掌握它的人会蓬勃发展。但是，实现这一目标的过程并非没有障碍。最常见的数据分析挑战是什么？公司如何自信地应对它们？下面就来介绍一下。1、浏览预算限制数据分析领导者需要在当下采取行动，但同时也需要考虑未来。平衡这些需求要求他们在制
Kafka深度解析 GarfieldEr007 Kafka/MQ Kafka 深度解析 MQ
原创文章，转载请务必将下面这段话置于文章开头处（保留超链接）。本文转发自Jason’sBlog，原文链接http://www.jasongj.com/2015/01/02/Kafka深度解析背景介绍Kafka简介Kafka是一种分布式的，基于发布/订阅的消息系统。主要设计目标如下：以时间复杂度为O(1)的方式提供消息持久化能力，即使对TB级以上数据也能保证常数时间的访问性能高吞吐率。即使在非常廉价
iOS接入微信支付（小白都能看懂的微信支付）马拉萨的春天功能模块一天一读基础知识点
因为近期项目中需要接入微信支付功能，自己也爬了很多的坑，所以做了一下这边文章供大家学习参考，远离爬坑，文章主要讲到以下五部分：一、填写商户平台所需资料二、具体Demo代码@Github下载地址本文为本人学习记录笔记，如需转载，请注明出处@iOS_lyon填写商户平台所需资料一、填写经营信息@查看截图指引下图选择不同的类目，所需要上传的资料也是有所不同的，下图拿其它为例子填写经营信息二、填写商户信息
Qt 自定义标题栏——QtWidgets 十年之少 Qt Widgets Qt 自定义标题栏
1.去掉标题栏，实现窗体拖动（常用）以上转载方法实现窗体拖动是通过Windows事件的；但是有时候为了跨平台这种的话就得重写，比较麻烦，所以还是采用最原始的方法：通过QWidgets的鼠标事件来实现。.h文件classQRCodeDialog:publicQDialog{Q_OBJECT...protected:voidmouseMoveEvent(QMouseEvent*event)overri
C语言：setjmp和longjmp函数使用详解 houxiaoni01 C语言 setjmp longjmp
转载自：https://www.runoob.com/cprogramming/c-standard-library-setjmp-h.htmlhttps://blog.csdn.net/chenyiming_1990/article/details/86834131、C标准库-简介setjmp.h头文件定义了宏setjmp()、函数longjmp()和变量类型jmp_buf，该变量类型会绕过正常
这些搜索技巧你不会？前端后端
Hey,我是沉浸式趣谈本文首发于【沉浸式趣谈】，我的个人博客https://yaolifeng.com也同步更新。转载请在文章开头注明出处和版权信息。如果本文对您有所帮助，请点赞、评论、转发，支持一下，谢谢！每天搜索，你却只会简单输入几个词？搜索结果总被广告和无关内容淹没？掌握这些搜索技巧，让你不再在信息海洋中迷失，直达目标信息！基础搜索技巧1.多关键词搜索方式：关键词1关键词2关键词3例如：Py
python中的构造函数 weixin_30770495 python
python中构造函数可以这样写classclassname（）：def——init——（self）：#构造函数函数体转载于:https://www.cnblogs.com/begoogatprogram/p/4649076.html
基于Python的智能决策支持系统：实现智能化决策的关键要素 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
文章目录基于Python的智能决策支持系统：实现智能化决策的关键要素11.背景介绍2.核心概念与联系数据收集与预处理模型构建与训练决策规则生成与优化决策结果评估与反馈3.核心算法原理具体操作步骤数据挖掘算法机器学习算法优化算法4.数学模型和公式详细讲解举例说明线性回归模型最小二乘法5.项目实践：代码实例和详细解释说明6.实际应用场景金融领域医疗领域供应链管理智能制造7.工具和资源推荐编程语言和开发
Kotlin by属性委托赵彦军 Kotlin实战指南 kotlin属性委托 kotlin by by委托
转载请标明出处：http://blog.csdn.net/zhaoyanjun6/article/details/119939781本文出自【赵彦军的博客】文章目录属性委托要求委托原理实战演练，SharedPreference委托升级之旅ReadWriteProperty延迟委托Lazy在Kotlin中，通过by实现属性委托，属性委托是什么意思呢？简单来说，就是属性的set、get的操作，交给另一
知识管理系统：构建企业智慧大脑 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
第一部分：知识管理概述与重要性第1章：知识管理的定义与基本概念1.1.1知识管理的起源与发展知识管理（KnowledgeManagement，KM）起源于20世纪80年代，当时企业在市场竞争中逐渐意识到知识作为一种战略资源的重要性。早期的知识管理实践主要集中在知识的收集、存储和传播上。随着信息技术的发展，知识管理逐渐融入了更先进的技术手段，如数据挖掘、人工智能和大数据分析，使其成为一个跨学科、多领
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
OceanBase数据库常用巡检SQL MoMoSQL666 数据库 oceanbase mysql sql
本文为墨天轮数据库管理服务团队原创内容，如需转载请联系小墨（VX：modb666）并注明来源。一、版本信息select*frominformation_schema.GLOBAL_VARIABLESWHEREVARIABLE_NAMElike'version%';二、集群状态select*fromoceanbase.v$ob_cluster;三、服务器状态检查所有服务器的状态，包括这个Server
【SoC基础】单片机之寄存器解析望闻问嵌 #SoC 单片机嵌入式硬件
：如果你也对机器人、人工智能感兴趣，看来我们志同道合✨：不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】：文章若有幸对你有帮助，可点赞收藏⭐不迷路：内容若有错误，敬请留言指正！原创文，转载注明出处文章目录1、寄存器位置2、寄存器种类2.1通用用途寄存器2.2CPU执行相关寄存器2.3外设控制寄存器3.寄存器在CPU访问外设过程中起到的作用1、寄
Python 生成数据(使用Pygal模拟掷骰子) 钢铁男儿 Python 从入门到精通 python 开发语言
数据可视化指的是通过可视化表示来探索数据，它与数据挖掘紧密相关，而数据挖掘指的是使用代码来探索数据集的规律和关联。数据集可以是用一行代码就能表示的小型数字列表，也可以是数以吉字节的数据。使用Pygal模拟掷骰子在本节中，我们将使用Python可视化包Pygal来生成可缩放的矢量图形文件。对于需要在尺寸不同的屏幕上显示的图表，这很有用，因为它们将自动缩放，以适合观看者的屏幕。如果你打算以在线方式使用
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

PostgreSQL aggregate function 3 : Aggregate Functions for Ordered-Set

你可能感兴趣的:(数据挖掘,转载)