wzy0623

HAWQ取代传统数仓实践（十九）——OLAP

一、OLAP简介

1. 概念

OLAP是英文是On-Line Analytical Processing的缩写，意为联机分析处理。此概念最早由关系数据库之父E.F.Codd于1993年提出。OLAP允许以一种称为多维数据集的结构，访问业务数据源经过聚合和组织整理后的数据。以此为标准，OLAP作为单独的一类技术同联机事务处理（On-Line Transaction Processing，OLTP）得以明显区分。
在计算领域，OLAP是一种快速应答多维分析查询的方法，也是商业智能的一个组成部分，与之相关的概念还包括数据仓库、报表系统、数据挖掘等。数据仓库用于数据的存储和组织，OLAP集中于数据的分析，数据挖掘则致力于知识的自动发现，报表系统则侧重于数据的展现。OLAP系统从数据仓库中的集成数据出发，构建面向分析的多维数据模型，再使用多维分析方法从多个不同的视角对多维数据集合进行分析比较，分析活动以数据驱动。通过使用OLAP工具，用户可以从多个视角交互式地查询多维数据。
OLAP由三个基本的分析操作构成：合并（上卷）、下钻和切片。合并是指数据的聚合，即数据可以在一个或多个维度上进行累积和计算。例如，所有的营业部数据被上卷到销售部门以分析销售趋势。下钻是一种由汇总数据向下浏览细节数据的技术。比如用户可以从产品分类的销售数据下钻查看单个产品的销售情况。切片则是这样一种特性，通过它用户可以获取OLAP立方体中的特定数据集合，并从不同的视角观察这些数据。这些观察数据的视角就是我们所说的维度。例如通过经销商、日期、客户、产品或区域等等，查看同一销售事实。
OLAP系统的核心是OLAP立方体，或称为多维立方体或超立方体。它由被称为度量的数值事实组成，这些度量被维度划分归类。一个OLAP立方体的例子如图1所示，数据单元位于立方体的交叉点上，每个数据单元跨越产品、时间、地区等多个维度。通常使用一个矩阵接口操作OLAP立方体，例如电子表格程序的数据透视表，可以按维度分组执行聚合或求平均值等操作。立方体的元数据一般由关系数据库中的星型模式或雪花模式生成，度量来自事实表的记录，维度来自维度表。

图1

2. 分类

通常可以将联机分析处理系统分为MOLAP、ROLAP、HOLAP三种类型。
（1）MOLAP
MOLAP（multi-dimensional online analytical processing）是一种典型的OLAP形式，甚至有时就被用来表示OLAP。MOLAP将数据存储在一个经过优化的多维数组中，而不是存储在关系数据库中。某些MOLAP工具要求预先计算并存储计算后的结果数据，这种操作方式被称为预处理。MOLAP工具一般将预计算后的数据集合作为一个数据立方体使用。对于给定范围的问题，立方体中的数据包含所有可能的答案。预处理的好处是可以对问题作出非常快速地响应。然而另一方面，依赖于预计算的聚合程度，装载新数据可能会花费很长的时间。另外还有些MOLAP工具，尤其是那些实现了某些数据库功能的MOLAP工具，并不预先计算原始数据，而是在需要时才进行计算。
MOLAP的优点：

优化的数据存储、多维数据索引和缓存带来的快速查询性能。
相对于关系数据库，可以通过压缩技术，使数据存储需要更小的磁盘空间。
MOLAP工具一般能够自动进行高级别的数据聚合。
对于低基数维度的数据集合是紧凑的。
数组模型提供了原生的索引功能。

MOLAP的缺点：

某些MOLAP解决方案中的处理步骤可能需要很长的时间，尤其是当数据量很大时。要解决这个问题，通常只能增量处理变化的数据，而不是预处理整个数据集合。
可能引入较多的数据冗余。

MOLAP产品：
商业的MOLAP产品主要有Cognos Powerplay、Oracle Database OLAP Option、MicroStrategy、Microsoft Analysis Services、Essbase等。

（2）ROLAP
ROLAP直接使用关系数据库存储数据，不需要执行预计算。基础的事实数据及其维度表作为关系表被存储，而聚合信息存储在新创建的附加表中。ROLAP以数据库模式设计为基础，操作存储在关系数据库中的数据，实现传统的OLAP数据切片和分块功能。本质上讲，每种数据切片或分块行为都等同于在SQL语句中增加一个“WHERE”子句的过滤条件。ROLAP不使用预计算的数据立方体，取而代之的是查询标准的关系数据库表，返回回答问题所需的数据。与预计算的MOLAP不同，ROLAP工具有能力回答任意相关的数据分析问题，因为该技术不受立方体内容的限制。通过ROLAP还能够下钻到数据库中存储的最细节的数据。
由于ROLAP使用关系数据库，通常数据库模式必须经过仔细设计。为OLTP应用设计的数据库不能直接作为ROLAP数据库使用，这种投机取巧的做法并不能使ROLAP良好工作。因此ROLAP仍然需要创建额外的数据拷贝。但不管怎样，ROLAP毕竟用的是数据库，各种各样的数据库设计与优化技术都可以被有效利用。

ROLAP的优点：

在处理大量数据时，ROLAP更具可伸缩性，尤其是当模型中包含的维度具有很高的基数，例如，维度表中有上百万的成员时。
有很多可选用的数据装载工具，并且能够针对特定的数据模型精细调整ETL代码，数据装载所需时间通常比自动化的MOLAP装载少的多。
因为数据存储于标准关系数据库中，可以使用SQL报表工具访问数据，而不必是专有的OLAP工具。
ROLAP更适合处理非聚合的事实，例如文本型描述。在MOLAP工具中查询文本型元素时性能会相对较差。
通过将数据存储从多维模型中解耦出来，相对于用使用严格的维度模型，这种更普通的关系模型增加了成功建模的可能性。
ROLAP方法可以利用数据库的权限控制，例如通过行级安全性设置，可以用事先设定的条件过滤查询结果。例如Oracle的VPD技术，能够根据连接的用户自动在查询的SQL语句中拼接WHERE谓词条件。

ROLAP的缺点：

业界普遍认为ROLAP工具比MOLAP查询速度慢。
聚合表的数据装载必须由用户自己定制的ETL代码控制。ROLAP工具不能自动完成这个任务，这意味着额外的开发工作量。
如果跳过创建聚合表的步骤，查询性能会大打折扣，因为不得不查询大量的细节数据表。虽然可以通过适当建立聚合表缓解性能问题，但对所有维度表及其属性的组合创建聚合表是不切实际的。
ROLAP依赖于针对通用查询或缓存目标的数据库，因此并没有提供某些MOLAP工具所具有的特殊技术，如透视表等。但是现代ROLAP工具可以利用SQL语言中的CUBE、ROLLUP操作或其它SQL OLAP扩展。随着这些SQL扩展的逐步完善，MOLAP工具的优势也不那么明显了。
因为ROLAP工具的所有计算都依赖于SQL，对于某些不易转化为SQL的计算密集型模型，ROLAP不再适用。例如包含预算、拨款等条目的复杂财务报表或地理位置计算的场景。

ROLAP产品：
使用ROLAP的商业产品包括Microsoft Analysis Services、MicroStrategy、SAP Business Objects、Oracle Business Intelligence Suite Enterprise Edition、 Tableau Software等等。也有开源的ROLAP服务器，如Mondrian。

（3）HOLAP
在额外的ETL开发成本与缓慢的查询性能之间难以选择，正是因为这种情况，现在大部分商业OLAP工具都使用一种混合型（Hybrid）方法，它允许模型设计者决定哪些数据存储在MOLAP中，哪些数据存储在ROLAP中。除了把数据划分成传统关系型存储和专有存储，业界对混合型OLAP并没有清晰的定义。例如，某些厂商的HOLAP数据库使用关系表存储大量的细节数据，而是用专用表保存少量的聚合数据。HOLAP结合了MOLAP和ROLAP两种方法的优点，可以同时利用预计算的多维立方体和关系数据源。HOLAP有以下两种划分数据的策略。

垂直分区。这种模式的HOLAP将聚合数据存储在MOLAP中，以支持良好的查询性能，而把细节数据存储在ROLAP中以减少立方体处理所需时间。
水平分区。这种模式的HOLAP按数据热度划分，将某些最近使用的数据分片存储在MOLAP中，而将老的数据存储在ROLAP。

3. 性能

OLAP分析所需的原始数据量是非常庞大的。一个分析模型，往往会涉及数千万或数亿条甚至更多的数据，而且分析模型中包含多个维度数据，这些维度又可以由用户作任意的组合。这样的结果就是大量的实时运算导致过长的响应时间。想象一个1000万条记录的分析模型，如果一次提取4个维度进行组合分析，每个维度有10个不同的取值，理论上的运算次数将达到10的12次方。这样的运算量将导致数十分钟乃至更长的等待时间。如果用户对维组合次序进行调整，或增加、或减少某些维度的话，又将是一个重新的计算过程。
从上面的分析中可以得出结论，如果不能解决OLAP运算效率问题的话，OLAP将只会是一个没有实用价值的概念。在OLAP的发展历史中，常见的解决方案是用多维数据库代替关系数据库设计，将数据根据维度进行最大限度的聚合运算，运算中会考虑到各种维度组合情况，运算结果将生成一个数据立方体，并保存在磁盘上，用这种预运算方式提高OLAP的速度。例如Kylin就是使用这种以空间换时间的方式来提高查询速度，而HAWQ在性能上的优势，也使它较为适合OLAP应用。HAWQ与Hive的性能对比，参见“HAWQ与Hive查询性能对比测试”。（http://blog.csdn.net/wzy0623/article/details/71479539）

二、OLAP实例

要做好OLAP类的应用，需要对业务数据有深入的理解。只有了解了业务，才能知道需要分析哪些指标，从而有的放矢地剖析相关数据，得出可信的结论来辅助决策。下面就以销售订单数据仓库为例，提出若干问题，然后使用HAWQ查询数据以回答这些问题：

每种产品类型以及单个产品的累积销售量和销售额是多少？
每种产品类型以及单个产品在每个省、每个城市的月销售量和销售额趋势是什么？
每种产品类型销售量和销售额和同比如何？
每个省以及每个城市的客户数量及其消费金额汇总是多少？
迟到订单的比例是多少？
客户年消费金额的平均数和中位数是多少？
客户年消费金额分布处于25%、50%、75%位置的消费金额是多少？
客户年消费金额为“高”、“中”、“低”档的人数及消费金额所占比例是多少？
每个城市按销售金额排在前三位的商品是什么？
所有产品的销售百分比排名？

1. 每种产品类型以及单个产品的累积销售量和销售额是多少？

使用HAWQ的group by rollup求小计和总计。

dw=> select t2.product_category, t2.product_name, sum(nq), sum(order_amount)
dw->   from v_sales_order_fact t1, product_dim t2 
dw->  where t1.product_sk = t2.product_sk
dw->  group by rollup (t2.product_category, t2.product_name)
dw->  order by t2.product_category, t2.product_name; 
 product_category |  product_name   | sum |    sum    
------------------+-----------------+-----+-----------
 monitor          | flat panel      |     |  49666.00
 monitor          | lcd panel       |  11 |   3087.00
 monitor          |                 |  11 |  52753.00
 peripheral       | keyboard        |  38 |  67387.00
 peripheral       |                 |  38 |  67387.00
 storage          | floppy drive    |  52 | 348655.00
 storage          | hard disk drive |  80 | 375481.00
 storage          |                 | 132 | 724136.00
                  |                 | 181 | 844276.00
(9 rows)

2. 每种产品类型以及单个产品在每个省、每个城市的月销售量和销售额是多少？

查询语句与上一个问题类似，只是多关联了邮编维度表，并且在group by rollup中增加了省、市两列。

dw=> select t2.product_category, t2.product_name, t3.state, t3.city, sum(nq), sum(order_amount)
dw->   from v_sales_order_fact t1, product_dim t2, zip_code_dim t3 
dw->  where t1.product_sk = t2.product_sk
dw->    and t1.customer_zip_code_sk = t3.zip_code_sk
dw->  group by rollup (t2.product_category, t2.product_name, t3.state, t3.city)
dw->  order by t2.product_category, t2.product_name, t3.state, t3.city; 
 product_category |  product_name   | state |     city      | sum |    sum    
------------------+-----------------+-------+---------------+-----+-----------
 monitor          | flat panel      | oh    | cleveland     |     |   7431.00
 monitor          | flat panel      | oh    |               |     |   7431.00
 monitor          | flat panel      | pa    | mechanicsburg |     |  10630.00
 monitor          | flat panel      | pa    | pittsburgh    |     |  31605.00
 monitor          | flat panel      | pa    |               |     |  42235.00
 monitor          | flat panel      |       |               |     |  49666.00
 monitor          | lcd panel       | pa    | pittsburgh    |  11 |   3087.00
 monitor          | lcd panel       | pa    |               |  11 |   3087.00
 monitor          | lcd panel       |       |               |  11 |   3087.00
 monitor          |                 |       |               |  11 |  52753.00
 peripheral       | keyboard        | oh    | cleveland     |  38 |  10875.00
 peripheral       | keyboard        | oh    |               |  38 |  10875.00
 peripheral       | keyboard        | pa    | mechanicsburg |     |  29629.00
 peripheral       | keyboard        | pa    | pittsburgh    |     |  26883.00
 peripheral       | keyboard        | pa    |               |     |  56512.00
 peripheral       | keyboard        |       |               |  38 |  67387.00
 peripheral       |                 |       |               |  38 |  67387.00
 storage          | floppy drive    | oh    | cleveland     |     |   8229.00
 storage          | floppy drive    | oh    |               |     |   8229.00
 storage          | floppy drive    | pa    | mechanicsburg |     | 140410.00
 storage          | floppy drive    | pa    | pittsburgh    |  52 | 200016.00
 storage          | floppy drive    | pa    |               |  52 | 340426.00
 storage          | floppy drive    |       |               |  52 | 348655.00
 storage          | hard disk drive | oh    | cleveland     |     |   8646.00
 storage          | hard disk drive | oh    |               |     |   8646.00
 storage          | hard disk drive | pa    | mechanicsburg |  80 | 194444.00
 storage          | hard disk drive | pa    | pittsburgh    |     | 172391.00
 storage          | hard disk drive | pa    |               |  80 | 366835.00
 storage          | hard disk drive |       |               |  80 | 375481.00
 storage          |                 |       |               | 132 | 724136.00
                  |                 |       |               | 181 | 844276.00
(31 rows)

3. 每种产品类型销售量和销售额和同比如何？

需要查询周期快照v_month_end_sales_order_fact。

dw=> select t2.product_category, 
dw->        t1.year_month,
dw->        sum(quantity1) quantity_cur,
dw->        sum(quantity2) quantity_pre,   
dw->        round((sum(quantity1) - sum(quantity2)) / sum(quantity2),2) pct_quantity,
dw->        sum(amount1) amount_cur,
dw->        sum(amount2) amount_pre,
dw->        round((sum(amount1) - sum(amount2)) / sum(amount2),2) pct_amount
dw->   from (select t1.product_sk,  
dw(>                t1.year_month, 
dw(>                t1.month_order_quantity quantity1,
dw(>                t2.month_order_quantity quantity2,         
dw(>                t1.month_order_amount amount1,
dw(>                t2.month_order_amount amount2
dw(>           from v_month_end_sales_order_fact t1   
dw(>           join v_month_end_sales_order_fact t2 
dw(>             on t1.product_sk = t2.product_sk  
dw(>            and t1.year_month/100 = t2.year_month/100 + 1  
dw(>            and t1.year_month - t1.year_month/100*100 = t2.year_month - t2.year_month/100*100) t1,
dw->         product_dim t2
dw->   where t1.product_sk = t2.product_sk
dw->   group by t2.product_category, t1.year_month
dw->   order by t2.product_category, t1.year_month;  
 product_category | year_month | quantity_cur | quantity_pre | pct_quantity | amount_cur | amount_pre | pct_amount 
------------------+------------+--------------+--------------+--------------+------------+------------+------------
 storage          |     201705 |          943 |              |              |  142814.00 |  110172.00 |       0.30
 storage          |     201706 |          110 |              |              |    9132.00 |  116418.00 |      -0.92
(2 rows)

4. 每个省以及每个城市的客户数量及其消费金额汇总是多少？

dw=> select t2.state,
dw->        t2.city,
dw->        count(distinct customer_sk) sum_customer_num,
dw->        sum(order_amount) sum_order_amount
dw->   from v_sales_order_fact t1, zip_code_dim t2
dw->  where t1.customer_zip_code_sk = t2.zip_code_sk
dw->  group by rollup (t2.state, t2.city)
dw->  order by t2.state, t2.city;
 state |     city      | sum_customer_num | sum_order_amount 
-------+---------------+------------------+------------------
 oh    | cleveland     |                4 |         35181.00
 oh    |               |                4 |         35181.00
 pa    | mechanicsburg |                8 |        375113.00
 pa    | pittsburgh    |               12 |        433982.00
 pa    |               |               20 |        809095.00
       |               |               24 |        844276.00
(6 rows)

5. 迟到订单的比例是多少？

注意，sum_late需要显式转化为numeric数据类型。

dw=> select sum_total, sum_late, round(cast(sum_late as numeric)/sum_total,4) late_pct  
dw->   from (select sum(case when status_date_sk < entry_date_sk then 1 
dw(>                         else 0 
dw(>                     end) sum_late,  
dw(>                count(*) sum_total  
dw(>           from sales_order_fact) t; 
 sum_total | sum_late | late_pct 
-----------+----------+----------
       151 |        2 |   0.0132
(1 row)

6. 客户年消费金额的平均数和中位数是多少？

分别使用两种方法求得平均数和中位数。HAWQ为分析型应用提供了丰富的聚合函数。

dw=> select round(avg(sum_order_amount),2) avg_amount, 
dw->        round(sum(sum_order_amount)/count(customer_sk),2) avg_amount1, 
dw->        percentile_cont(0.5) within group (order by sum_order_amount) median_amount,
dw->        median(sum_order_amount) median_amount1
dw->   from (select customer_sk,sum(order_amount) sum_order_amount
dw(>           from v_sales_order_fact
dw(>          group by customer_sk) t1;
 avg_amount | avg_amount1 | median_amount | median_amount1 
------------+-------------+---------------+----------------
   35178.17 |    35178.17 |         14277 |          14277
(1 row)

7. 客户年消费金额分布处于25%、50%、75%位置的消费金额是多少？

dw=> select percentile_cont(0.25) within group (order by sum_order_amount desc) max_amount_25,
dw->        percentile_cont(0.50) within group (order by sum_order_amount desc) max_amount_50,
dw->        percentile_cont(0.75) within group (order by sum_order_amount desc) max_amount_75
dw->   from (select customer_sk,sum(order_amount) sum_order_amount
dw(>           from v_sales_order_fact
dw(>          group by customer_sk) t1;
 max_amount_25 | max_amount_50 | max_amount_75 
---------------+---------------+---------------
       50536.5 |         14277 |       8342.25
(1 row)

8. 客户年消费金额为“高”、“中”、“低”档的人数及消费金额所占比例是多少？

使用在“ HAWQ取代传统数仓实践（十二）——维度表技术之分段维度”中定义的分段进行查询。

dw=> select year1, 
dw->        bn, 
dw->        c_count, 
dw->        sum_band, 
dw->        sum_total, 
dw->        round(sum_band/sum_total,4) band_pct   
dw->   from (select count(a.customer_sk) c_count,   
dw(>                sum(annual_order_amount) sum_band,  
dw(>                a.year year1,    
dw(>                band_name bn    
dw(>           from annual_customer_segment_fact a,    
dw(>                annual_order_segment_dim b,       
dw(>                annual_sales_order_fact d   
dw(>          where a.segment_sk = b.segment_sk     
dw(>            and a.customer_sk = d.customer_sk    
dw(>            and a.year = d.year  
dw(>            and b.segment_name = 'grid'  
dw(>          group by a.year, bn) t1,  
dw->          (select sum(annual_order_amount) sum_total 
dw(>             from annual_sales_order_fact) t2  
dw->  order by year1, bn;   
 year1 |  bn  | c_count | sum_band  | sum_total | band_pct 
-------+------+---------+-----------+-----------+----------
  2016 | high |       6 | 572190.00 | 572190.00 |   1.0000
(1 row)

9. 每个城市按销售金额排在前三位的商品是什么？

使用HAWQ提供的窗口函数row_number()，按城市分区，按销售额倒序，取得销售排名。

dw=> select case when t1.rn =1 then t1.city end city, 
dw->        t2.product_name, 
dw->        t1.sum_order_amount, 
dw->        t1.rn  
dw->   from (select city, 
dw(>                product_sk,  
dw(>                sum_order_amount,  
dw(>                row_number() over (partition by city order by sum_order_amount desc) rn 
dw(>           from (select t2.state||':'||t2.city city,  
dw(>                        product_sk,   
dw(>                        sum(order_amount) sum_order_amount  
dw(>                   from v_sales_order_fact t1, zip_code_dim t2
dw(>                  where t1.customer_zip_code_sk = t2.zip_code_sk 
dw(>                  group by t2.state||':'||t2.city, product_sk) t) t1 
dw->  inner join product_dim t2 on t1.product_sk = t2.product_sk  
dw->  where t1.rn <= 3  
dw->  order by t1.city, t1.rn; 
       city       |  product_name   | sum_order_amount | rn 
------------------+-----------------+------------------+----
 oh:cleveland     | keyboard        |         10875.00 |  1
                  | hard disk drive |          8646.00 |  2
                  | floppy drive    |          8229.00 |  3
 pa:mechanicsburg | hard disk drive |        194444.00 |  1
                  | floppy drive    |        140410.00 |  2
                  | keyboard        |         29629.00 |  3
 pa:pittsburgh    | floppy drive    |        200016.00 |  1
                  | hard disk drive |        172391.00 |  2
                  | flat panel      |         31605.00 |  3
(9 rows)

10. 所有产品的销售百分比排名？

dw=> select product_name, 
dw->        sum_order_amount,
dw->        percent_rank() over (order by sum_order_amount desc) rank
dw->   from (select product_sk,sum(order_amount) sum_order_amount
dw(>           from v_sales_order_fact 
dw(>          group by product_sk) t1, product_dim t2
dw->  where t1.product_sk = t2.product_sk
dw->  order by rank;
  product_name   | sum_order_amount | rank 
-----------------+------------------+------
 hard disk drive |        375481.00 |    0
 floppy drive    |        348655.00 | 0.25
 keyboard        |         67387.00 |  0.5
 flat panel      |         49666.00 | 0.75
 lcd panel       |          3087.00 |    1
(5 rows)

三、交互查询与图形化显示

1. Zeppelin简介

Zeppelin是一个基于Web的软件，用于交互式地数据分析。它一开始是Apache软件基金会的孵化项目，2016年5月正式成为顶级项目。Zeppelin描述自己是一个可以进行数据摄取、数据发现、数据分析、数据可视化的笔记本，用以帮助开发者、数据科学家以及相关用户更有效地处理数据，而不必使用复杂的命令行，也不必关心集群的实现细节。Zeppelin的架构如图2所示。

图2

从上图中可以看到，Zeppelin具有客户端/服务器架构，客户端一般就是指浏览器。服务器接收客户端的请求，并将请求通过Thrift协议发送给翻译器组。翻译器组物理表现为JVM进程，负责实际处理客户端的请求并与服务器进行通信。
翻译器是一个插件式的体系结构，允许任何语言或后端数据处理程序以插件的形式添加到Zeppelin中。特别需要指出的是，Zeppelin内建Spark翻译器，因此不需要构建单独的模块、插件或库。翻译器的架构如图3所示。

图3

当前的Zeppelin已经支持很多翻译器，如Zeppelin 0.6.0版本自带的翻译器有alluxio、cassandra、file、hbase、ignite、kylin、md、phoenix、sh、tajo、angular、elasticsearch、flink、hive、jdbc、lens、psql、spark等18种之多。插件式架构允许用户在Zeppelin中使用自己熟悉的特定程序语言或数据处理方式。例如，通过使用%spark翻译器，可以在Zeppelin中使用Scala语言代码。
在数据可视化方面，Zeppelin已经包含一些基本的图表，如柱状图、饼图、线形图、散点图等，任何支持的后端语言输出都可以被图形化表示。
在Zeppelin中，用户建立的每一个查询叫做一个note，note的URL在多用户间共享，Zeppelin将向所有用户实时广播note的变化。Zeppelin还提供一个只显示查询结果的URL，该页不包括任何菜单和按钮。用这种方式可以方便地将结果页作为一帧嵌入到自己的web站点中。

2. 使用Zeppelin执行HAWQ查询

（1）安装Zeppelin
HDP 2.5.0安装包中已经集成了Zeppelin 0.6.0，因此不需要单独进行复杂的安装配置，只要启动Zeppelin服务就可以了。

（2）配置Zeppelin支持HAWQ
Zeppelin 0.6.0通过JDBC翻译器解析HAWQ查询，只需进行简单的配置即可，步骤如下。

在Ambari控制台主页面中，点击Services -> Zeppelin Notebook -> Quick Links -> Zeppelin UI，打开Zeppelin UI主页面。
在Zeppelin UI主页面中，点击anonymous -> interpreter，进入翻译器页面。
点击edit编辑jdbc翻译器，配置default.driver、default.password、default.url、default.user四个属性的值，我的配置如图4所示。

图4

配置好后点击Save保存配置，然后点击restart重启jdbc翻译器，至此配置完成。

（3）在Zeppelin中执行HAWQ查询
点击Notebook -> Create new note，新建一个note，在其中输入查询语句，如“每种产品类型以及单个产品在每个省、每个城市的月销售量和销售额是多少？”的查询。

%jdbc
select t2.product_category, t2.product_name, t3.state, t3.city, sum(nq) sq, sum(order_amount) sa
  from v_sales_order_fact t1, product_dim t2, zip_code_dim t3 
 where t1.product_sk = t2.product_sk
   and t1.customer_zip_code_sk = t3.zip_code_sk
 group by t2.product_category, t2.product_name, t3.state, t3.city
 order by t2.product_category, t2.product_name, t3.state, t3.city;

运行结果的表格、柱状图、饼图、堆叠图、线形图、散点图分别如图5-图10所示。

图5

图6

图7

图8

图9

图10

一个note中可以独立执行多个查询语句。图形显示可以根据不同的“settings”联机分析不同的指标。报表有default、simple、report三种可选样式。例如，报表样式的饼图表示如图11所示。

图11

可以点击如图12红框中所示的链接单独引用此报表。

图12

单独的页面能根据查询或设置的修改而实时变化，比如将Values由sa列改为sq列，饼图表变为图13的样子。

图13

单独链接的页面也随之自动发生变化，如图14所示。

图14

Zeppelin支持联机输入变量值，例如，要查询某一年的销售情况，查询语句改为：

%jdbc
select t2.product_category, t2.product_name, t3.state, t3.city, sum(nq) sq, sum(order_amount) sa
  from v_sales_order_fact t1, product_dim t2, zip_code_dim t3 
 where t1.product_sk = t2.product_sk
   and t1.customer_zip_code_sk = t3.zip_code_sk
   and t1.year_month/100 = ${year}
 group by t2.product_category, t2.product_name, t3.state, t3.city
 order by t2.product_category, t2.product_name, t3.state, t3.city;

在运行查询时会在页面中出现一个输入框，填入适当的变量值运行查询，如图15所示。

图15

甚至可以动态定义查询的列，例如查询语句改为：

%jdbc
select ${checkbox:fields=t2.product_category, t2.product_category|t2.product_name},t3.state, t3.city, sum(nq) sq, sum(order_amount) sa
  from v_sales_order_fact t1, product_dim t2, zip_code_dim t3 
 where t1.product_sk = t2.product_sk
   and t1.customer_zip_code_sk = t3.zip_code_sk
   and t1.year_month/100 = ${year}
 group by ${checkbox:fields=t2.product_category, t2.product_category|t2.product_name}, t3.state, t3.city
 order by ${checkbox:fields=t2.product_category, t2.product_category|t2.product_name}, t3.state, t3.city;

查询运行时出现字段复选框，如图16所示。

图16

参考： https://zeppelin.apache.org/docs/latest/manual/dynamicform.html

你可能感兴趣的:(BI)

Mariadb-Server的二进制安装 linux土老帽 linux土老帽 mariadb linux centos
搭建环境：OS:centos7.6版本mariadb:mariadb-10.2.25-linux-x86_64.tar.gz#下载地址：DownloadMariaDBServer-MariaDB.org1.创建用户组useradd-r-s/sbin/nologin-d/data/mysqlmysql#创建用户-r系统账户-s指定shell/sbin/nologin-d指定家目录但是不创建原因是系统
MySql主从备份Slave 甚享享 mysql 数据库
Mysql主从备份可以在除主服务器外的其他服务器是部署从库，用于实时备份生产环境数据，核心是mysql的log-bin日志（二进制日志），主库开启bin日志后，从库通过日志同步(SlaveI/O)和回放(SlaveSQL)实现数据同步.因为设置主从备份时，需要指定主库lob-bin日志运行行数，所以之前的数据需要通过“数据同步”或者手动同步完成修改配置文件Linux:my.cnfWindows:m
mysql主从备份_mysql实现主从备份 Lucas HC mysql主从备份
mysql主从备份的原理:主服务器在做数据库操作的时候将所有的操作通过日志记录在binlog里面，有专门的文件存放。如localhost-bin.000003，这种，从服务器和主服务配置好关系后，通过I/O线程获取到这个binlog文件然后写入到从服务器的relaylog(中继日志)中，然后从服务器执行从服务器中的sql语句进行数据库的同步。实现：准备:两台服务器，mysql环境，可以是Windo
Docker+Portainer 离线安装 qq_30024063 docker 容器运维
1.Docker安装步骤一：官网下载docker安装包步骤二：解压安装包;tar-zxvfdocker-24.0.6.tgz步骤三：将解压之后的docker文件移到/usr/bin目录下;cpdocker/*/usr/bin/步骤四：将docker注册成系统服务;vim/etc/systemd/system/docker.service然后在文件中添加以下内容，退出并保存（:wq!）[Unit]D
MySQL主从备份 W111115_ MySQL mysql 数据库
前提条件：安装mysql,并开启二进制日志（bin-log日志）【让一台的bin-log日志传到另一台主机上，然后第二台主机收到后，将其bin-log日志读取并恢复到第二台机器上---整个过程实时操作同步】实现过程1.主从机器都开启二进制日志主服务器：vim/etc/my.cnf#编辑mysql配置文件log-bin=mysql-bin#开启二进制日志--------在配置文件中添加server-
Script to save all images from a docker-compose.yml file 唧唧歪歪的 docker docker docker-compose
通过docker-compose.yml导出镜像到单个文件Scripttosaveallimagesfromadocker-compose.ymlfile1st#!/bin/bashmkdir-poutforimgin`grepimage$1|sed-e's/^.*image\://g'`;docleanname=${img/\//-}tag=`dockerimages|grep$img|awk'
installGo.sh
#!/bin/bash#检查是否以root用户运行if["$(id-u)"-ne0];thenecho"请使用root权限运行此脚本"exit1fi#检查是否安装了必要的工具forcmdincurlwgettar;doif!command-v$cmd&>/dev/null;thenecho"错误:需要安装$cmd"exit1fidone#获取最新版本号echo"正在获取最新Go版本..."LATE
导出docker-compse.yml中docker镜像成tar文件青春不流名 eureka 云原生
#!/bin/bash#确保脚本在正确的目录下运行SCRIPT_DIR=$(dirname"$(realpath"$0")")cd"$SCRIPT_DIR"||exit1#定义docker-compose文件路径COMPOSE_FILE="${SCRIPT_DIR}/docker-compose.yml"#创建导出目录EXPORT_DIR="${SCRIPT_DIR}/docker_images"
【RAG面试题】LLMs已经具备了较强能力,存在哪些不足点? 一叶千舟 AI面试题【RAG】RAG
目录LLMs核心不足点1、知识过时与静态性（LackofReal-Time&DynamicKnowledge）：2、幻觉与事实性错误（Hallucinations&FactualInaccuracies）：3、领域专业知识深度不足（LimitedDomain-SpecificExpertise）：4、缺乏透明度和可追溯性（LackofTransparency&Traceability）：5、上下文
MCP-Proxy：开发多LLM & 多MCP 支持并安全访问MCP Server的秘密 IT古董技术杂谈安全 MCP MCP-Proxy
在构建多模型、多协议、可控可信的大模型接入平台时，MCP-Proxy扮演着关键中枢。它不仅要支持多个LLM接入，还要保障对后端MCPServer的安全访问、请求审计、能力切换与资源隔离。什么是MCP/MCP-Proxy？MCP（ModelCapabilityProtocol）是新一代模型能力调用协议，类似于OpenAI的API，但可支持：多厂商大模型（OpenAI、DeepSeek、Yi、Chat
使用 pip 命令下载 whl离线安装包、安装三希 pip
使用pip命令直接从线上下载whl离线安装包并转存到离线环境的过程实际上是分两步进行的：第一步：在线环境下载whl包bash#在具有网络连接的环境中pipdownload--only-binary=:all:--wheel--platform--python-version这里的参数说明：：需要下载的Python包名称。--only-binary=:all:：只下载二进制包（即whl文件）。--w
安卓开发手动构建 .so XCZHONGS android
手动构建.so（兼容废弃ABI）下载旧版NDK（推荐r16b）地址：https://developer.android.com/ndk/downloads/older_releases下载NDKr16b（最后支持armeabi、mips、mips64的版本）使用ndk-build手动构建（不使用Gradle）在源文件目录下执行D:\ideal\androidstudio\sdk\ndk\16.1.
26、A* Algorithm: An In-depth Guide to Optimal Pathfinding tree C#搜索设计模式精解 A*Algorithm Pathfinding Heuristic Function
A*Algorithm:AnIn-depthGuidetoOptimalPathfinding1.IntroductiontoA*AlgorithmA(pronounced“Astar”)isapowerfulalgorithmwidelyusedforpathfindingandgraphtraversal.Itcombinestheadvantagesofbothuniform-costsea
为什么90%企业的AI数据分析都失败了？奥威BI给出破局方案 qq_43696218 人工智能数据分析数据挖掘
一、引言：AI数据分析在数字化转型中的核心地位在当今企业全面数字化转型的背景下，‌AI数据分析已成为解锁业务增长潜力的关键钥匙。然而，市场上众多AI数据分析产品常陷入“伪需求场景”，看似前沿却难以真正落地。本文将深入探讨奥威BI如何通过其AI数据分析能力，突破伪需求，实现数据价值的最大化。二、AI数据分析：伪需求场景的挑战伪需求场景的定义与表现AI数据分析领域的伪需求场景，指的是那些表面创新实则难
BI+AI实战：我们如何用3秒完成车企供应链推演 qq_43696218 人工智能
一、BI+AI引领财务分析新纪元在财务数据分析领域，奥威BI+AI正以革命性的姿态颠覆传统。当金蝶、用友等工具仍深陷报表泥潭时，奥威BI+AI通过深度融合商业智能（BI）与人工智能（AI），实现了从滞后报表到实时洞察的飞跃。这不仅极大地提升了财务分析的效率，更为企业的战略决策提供了前所未有的精准支持。二、BI+AI的核心技术优势‌实时动态分析‌o奥威BI+AI摒弃了静态数据集，依托原始科目余额表实
【Linux】ghb工具 nanguochenchuan Linux操作系统 linux 运维服务器
GDB简介GDB（GNUDebugger）是Linux系统中最强大的命令行调试工具，由GNU项目开发。作为程序员调试C/C++程序的利器，GDB能帮助你：定位程序崩溃原因分析程序运行状态跟踪变量值变化检测内存错误安装与配置安装方法#Ubuntu/Debiansudoaptinstallgdb#CentOS/RHELsudoyuminstallgdb#ArchLinuxsudopacman-Sgdb
redis知识系列-解析配置文件redis.conf
一.配置文件路径redis的默认配置文件，我们一般不做改动，而是复制一份到自己目录下，以后修改此目录下的redis.conf配置，在/usr/local/bin目录下启动redis-server时，带上参数为redis.conf的绝对路径。例如redis-server/myredis/redis.conf二.redis.conf的参数说明1.Redis默认不是以守护进程的方式运行，可以通过该配置项
rabbitmq安装虚拟ip_步骤4：配置IPv6地址 weixin_39755625 rabbitmq安装虚拟ip
自动配置IPv6地址ecs-util-ipv6能为已分配IPv6地址的ECS实例一键配置IPv6地址，或者为没有分配IPv6地址的ECS实例一键清理IPv6配置。ecs-util-ipv6工具下载地址如下所示。系列发行版下载地址RHELCentOS5/6/7/8RedHat5/6/7DebianUbuntu14/16Debian/8/9SLESSUSE11/12OpenSUSE42CoreOSCo
MongoDB与Redis有哪些区别相遇在春风里经验分享
MongoDB和Redis是两种不同类型的数据库，它们存在以下区别：一、数据模型MongoDBMongoDB是一个文档型数据库，它使用BSON（BinaryJSON）格式存储数据。数据以类似JSON的文档形式组织，每个文档可以有不同的结构（即模式自由）。例如，在一个存储用户信息的集合中，一个用户文档可能包含姓名、年龄、地址等字段，而另一个用户文档可能还包含额外的兴趣爱好字段。这种数据模型非常适合处
‘conda‘ 不是内部或外部命令，也不是可运行的程序或批处理文件 THe CHallEnge of THe BrAve conda
出现'conda'不是内部或外部命令，也不是可运行的程序或批处理文件的错误，通常是因为Conda没有正确添加到系统的环境变量中。以下是解决方法：1.确认Anaconda/Miniconda是否安装成功打开文件资源管理器，检查D:\anaconda3文件夹是否存在。如果存在，检查其中是否包含Scripts和condabin文件夹。如果这些文件夹不存在，可能是安装过程有问题，建议重新安装Minicon
中国计算机学会（CCF）推荐学术会议-C（软件工程/系统软件/程序设计语言）：FPT 2025 爱思德学术 AI编程极限编程重构
FPT2025FPTisthepremierconferenceintheAsia-Pacificregiononfield-programmabletechnologies,reconfigurablecomputingdevicesandsystems.Field-programmabledevicesoffertheflexibilityofsoftwarewiththeperformanc
opensuse安装rabbitmq 翻滚吧键盘 openSUSE rabbitmq ruby 分布式
您好！安装RabbitMQ消息队列是一个非常棒的选择，它是许多现代应用架构中的核心组件。在openSUSETumbleweed上安装RabbitMQ主要有两种流行的方式：一种是使用系统的包管理器zypper，另一种是使用Docker容器。我将为您详细介绍这两种方法。前置知识：RabbitMQ是用Erlang语言编写的，因此安装RabbitMQ时会自动安装Erlang语言环境作为其依赖。您无需手动安
docker启动的rabbitmq搭建并集群和高可用黑皮爱学习 mq docker rabbitmq ruby
Docker搭建RabbitMQ集群步骤以下是使用Docker快速搭建RabbitMQ集群的详细步骤，包含配置文件、网络设置和集群组建过程。1.创建自定义网络首先创建一个Docker网络，使容器间可以通过名称互相访问：dockernetworkcreaterabbitmq-cluster2.准备配置文件创建一个配置目录（例如~/rabbitmq-config），并在其中创建以下文件：rabbitm
LLMs基础学习（八）强化学习专题（7）汤姆和佩琦 NLP 学习 Actor-Critic 算法
LLMs基础学习（八）强化学习专题（7）文章目录LLMs基础学习（八）强化学习专题（7）Actor-Critic算法基础原理算法流程细节算法优缺点分析算法核心总结视频链接：https://www.bilibili.com/video/BV1MQo4YGEmq/?spm_id_from=333.1387.upload.video_card.click&vd_source=57e4865932ea6c
生僻字处理工具类兮动人 JavaSE 实用工具 java 生僻字处理工具类生僻字
对于生僻字的处理可以用到下面相关编码查询汉字对应的编码：https://www.qqxiuzi.cn/bianma/zifuji.php文章目录生僻字处理概述功能介绍快速开始判断是否是生僻字utf8字符串转gbk伪码gb18030字符串转gbk伪码gbk伪码转utf8gbk伪码转gb18030生僻字处理概述在系统存储、跨系统报文或文件传输过程中，保证生僻字信息的完整性。功能介绍通过生僻字工具类，判
Docker 安装与配置详解——AI教你学Docker LuckyLay AI教你学Docker docker 容器运维
1.2Docker安装与配置详解本节围绕Docker的安装方法及常见配置，帮助你在不同平台上顺利部署Docker，并理解其关键配置项。一、Docker安装1.支持的操作系统Linux（主流发行版：Ubuntu、CentOS、Debian、Fedora、openSUSE等）Windows（Windows10/11Pro/Enterprise、WindowsServer2016及以上）macOS（In
ServletConfig && ServletContext Code溪 java 前端服务器
一.ServletConfig1.Servlet1代码@WebServlet(urlPatterns="servlet1",initParams={@WebInitParam(name="keya",value="valueA")})publicclassServlet1extendsHttpServlet{@Overrideprotectedvoidservice(HttpServletRequ
RabbitMQ 使用教程小凯 ོ rabbitmq 分布式
作者：小凯哥沉淀、分享、成长，让自己和他人都能有所收获！本文的宗旨在于通过简单干净实践的方式教会读者，使用Docker配置RabbitMQ在DDD结构下验证使用。关于MQ的场景内容已经在RocketMQ(opensnewwindow)一节中做了讲解，本文只要为大家扩展另外一种MQ的使用。方便有需要的伙伴可以做技术栈替换。RabbitMQ(opensnewwindow)是一个由Erlang开发的AM
linux的常用命令 Flying Fish（HHH） linux 服务器运维
一、进程相关：查看进程：ps-aux|grep进程id查看僵尸进程：ps-ef|grepdefunct（进程名称）如何查看线程使用哪个so库？lsof-ppid|grepbasecat/proc/376421/maps|grep'\.so'查看对应的.so文件是否已经成功转成汇编yuminstallbinutils-2.37-14.oe2203sp1.x86_64objdump-Sllibbase
iouring的demo性能测试程序 Flying Fish（HHH） iouring 算法分布式
/*多线程多实例，注意线程的绑定，一个core绑定一个sq线程，一个或者多个core绑定一个或多个work线程，还有控制worker线程个数，还有numa的绑定编译命令：gcc-g-oiouringwww_iouring.c-L/usr/lib-luring执行命令：numactl--cpunodebind=1--membind=1./iouringio_uring.conf*/#define_G
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分