wzy0623

HAWQ取代传统数仓实践（十九）——OLAP

一、OLAP简介

1. 概念

OLAP是英文是On-Line Analytical Processing的缩写，意为联机分析处理。此概念最早由关系数据库之父E.F.Codd于1993年提出。OLAP允许以一种称为多维数据集的结构，访问业务数据源经过聚合和组织整理后的数据。以此为标准，OLAP作为单独的一类技术同联机事务处理（On-Line Transaction Processing，OLTP）得以明显区分。
在计算领域，OLAP是一种快速应答多维分析查询的方法，也是商业智能的一个组成部分，与之相关的概念还包括数据仓库、报表系统、数据挖掘等。数据仓库用于数据的存储和组织，OLAP集中于数据的分析，数据挖掘则致力于知识的自动发现，报表系统则侧重于数据的展现。OLAP系统从数据仓库中的集成数据出发，构建面向分析的多维数据模型，再使用多维分析方法从多个不同的视角对多维数据集合进行分析比较，分析活动以数据驱动。通过使用OLAP工具，用户可以从多个视角交互式地查询多维数据。
OLAP由三个基本的分析操作构成：合并（上卷）、下钻和切片。合并是指数据的聚合，即数据可以在一个或多个维度上进行累积和计算。例如，所有的营业部数据被上卷到销售部门以分析销售趋势。下钻是一种由汇总数据向下浏览细节数据的技术。比如用户可以从产品分类的销售数据下钻查看单个产品的销售情况。切片则是这样一种特性，通过它用户可以获取OLAP立方体中的特定数据集合，并从不同的视角观察这些数据。这些观察数据的视角就是我们所说的维度。例如通过经销商、日期、客户、产品或区域等等，查看同一销售事实。
OLAP系统的核心是OLAP立方体，或称为多维立方体或超立方体。它由被称为度量的数值事实组成，这些度量被维度划分归类。一个OLAP立方体的例子如图1所示，数据单元位于立方体的交叉点上，每个数据单元跨越产品、时间、地区等多个维度。通常使用一个矩阵接口操作OLAP立方体，例如电子表格程序的数据透视表，可以按维度分组执行聚合或求平均值等操作。立方体的元数据一般由关系数据库中的星型模式或雪花模式生成，度量来自事实表的记录，维度来自维度表。

图1

2. 分类

通常可以将联机分析处理系统分为MOLAP、ROLAP、HOLAP三种类型。
（1）MOLAP
MOLAP（multi-dimensional online analytical processing）是一种典型的OLAP形式，甚至有时就被用来表示OLAP。MOLAP将数据存储在一个经过优化的多维数组中，而不是存储在关系数据库中。某些MOLAP工具要求预先计算并存储计算后的结果数据，这种操作方式被称为预处理。MOLAP工具一般将预计算后的数据集合作为一个数据立方体使用。对于给定范围的问题，立方体中的数据包含所有可能的答案。预处理的好处是可以对问题作出非常快速地响应。然而另一方面，依赖于预计算的聚合程度，装载新数据可能会花费很长的时间。另外还有些MOLAP工具，尤其是那些实现了某些数据库功能的MOLAP工具，并不预先计算原始数据，而是在需要时才进行计算。
MOLAP的优点：

优化的数据存储、多维数据索引和缓存带来的快速查询性能。
相对于关系数据库，可以通过压缩技术，使数据存储需要更小的磁盘空间。
MOLAP工具一般能够自动进行高级别的数据聚合。
对于低基数维度的数据集合是紧凑的。
数组模型提供了原生的索引功能。

MOLAP的缺点：

某些MOLAP解决方案中的处理步骤可能需要很长的时间，尤其是当数据量很大时。要解决这个问题，通常只能增量处理变化的数据，而不是预处理整个数据集合。
可能引入较多的数据冗余。

MOLAP产品：
商业的MOLAP产品主要有Cognos Powerplay、Oracle Database OLAP Option、MicroStrategy、Microsoft Analysis Services、Essbase等。

（2）ROLAP
ROLAP直接使用关系数据库存储数据，不需要执行预计算。基础的事实数据及其维度表作为关系表被存储，而聚合信息存储在新创建的附加表中。ROLAP以数据库模式设计为基础，操作存储在关系数据库中的数据，实现传统的OLAP数据切片和分块功能。本质上讲，每种数据切片或分块行为都等同于在SQL语句中增加一个“WHERE”子句的过滤条件。ROLAP不使用预计算的数据立方体，取而代之的是查询标准的关系数据库表，返回回答问题所需的数据。与预计算的MOLAP不同，ROLAP工具有能力回答任意相关的数据分析问题，因为该技术不受立方体内容的限制。通过ROLAP还能够下钻到数据库中存储的最细节的数据。
由于ROLAP使用关系数据库，通常数据库模式必须经过仔细设计。为OLTP应用设计的数据库不能直接作为ROLAP数据库使用，这种投机取巧的做法并不能使ROLAP良好工作。因此ROLAP仍然需要创建额外的数据拷贝。但不管怎样，ROLAP毕竟用的是数据库，各种各样的数据库设计与优化技术都可以被有效利用。

ROLAP的优点：

在处理大量数据时，ROLAP更具可伸缩性，尤其是当模型中包含的维度具有很高的基数，例如，维度表中有上百万的成员时。
有很多可选用的数据装载工具，并且能够针对特定的数据模型精细调整ETL代码，数据装载所需时间通常比自动化的MOLAP装载少的多。
因为数据存储于标准关系数据库中，可以使用SQL报表工具访问数据，而不必是专有的OLAP工具。
ROLAP更适合处理非聚合的事实，例如文本型描述。在MOLAP工具中查询文本型元素时性能会相对较差。
通过将数据存储从多维模型中解耦出来，相对于用使用严格的维度模型，这种更普通的关系模型增加了成功建模的可能性。
ROLAP方法可以利用数据库的权限控制，例如通过行级安全性设置，可以用事先设定的条件过滤查询结果。例如Oracle的VPD技术，能够根据连接的用户自动在查询的SQL语句中拼接WHERE谓词条件。

ROLAP的缺点：

业界普遍认为ROLAP工具比MOLAP查询速度慢。
聚合表的数据装载必须由用户自己定制的ETL代码控制。ROLAP工具不能自动完成这个任务，这意味着额外的开发工作量。
如果跳过创建聚合表的步骤，查询性能会大打折扣，因为不得不查询大量的细节数据表。虽然可以通过适当建立聚合表缓解性能问题，但对所有维度表及其属性的组合创建聚合表是不切实际的。
ROLAP依赖于针对通用查询或缓存目标的数据库，因此并没有提供某些MOLAP工具所具有的特殊技术，如透视表等。但是现代ROLAP工具可以利用SQL语言中的CUBE、ROLLUP操作或其它SQL OLAP扩展。随着这些SQL扩展的逐步完善，MOLAP工具的优势也不那么明显了。
因为ROLAP工具的所有计算都依赖于SQL，对于某些不易转化为SQL的计算密集型模型，ROLAP不再适用。例如包含预算、拨款等条目的复杂财务报表或地理位置计算的场景。

ROLAP产品：
使用ROLAP的商业产品包括Microsoft Analysis Services、MicroStrategy、SAP Business Objects、Oracle Business Intelligence Suite Enterprise Edition、 Tableau Software等等。也有开源的ROLAP服务器，如Mondrian。

（3）HOLAP
在额外的ETL开发成本与缓慢的查询性能之间难以选择，正是因为这种情况，现在大部分商业OLAP工具都使用一种混合型（Hybrid）方法，它允许模型设计者决定哪些数据存储在MOLAP中，哪些数据存储在ROLAP中。除了把数据划分成传统关系型存储和专有存储，业界对混合型OLAP并没有清晰的定义。例如，某些厂商的HOLAP数据库使用关系表存储大量的细节数据，而是用专用表保存少量的聚合数据。HOLAP结合了MOLAP和ROLAP两种方法的优点，可以同时利用预计算的多维立方体和关系数据源。HOLAP有以下两种划分数据的策略。

垂直分区。这种模式的HOLAP将聚合数据存储在MOLAP中，以支持良好的查询性能，而把细节数据存储在ROLAP中以减少立方体处理所需时间。
水平分区。这种模式的HOLAP按数据热度划分，将某些最近使用的数据分片存储在MOLAP中，而将老的数据存储在ROLAP。

3. 性能

OLAP分析所需的原始数据量是非常庞大的。一个分析模型，往往会涉及数千万或数亿条甚至更多的数据，而且分析模型中包含多个维度数据，这些维度又可以由用户作任意的组合。这样的结果就是大量的实时运算导致过长的响应时间。想象一个1000万条记录的分析模型，如果一次提取4个维度进行组合分析，每个维度有10个不同的取值，理论上的运算次数将达到10的12次方。这样的运算量将导致数十分钟乃至更长的等待时间。如果用户对维组合次序进行调整，或增加、或减少某些维度的话，又将是一个重新的计算过程。
从上面的分析中可以得出结论，如果不能解决OLAP运算效率问题的话，OLAP将只会是一个没有实用价值的概念。在OLAP的发展历史中，常见的解决方案是用多维数据库代替关系数据库设计，将数据根据维度进行最大限度的聚合运算，运算中会考虑到各种维度组合情况，运算结果将生成一个数据立方体，并保存在磁盘上，用这种预运算方式提高OLAP的速度。例如Kylin就是使用这种以空间换时间的方式来提高查询速度，而HAWQ在性能上的优势，也使它较为适合OLAP应用。HAWQ与Hive的性能对比，参见“HAWQ与Hive查询性能对比测试”。（http://blog.csdn.net/wzy0623/article/details/71479539）

二、OLAP实例

要做好OLAP类的应用，需要对业务数据有深入的理解。只有了解了业务，才能知道需要分析哪些指标，从而有的放矢地剖析相关数据，得出可信的结论来辅助决策。下面就以销售订单数据仓库为例，提出若干问题，然后使用HAWQ查询数据以回答这些问题：

每种产品类型以及单个产品的累积销售量和销售额是多少？
每种产品类型以及单个产品在每个省、每个城市的月销售量和销售额趋势是什么？
每种产品类型销售量和销售额和同比如何？
每个省以及每个城市的客户数量及其消费金额汇总是多少？
迟到订单的比例是多少？
客户年消费金额的平均数和中位数是多少？
客户年消费金额分布处于25%、50%、75%位置的消费金额是多少？
客户年消费金额为“高”、“中”、“低”档的人数及消费金额所占比例是多少？
每个城市按销售金额排在前三位的商品是什么？
所有产品的销售百分比排名？

1. 每种产品类型以及单个产品的累积销售量和销售额是多少？

使用HAWQ的group by rollup求小计和总计。

dw=> select t2.product_category, t2.product_name, sum(nq), sum(order_amount)
dw->   from v_sales_order_fact t1, product_dim t2 
dw->  where t1.product_sk = t2.product_sk
dw->  group by rollup (t2.product_category, t2.product_name)
dw->  order by t2.product_category, t2.product_name; 
 product_category |  product_name   | sum |    sum    
------------------+-----------------+-----+-----------
 monitor          | flat panel      |     |  49666.00
 monitor          | lcd panel       |  11 |   3087.00
 monitor          |                 |  11 |  52753.00
 peripheral       | keyboard        |  38 |  67387.00
 peripheral       |                 |  38 |  67387.00
 storage          | floppy drive    |  52 | 348655.00
 storage          | hard disk drive |  80 | 375481.00
 storage          |                 | 132 | 724136.00
                  |                 | 181 | 844276.00
(9 rows)

2. 每种产品类型以及单个产品在每个省、每个城市的月销售量和销售额是多少？

查询语句与上一个问题类似，只是多关联了邮编维度表，并且在group by rollup中增加了省、市两列。

dw=> select t2.product_category, t2.product_name, t3.state, t3.city, sum(nq), sum(order_amount)
dw->   from v_sales_order_fact t1, product_dim t2, zip_code_dim t3 
dw->  where t1.product_sk = t2.product_sk
dw->    and t1.customer_zip_code_sk = t3.zip_code_sk
dw->  group by rollup (t2.product_category, t2.product_name, t3.state, t3.city)
dw->  order by t2.product_category, t2.product_name, t3.state, t3.city; 
 product_category |  product_name   | state |     city      | sum |    sum    
------------------+-----------------+-------+---------------+-----+-----------
 monitor          | flat panel      | oh    | cleveland     |     |   7431.00
 monitor          | flat panel      | oh    |               |     |   7431.00
 monitor          | flat panel      | pa    | mechanicsburg |     |  10630.00
 monitor          | flat panel      | pa    | pittsburgh    |     |  31605.00
 monitor          | flat panel      | pa    |               |     |  42235.00
 monitor          | flat panel      |       |               |     |  49666.00
 monitor          | lcd panel       | pa    | pittsburgh    |  11 |   3087.00
 monitor          | lcd panel       | pa    |               |  11 |   3087.00
 monitor          | lcd panel       |       |               |  11 |   3087.00
 monitor          |                 |       |               |  11 |  52753.00
 peripheral       | keyboard        | oh    | cleveland     |  38 |  10875.00
 peripheral       | keyboard        | oh    |               |  38 |  10875.00
 peripheral       | keyboard        | pa    | mechanicsburg |     |  29629.00
 peripheral       | keyboard        | pa    | pittsburgh    |     |  26883.00
 peripheral       | keyboard        | pa    |               |     |  56512.00
 peripheral       | keyboard        |       |               |  38 |  67387.00
 peripheral       |                 |       |               |  38 |  67387.00
 storage          | floppy drive    | oh    | cleveland     |     |   8229.00
 storage          | floppy drive    | oh    |               |     |   8229.00
 storage          | floppy drive    | pa    | mechanicsburg |     | 140410.00
 storage          | floppy drive    | pa    | pittsburgh    |  52 | 200016.00
 storage          | floppy drive    | pa    |               |  52 | 340426.00
 storage          | floppy drive    |       |               |  52 | 348655.00
 storage          | hard disk drive | oh    | cleveland     |     |   8646.00
 storage          | hard disk drive | oh    |               |     |   8646.00
 storage          | hard disk drive | pa    | mechanicsburg |  80 | 194444.00
 storage          | hard disk drive | pa    | pittsburgh    |     | 172391.00
 storage          | hard disk drive | pa    |               |  80 | 366835.00
 storage          | hard disk drive |       |               |  80 | 375481.00
 storage          |                 |       |               | 132 | 724136.00
                  |                 |       |               | 181 | 844276.00
(31 rows)

3. 每种产品类型销售量和销售额和同比如何？

需要查询周期快照v_month_end_sales_order_fact。

dw=> select t2.product_category, 
dw->        t1.year_month,
dw->        sum(quantity1) quantity_cur,
dw->        sum(quantity2) quantity_pre,   
dw->        round((sum(quantity1) - sum(quantity2)) / sum(quantity2),2) pct_quantity,
dw->        sum(amount1) amount_cur,
dw->        sum(amount2) amount_pre,
dw->        round((sum(amount1) - sum(amount2)) / sum(amount2),2) pct_amount
dw->   from (select t1.product_sk,  
dw(>                t1.year_month, 
dw(>                t1.month_order_quantity quantity1,
dw(>                t2.month_order_quantity quantity2,         
dw(>                t1.month_order_amount amount1,
dw(>                t2.month_order_amount amount2
dw(>           from v_month_end_sales_order_fact t1   
dw(>           join v_month_end_sales_order_fact t2 
dw(>             on t1.product_sk = t2.product_sk  
dw(>            and t1.year_month/100 = t2.year_month/100 + 1  
dw(>            and t1.year_month - t1.year_month/100*100 = t2.year_month - t2.year_month/100*100) t1,
dw->         product_dim t2
dw->   where t1.product_sk = t2.product_sk
dw->   group by t2.product_category, t1.year_month
dw->   order by t2.product_category, t1.year_month;  
 product_category | year_month | quantity_cur | quantity_pre | pct_quantity | amount_cur | amount_pre | pct_amount 
------------------+------------+--------------+--------------+--------------+------------+------------+------------
 storage          |     201705 |          943 |              |              |  142814.00 |  110172.00 |       0.30
 storage          |     201706 |          110 |              |              |    9132.00 |  116418.00 |      -0.92
(2 rows)

4. 每个省以及每个城市的客户数量及其消费金额汇总是多少？

dw=> select t2.state,
dw->        t2.city,
dw->        count(distinct customer_sk) sum_customer_num,
dw->        sum(order_amount) sum_order_amount
dw->   from v_sales_order_fact t1, zip_code_dim t2
dw->  where t1.customer_zip_code_sk = t2.zip_code_sk
dw->  group by rollup (t2.state, t2.city)
dw->  order by t2.state, t2.city;
 state |     city      | sum_customer_num | sum_order_amount 
-------+---------------+------------------+------------------
 oh    | cleveland     |                4 |         35181.00
 oh    |               |                4 |         35181.00
 pa    | mechanicsburg |                8 |        375113.00
 pa    | pittsburgh    |               12 |        433982.00
 pa    |               |               20 |        809095.00
       |               |               24 |        844276.00
(6 rows)

5. 迟到订单的比例是多少？

注意，sum_late需要显式转化为numeric数据类型。

dw=> select sum_total, sum_late, round(cast(sum_late as numeric)/sum_total,4) late_pct  
dw->   from (select sum(case when status_date_sk < entry_date_sk then 1 
dw(>                         else 0 
dw(>                     end) sum_late,  
dw(>                count(*) sum_total  
dw(>           from sales_order_fact) t; 
 sum_total | sum_late | late_pct 
-----------+----------+----------
       151 |        2 |   0.0132
(1 row)

6. 客户年消费金额的平均数和中位数是多少？

分别使用两种方法求得平均数和中位数。HAWQ为分析型应用提供了丰富的聚合函数。

dw=> select round(avg(sum_order_amount),2) avg_amount, 
dw->        round(sum(sum_order_amount)/count(customer_sk),2) avg_amount1, 
dw->        percentile_cont(0.5) within group (order by sum_order_amount) median_amount,
dw->        median(sum_order_amount) median_amount1
dw->   from (select customer_sk,sum(order_amount) sum_order_amount
dw(>           from v_sales_order_fact
dw(>          group by customer_sk) t1;
 avg_amount | avg_amount1 | median_amount | median_amount1 
------------+-------------+---------------+----------------
   35178.17 |    35178.17 |         14277 |          14277
(1 row)

7. 客户年消费金额分布处于25%、50%、75%位置的消费金额是多少？

dw=> select percentile_cont(0.25) within group (order by sum_order_amount desc) max_amount_25,
dw->        percentile_cont(0.50) within group (order by sum_order_amount desc) max_amount_50,
dw->        percentile_cont(0.75) within group (order by sum_order_amount desc) max_amount_75
dw->   from (select customer_sk,sum(order_amount) sum_order_amount
dw(>           from v_sales_order_fact
dw(>          group by customer_sk) t1;
 max_amount_25 | max_amount_50 | max_amount_75 
---------------+---------------+---------------
       50536.5 |         14277 |       8342.25
(1 row)

8. 客户年消费金额为“高”、“中”、“低”档的人数及消费金额所占比例是多少？

使用在“ HAWQ取代传统数仓实践（十二）——维度表技术之分段维度”中定义的分段进行查询。

dw=> select year1, 
dw->        bn, 
dw->        c_count, 
dw->        sum_band, 
dw->        sum_total, 
dw->        round(sum_band/sum_total,4) band_pct   
dw->   from (select count(a.customer_sk) c_count,   
dw(>                sum(annual_order_amount) sum_band,  
dw(>                a.year year1,    
dw(>                band_name bn    
dw(>           from annual_customer_segment_fact a,    
dw(>                annual_order_segment_dim b,       
dw(>                annual_sales_order_fact d   
dw(>          where a.segment_sk = b.segment_sk     
dw(>            and a.customer_sk = d.customer_sk    
dw(>            and a.year = d.year  
dw(>            and b.segment_name = 'grid'  
dw(>          group by a.year, bn) t1,  
dw->          (select sum(annual_order_amount) sum_total 
dw(>             from annual_sales_order_fact) t2  
dw->  order by year1, bn;   
 year1 |  bn  | c_count | sum_band  | sum_total | band_pct 
-------+------+---------+-----------+-----------+----------
  2016 | high |       6 | 572190.00 | 572190.00 |   1.0000
(1 row)

9. 每个城市按销售金额排在前三位的商品是什么？

使用HAWQ提供的窗口函数row_number()，按城市分区，按销售额倒序，取得销售排名。

dw=> select case when t1.rn =1 then t1.city end city, 
dw->        t2.product_name, 
dw->        t1.sum_order_amount, 
dw->        t1.rn  
dw->   from (select city, 
dw(>                product_sk,  
dw(>                sum_order_amount,  
dw(>                row_number() over (partition by city order by sum_order_amount desc) rn 
dw(>           from (select t2.state||':'||t2.city city,  
dw(>                        product_sk,   
dw(>                        sum(order_amount) sum_order_amount  
dw(>                   from v_sales_order_fact t1, zip_code_dim t2
dw(>                  where t1.customer_zip_code_sk = t2.zip_code_sk 
dw(>                  group by t2.state||':'||t2.city, product_sk) t) t1 
dw->  inner join product_dim t2 on t1.product_sk = t2.product_sk  
dw->  where t1.rn <= 3  
dw->  order by t1.city, t1.rn; 
       city       |  product_name   | sum_order_amount | rn 
------------------+-----------------+------------------+----
 oh:cleveland     | keyboard        |         10875.00 |  1
                  | hard disk drive |          8646.00 |  2
                  | floppy drive    |          8229.00 |  3
 pa:mechanicsburg | hard disk drive |        194444.00 |  1
                  | floppy drive    |        140410.00 |  2
                  | keyboard        |         29629.00 |  3
 pa:pittsburgh    | floppy drive    |        200016.00 |  1
                  | hard disk drive |        172391.00 |  2
                  | flat panel      |         31605.00 |  3
(9 rows)

10. 所有产品的销售百分比排名？

dw=> select product_name, 
dw->        sum_order_amount,
dw->        percent_rank() over (order by sum_order_amount desc) rank
dw->   from (select product_sk,sum(order_amount) sum_order_amount
dw(>           from v_sales_order_fact 
dw(>          group by product_sk) t1, product_dim t2
dw->  where t1.product_sk = t2.product_sk
dw->  order by rank;
  product_name   | sum_order_amount | rank 
-----------------+------------------+------
 hard disk drive |        375481.00 |    0
 floppy drive    |        348655.00 | 0.25
 keyboard        |         67387.00 |  0.5
 flat panel      |         49666.00 | 0.75
 lcd panel       |          3087.00 |    1
(5 rows)

三、交互查询与图形化显示

1. Zeppelin简介

Zeppelin是一个基于Web的软件，用于交互式地数据分析。它一开始是Apache软件基金会的孵化项目，2016年5月正式成为顶级项目。Zeppelin描述自己是一个可以进行数据摄取、数据发现、数据分析、数据可视化的笔记本，用以帮助开发者、数据科学家以及相关用户更有效地处理数据，而不必使用复杂的命令行，也不必关心集群的实现细节。Zeppelin的架构如图2所示。

图2

从上图中可以看到，Zeppelin具有客户端/服务器架构，客户端一般就是指浏览器。服务器接收客户端的请求，并将请求通过Thrift协议发送给翻译器组。翻译器组物理表现为JVM进程，负责实际处理客户端的请求并与服务器进行通信。
翻译器是一个插件式的体系结构，允许任何语言或后端数据处理程序以插件的形式添加到Zeppelin中。特别需要指出的是，Zeppelin内建Spark翻译器，因此不需要构建单独的模块、插件或库。翻译器的架构如图3所示。

图3

当前的Zeppelin已经支持很多翻译器，如Zeppelin 0.6.0版本自带的翻译器有alluxio、cassandra、file、hbase、ignite、kylin、md、phoenix、sh、tajo、angular、elasticsearch、flink、hive、jdbc、lens、psql、spark等18种之多。插件式架构允许用户在Zeppelin中使用自己熟悉的特定程序语言或数据处理方式。例如，通过使用%spark翻译器，可以在Zeppelin中使用Scala语言代码。
在数据可视化方面，Zeppelin已经包含一些基本的图表，如柱状图、饼图、线形图、散点图等，任何支持的后端语言输出都可以被图形化表示。
在Zeppelin中，用户建立的每一个查询叫做一个note，note的URL在多用户间共享，Zeppelin将向所有用户实时广播note的变化。Zeppelin还提供一个只显示查询结果的URL，该页不包括任何菜单和按钮。用这种方式可以方便地将结果页作为一帧嵌入到自己的web站点中。

2. 使用Zeppelin执行HAWQ查询

（1）安装Zeppelin
HDP 2.5.0安装包中已经集成了Zeppelin 0.6.0，因此不需要单独进行复杂的安装配置，只要启动Zeppelin服务就可以了。

（2）配置Zeppelin支持HAWQ
Zeppelin 0.6.0通过JDBC翻译器解析HAWQ查询，只需进行简单的配置即可，步骤如下。

在Ambari控制台主页面中，点击Services -> Zeppelin Notebook -> Quick Links -> Zeppelin UI，打开Zeppelin UI主页面。
在Zeppelin UI主页面中，点击anonymous -> interpreter，进入翻译器页面。
点击edit编辑jdbc翻译器，配置default.driver、default.password、default.url、default.user四个属性的值，我的配置如图4所示。

图4

配置好后点击Save保存配置，然后点击restart重启jdbc翻译器，至此配置完成。

（3）在Zeppelin中执行HAWQ查询
点击Notebook -> Create new note，新建一个note，在其中输入查询语句，如“每种产品类型以及单个产品在每个省、每个城市的月销售量和销售额是多少？”的查询。

%jdbc
select t2.product_category, t2.product_name, t3.state, t3.city, sum(nq) sq, sum(order_amount) sa
  from v_sales_order_fact t1, product_dim t2, zip_code_dim t3 
 where t1.product_sk = t2.product_sk
   and t1.customer_zip_code_sk = t3.zip_code_sk
 group by t2.product_category, t2.product_name, t3.state, t3.city
 order by t2.product_category, t2.product_name, t3.state, t3.city;

运行结果的表格、柱状图、饼图、堆叠图、线形图、散点图分别如图5-图10所示。

图5

图6

图7

图8

图9

图10

一个note中可以独立执行多个查询语句。图形显示可以根据不同的“settings”联机分析不同的指标。报表有default、simple、report三种可选样式。例如，报表样式的饼图表示如图11所示。

图11

可以点击如图12红框中所示的链接单独引用此报表。

图12

单独的页面能根据查询或设置的修改而实时变化，比如将Values由sa列改为sq列，饼图表变为图13的样子。

图13

单独链接的页面也随之自动发生变化，如图14所示。

图14

Zeppelin支持联机输入变量值，例如，要查询某一年的销售情况，查询语句改为：

%jdbc
select t2.product_category, t2.product_name, t3.state, t3.city, sum(nq) sq, sum(order_amount) sa
  from v_sales_order_fact t1, product_dim t2, zip_code_dim t3 
 where t1.product_sk = t2.product_sk
   and t1.customer_zip_code_sk = t3.zip_code_sk
   and t1.year_month/100 = ${year}
 group by t2.product_category, t2.product_name, t3.state, t3.city
 order by t2.product_category, t2.product_name, t3.state, t3.city;

在运行查询时会在页面中出现一个输入框，填入适当的变量值运行查询，如图15所示。

图15

甚至可以动态定义查询的列，例如查询语句改为：

%jdbc
select ${checkbox:fields=t2.product_category, t2.product_category|t2.product_name},t3.state, t3.city, sum(nq) sq, sum(order_amount) sa
  from v_sales_order_fact t1, product_dim t2, zip_code_dim t3 
 where t1.product_sk = t2.product_sk
   and t1.customer_zip_code_sk = t3.zip_code_sk
   and t1.year_month/100 = ${year}
 group by ${checkbox:fields=t2.product_category, t2.product_category|t2.product_name}, t3.state, t3.city
 order by ${checkbox:fields=t2.product_category, t2.product_category|t2.product_name}, t3.state, t3.city;

查询运行时出现字段复选框，如图16所示。

图16

参考： https://zeppelin.apache.org/docs/latest/manual/dynamicform.html

【数据交易】全国数据交易所的发展现状暴躁小师兄数据学院数据治理区块链
全国数据交易所概述数据交易所是专门为数据资产（如数据集、数据产品）提供交易、流通和服务的平台，类似于传统金融交易所，但针对数据要素市场。在中国，随着数据被列为生产要素，国家积极推动数据交易所建设，以促进数据资源的高效配置和市场化流通。以下是中国主要的数据交易所及其现状。主要数据交易所列表上海数据交易所成立时间：2021年11月定位：中国首个国家级数据交易所，由上海市政府主导，旨在打造全球数据要素配
Web3解读：解锁去中心化网络的潜力清晨反侦测指纹浏览器社交媒体 web3 去中心化区块链 tiktok facebook instagram ClonBrowser
随着互联网技术的飞速发展，我们正在进入一个新的时代——Web3。Web3不仅仅是一个技术概念，它代表了一种全新的网络架构和价值交换方式。本文将深入探讨Web3的核心理念，以及它如何解锁去中心化网络的潜力。什么是Web3？Web3是一个基于区块链技术的去中心化网络，它旨在提供一个更加开放、透明和安全的互联网环境。与传统的Web2相比，Web3强调用户对数据的控制权，以及数据的不可篡改性。在Web3中
基于机器学习的智能文本分类技术研究与应用
在当今数字化时代，文本数据的爆炸式增长给信息管理和知识发现带来了巨大的挑战。从新闻文章、社交媒体帖子到企业文档和学术论文，海量的文本数据需要高效地分类和管理，以便用户能够快速找到所需信息。传统的文本分类方法主要依赖于人工规则和关键词匹配，这些方法不仅效率低下，而且难以应对复杂多变的文本内容。近年来，机器学习技术的快速发展为文本分类提供了一种高效、自动化的解决方案。一、机器学习在文本分类中的应用概述
C# 中 EventWaitHandle 实现多进程状态同步的深度解析 Leon@Lee c#开发语言
在现代软件开发中，多进程应用场景日益普遍。无论是分布式系统、微服务架构，还是传统的客户端-服务器模型，进程间的状态同步都是一个关键挑战。C#提供了多种同步原语，其中EventWaitHandle是一个强大的工具，特别适合处理跨进程的同步需求。本文将深入探讨EventWaitHandle的工作原理、使用场景及最佳实践。一、EventWaitHandle基础原理EventWaitHandle是.NET
Golang cron 定时任务完全指南：从入门到精通 Golang编程笔记 Golang编程笔记 Golang开发实战 golang wpf 开发语言 ai
Golangcron定时任务完全指南：从入门到精通关键词：Golang、cron、定时任务、任务调度、并发处理、分布式任务、最佳实践摘要：本文将全面介绍Golang中实现cron定时任务的各个方面，从基础概念到高级应用，涵盖标准库使用、第三方库对比、并发处理、分布式任务调度等核心内容。我们将通过详细的代码示例、架构图解和实际应用场景分析，帮助开发者掌握在Golang中构建可靠、高效的定时任务系统的
基于SIP的视频会议系统研究 weixin_33921089 数据库
摘要根据IETFSIPPING工作组提出的集中式会议模型，设计并实现了基于SIP的视频会议系统。该系统各部分可分别设计，具有良好的可扩展性。详细介绍了此系统的结构和工作原理。关键词SIP视频会议会议控制服务器会场控制媒体服务器0前言近几年来，随着计算机技术、通信技术和互联网技术的飞速发展，视频会议的应用范围正逐渐从传统的专业领域、大型企业等高端用户向中小企业等普通用户和个人用户拓展。据有关机构的分
微软全新开源的Agentic Web网络项目：NLWeb详解 kevin luan AI 工作流编程 microsoft 前端网络
引言在2025年5月的MicrosoftBuild开发者大会上，微软推出了一个全新的开源项目——NLWeb（NaturalLanguageWeb，自然语言网络），被誉为“AgenticWeb（代理网络）”的基石，目标是将传统网页转变为支持自然语言交互的智能AI应用。微软将其比作Web时代的HTML，旨在通过简单的方式为网站添加对话式AI接口，让用户和AI代理能够以自然语言直接查询和交互网站内容。本
Linux设备驱动开发详解 - 基于Linux 4.0内核
Linux设备驱动开发详解-基于Linux4.0内核去发现同类优质开源项目:https://gitcode.com/欢迎使用《Linux设备驱动开发详解》资源库本资源库致力于为Linux设备驱动开发者提供一份基于Linux4.0内核的详细指南和实践材料。随着Linux内核不断迭代，理解并掌握其最新特性和驱动开发的方法论变得尤为重要。本项目特别针对那些想要深入了解Linux内核机制、尤其是驱动程序开
地产销售：用业余时间做了一个楼盘SCRM小程序？
为了完成销售业绩和用户满意，做了个小程序。–六居地产朱同学1需求背景六居地产，一家无锡专业的房地产中介公司，主要提供二手房买卖交易信息、房屋出租等服务，在房产销售领域，团队成员一直还在传统的微信笔记分享方式传递房产资料。随着房地产销售业绩下滑，六居地产销售团队面临着如何更有效地分发房产资源和持续运营客户的挑战，急需能够丰富资源展示并获取客户联系方式的解决方案。2选型之路六居公司以业务为重，客户体量
Linux 驱动开发详解：从入门到实践 Jay_515 Linux 学习 linux 驱动嵌入式
本文带你深入理解Linux内核驱动的核心机制，掌握从零编写字符设备驱动的完整流程一、Linux驱动概述：内核与硬件的桥梁Linux驱动是操作系统内核的一部分，负责管理硬件设备并向上层应用程序提供统一接口。其核心价值在于：抽象硬件细节：让应用程序无需关心硬件具体实现统一设备接口：通过标准接口（如字符设备、块设备）访问硬件内核级资源管理：直接操作硬件寄存器，管理中断、DMA等Linux驱动的类型：驱动
XSL-FO 块：深入解析与最佳实践沐知全栈开发开发语言
XSL-FO块：深入解析与最佳实践概述XSL-FO（XSLFormattingObjects）是一种用于生成格式化文档的语言，它允许开发者将XML数据转换成PDF、HTML、PostScript等格式。在XSL-FO中，块（Block）是一个重要的概念，它定义了文档中的矩形区域，包括文本、图像、表格等。本文将深入解析XSL-FO块的相关知识，并分享一些最佳实践。XSL-FO块的定义与属性定义XSL
16.2 Docker多阶段构建实战：LanguageMentor镜像瘦身40%，支持500+并发1.2秒响应！少林码僧 docker langchain windows 人工智能语言模型 llama 运维
LanguageMentorAgent容器化部署与发布：Docker镜像创建与测试关键词：Docker容器化部署,多阶段构建,镜像分层优化,环境一致性,私有化模型集成1.Dockerfile最佳实践架构设计通过多阶段构建策略实现开发与生产环境分离：
PostgreSQL 容器化分布式技术方案 TechVision大咖圈 postgresql 分布式数据库分布式数据库
目录引言：为什么选择容器化PostgreSQLPostgreSQL容器化基础分布式架构设计高可用实现方案读写分离架构动态扩缩容策略生产环境实践总结与展望引言：为什么选择容器化PostgreSQL在数字化转型的浪潮中，数据库作为企业的"心脏"，其稳定性和扩展性直接影响着业务的成败。PostgreSQL作为世界上最先进的开源关系型数据库，配合容器化技术，就像是给数据库插上了翅膀——既保持了数据的可靠性
Spring AI入门教学：从零搭建智能应用（2025最新实践）程序员子固 spring 人工智能 java ai
目录引言：为什么选择SpringAI？一、环境搭建（附避坑指南）1.开发环境要求2.依赖配置二、实战：智能客服接入（代码级详解）1.配置模型参数2.实现流式对话接口三、高级功能：多模态AI开发1.图像描述生成2.智能文档处理四、开发者工具箱1.调试技巧2.性能优化五、学习路径建议引言：为什么选择SpringAI？随着生成式AI技术的爆发式发展（如OpenAI的GPT-4.5新动态24），Java开
DeepSeek-V3混合精度推理（FP8/BF16）原理与实战全解析 CarlowZJ DEEPSEEK-V3
目录摘要混合精度推理的背景与意义DeepSeek-V3混合精度架构设计FP8与BF16核心原理详解混合精度推理核心实现实践案例：FP8权重转BF16与推理部署常见问题与注意事项最佳实践与扩展建议总结参考资料附录：可视化图表1.摘要本文系统梳理DeepSeek-V3在FP8/BF16混合精度推理方面的架构设计与工程实现，结合源码与实际案例，帮助开发者深入理解其混合精度推理原理、工程落地方法与性能优化
高通 audio pal 配置文件盼雨落，等风起 audio 音视频
一、PAL配置文件解析1.mixer_paths.xml-硬件控制中枢核心作用：物理通路定义：建立Codec寄存器到音频端点的信号链路动态控制：运行时通过ALSAControlAPI（如amixerset"SpkrLeftPAVolume"25）实时调整参数平台适配：文件命名规则mixer_paths__.xml（如mixer_paths_sm8550-demo.xml）调试技巧：使用tinymi
一套源码搞定教育平台搭建？Web端网校系统开发详解万岳科技程序员小金教育平台开发 APP开发软件开发在线教育系统源码教育APP开发网校平台搭建 PHP uniapp
曾经线下授课、纸质教材为主的传统教育模式，逐步被智能化、在线化、个性化的“云课堂”所替代。而Web端网校系统，正成为搭建在线教育平台的核心载体。许多教育机构、企业培训部甚至个体讲师都在思考一个问题：是否可以通过一套完整的网校系统源码，就快速搭建出属于自己的在线教育平台？答案是肯定的，但背后涉及的技术、架构与运营逻辑，却远非“买个源码一部署”这么简单。今天，就以笔者在Web端网校系统开发中的实践经验
Python编程核心技能提升指南：从第2版到第3版月末刀戈
本文还有配套的精品资源，点击获取简介：《Python核心编程中文版》详细介绍了Python的基础和高级编程主题，适合不同层次的学习者。覆盖了正则表达式的使用、网络编程基础、互联网客户端协议应用、多线程编程技巧，以及GUI编程等核心模块。本书通过丰富的实例和详细的解析，帮助读者掌握文本处理、网络通信、并发任务处理和桌面应用开发的关键技能，为深入学习和专业实践提供全面支持。1.Python编程基础1.
《多设备协同训练：HarmonyOS联邦学习驱动Unity游戏AI进化》爱学习的小齐哥哥 HarmonyOS 5 Unity 游戏 HarmonyOS5 unity 游戏引擎 Unity 游戏
随着游戏产业的智能化升级，游戏AI正从传统的规则驱动向数据驱动的“自进化”模式转型。然而，传统游戏AI训练面临数据孤岛、计算资源受限、隐私安全风险三大核心挑战：单设备训练难以处理复杂场景的海量数据，集中式训练需上传用户行为数据（侵犯隐私），且高性能计算依赖云端或专用硬件（成本高、延迟大）。在此背景下，HarmonyOS联邦学习与多设备协同训练的融合，为Unity游戏AI的智能化进化提供了突破性解决
Java项目RestfulAPI设计最佳实践 java1234_小锋 java java 开发语言
大家好，我是锋哥。今天分享关于【Java项目RestfulAPI设计最佳实践】面试题。希望对大家有帮助；Java项目RestfulAPI设计最佳实践超硬核AI学习资料，现在永久免费了！设计一个高效、易维护的Java项目中的RESTfulAPI涉及到一系列的最佳实践。以下是一些常见的Java项目RESTfulAPI设计最佳实践：1.使用HTTP方法GET:用于获取资源（不应有副作用，应该是安全的和幂
RabbitMQ 使用教程小凯 ོ rabbitmq 分布式
作者：小凯哥沉淀、分享、成长，让自己和他人都能有所收获！本文的宗旨在于通过简单干净实践的方式教会读者，使用Docker配置RabbitMQ在DDD结构下验证使用。关于MQ的场景内容已经在RocketMQ(opensnewwindow)一节中做了讲解，本文只要为大家扩展另外一种MQ的使用。方便有需要的伙伴可以做技术栈替换。RabbitMQ(opensnewwindow)是一个由Erlang开发的AM
MySQL 开发规范和使用约束小凯 ོ mysql android 数据库
作者：小凯沉淀、分享、成长，让自己和他人都能有所收获！本文的宗旨在于通过简单干净实践的方式教会读者，如何更好地使用MySQL数据库。这包括；库表创建规范、字段的创建规范、索引的创建规范以及SQL使用的相关规范，通过这些内容的讲解，让读者更好使用MySQL数据库，创建出符合规范的表和字段以及建出合适的索引。如果你还想学习更深入的MySQL知识，建议可以阅读下官网的参考手册，这比任何一个资料都要有权威
Go Web开发框架实践：模板渲染与静态资源服务程序员爱钓鱼 golang 开发语言后端网络
Gin不仅适合构建API服务，也支持HTML模板渲染和静态资源托管，使其可以胜任中小型网站开发任务。一、模板渲染基础1.加载模板文件使用LoadHTMLGlob或LoadHTMLFiles方法加载模板：r := gin.Default()r.LoadHTMLGlob("templates/*") // 支持通配符或：r.LoadHTMLFiles("templates/index.tmpl", "
MCP-安全（代码实例） goodfornothing-s MCP 安全
安全最佳实践安全性对于MCP实施至关重要，尤其是在企业环境中。务必确保工具和数据免受未经授权的访问、数据泄露和其他安全威胁。介绍在本课中，我们将探讨MCP实施的安全最佳实践。我们将涵盖身份验证和授权、数据保护、安全工具执行以及数据隐私法规合规性。学习目标学完本课后，您将能够：为MCP服务器实施安全的身份验证和授权机制。使用加密和安全存储保护敏感数据。通过适当的访问控制确保工具的安全执行。应用数据保
前端跨域解决方案（7）：Node中间件骆驼Lara 前端跨域解决方案汇总前端中间件 javascript
1Node中间件核心1.1为什么开发环境需要Node代理？在前端开发中，我们常遇到：前端运行在localhost:3000，后端API在localhost:4000，跨域导致请求失败。而传统解决方案有以下局限性：修改后端CORS配置：需后端开发配合，增加沟通成本；生产环境与开发环境配置不一致。配置Nginx反向代理：修改配置后需重启服务，打断开发流程；配置文件管理复杂。Node中间件代理（如htt
管家婆订货易在线商城 VshopProcess 任意文件上传漏洞复现 0xSecl 漏洞复现v1 安全 web安全
0x01产品简介管家婆订货易，帮助传统企业构建专属的订货平台，PC+微信+APP+小程序+h5商城5网合一，无缝对接线下的管家婆ERP系统，让用户订货更高效。支持业务员代客下单，支持多级推客分销，以客带客，拓展渠道。让企业的生意更轻松。0x02漏洞概述管家婆订货易在线商城VshopProcess.ashx接口处存在任意文件上传漏洞，未经身份认证的攻击者可以通过该漏洞，上传恶意后门文件，深入利用可造
AWS EventBridge的精准匹配规则实践 t0_54coder 编程问题解决手册 aws 算法 javascript 个人开发
在使用AWS服务的过程中，EventBridge（事件桥接）是一个非常强大的工具，它可以帮助我们捕获和处理各种事件。不过，如何编写一个精确的事件匹配规则却是一项挑战。今天，我们将探讨如何创建一个EventBridge规则模式，以捕获特定格式的S3事件。事件背景假设我们有一个S3存储桶，其中包含了以下格式的事件：{"requestParameters":{"bucketName":"mybucket
Gitee 持续集成与交付（CI/CD）篇
Gitee持续集成与交付（CI/CD）篇文章目录Gitee持续集成与交付（CI/CD）篇什么是CI/CD？GiteeGo介绍✨核心特性支持的技术栈提交项目进行CI/CD第一步：创建.gitee-ci.yml文件第二步：配置项目设置第三步：提交代码触发构建制品库配置Maven制品库配置Docker制品库配置npm制品库配置⚙️流水线配置示例与实践JavaSpringBoot项目示例Vue.js前端项
小程序推客带货平台：技术实现与生态逻辑解析 hedian116 小程序 java
区别于传统电商，小程序推客平台通过轻量化载体+社交裂变重构了商品流通路径。其技术架构需同时应对**高并发交易**和**复杂分佣逻辑**，以下是核心模块的实现解析：一、佣金引擎：动态规则计算（Python伪代码示例）pythonclassCommissionEngine:def__init__(self,rule_config):#从DB加载规则：{level:[比例,固定值],max_level:
C#实践小游戏--俄罗斯方块 DamnF-- c#开发语言游戏程序
整体游戏架构游戏主循环(Game)├─场景系统│├─开始场景(BeginScene)│├─游戏场景(GameScene)│└─结束场景(EndScene)│├─方块系统│├─方块控制器(BlockWorker)│├─方块形态数据(BlockInfo)│└─绘制单元(DrawObject)│├─地图系统(Map)├─输入系统(InputCheak)├─坐标系统(Position)└─接口规范(IDr
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出