kangna_卧龙先生

Kylin 学习笔记（二）-----Kylin增量构建入门、Cube碎片管理、JDBC连接、Cube简单优化

一、Kylin增量构建

1、应用场景

2、理解Cube、Cuboid与Segment的关系

3、全量构建与增量构建全量构建

4、增量构建Cube过程

5、增量Cube的创建-案例

Kylin操作步骤

二、Cube碎片管理

1、增量构建的问题

2、管理Cube碎片

3、手动触发合并Segment

3、删除Segment

4、自动合并

5、配置保留Segment

三、使用JDBC连接操作Kylin

四、Kylin Cube优化-Cuboid剪枝优化

1、为什么要进行Cuboid剪枝优化

2、检查Cuboid数量

3、检查Cube大小

4、使用衍生维度

5、聚合组

一、Kylin增量构建

1、应用场景

Kylin在每次Cube的构建都会从Hive中批量读取数据，而对于大多数业务场景来说，Hive中的数据处于不断增长的状态。为了支持Cube中的数据能够不断地得到更新，且无需重复地为已经处理过的历史数据构建Cube，因此对于Cube引入了增量构建的功能

2、理解Cube、Cuboid与Segment的关系

Kylin将Cube划分为多个Segment（对应就是HBase中的一个表），每个Segment用起始时间和结束时间来标识。
Segment代表一段时间内源数据的预计算结果。
一个Segment的起始时间等于它之前那个Segment的结束时间，同理，它的结束时间等于它后面那个Segment的起始时间。
同一个Cube下不同的Segment除了背后的源数据不同之外，其他如结构定义、构建过程、优化方法、存储方式等都完全相同。

一个Cube，可以包含多个Cuboid，而Segment是指定时间范围的Cube，可以理解为Cube的分区。对应就是HBase中的一张表。该表中包含了所有的Cuboid。

例如：以下为针对某个Cube的Segment

3、全量构建与增量构建

全量构建

在全量构建中，Cube中只存在唯一的一个Segment，该Segment没有分割时间的概念，也就没有起始时间和结束时间。

全量构建和增量构建各有其适用的场景，用户可以根据自己的业务场景灵活地进行切换。

对于全量构建来说，每当需要更新Cube数据的时候，它不会区分历史数据和新加入的数据，也就是说，在构建的时候会导入并处理所有的原始数据。

增量构建

增量构建只会导入新Segment指定的时间区间内的原始数据，并只对这部分原始数据进行预计算。

全量构建和增量构建的对比

全量构建Cube全量构建与增量构建的Cube查询方式对比：

- 查询引擎只需向存储引擎访问单个Segment所对应的数据，无需进行Segment之间的聚合
- 为了加强性能，单个Segment的数据也有可能被分片存储到引擎的多个分区上，查询引擎可能仍然需要对单个Segment不同分区的数据做进一步的聚合
增量构建Cube
- 由于不同时间的数据分布在不同的Segment之中，查询引擎需要向存储引擎请求读取各个Segment的数据
- 增量构建的Cube上的查询会比全量构建的做更多的运行时聚合，通常来说增量构建的Cube上的查询会比全量构建的Cube上的查询要慢一些

对于小数据量的Cube，或者经常需要全表更新的Cube，使用全量构建需要更少的运维精力，以少量的重复计算降低生产环境中的维护复杂度。而对于大数据量的Cube，例如，对于一个包含两年历史数据的Cube，如果需要每天更新，那么每天为了新数据而去重复计算过去两年的数据就会变得非常浪费，在这种情况下需要考虑使用增量构建

4、增量构建Cube过程

1、指定分割时间列

增量构建Cube的定义必须包含一个时间维度，用来分割不同的Segment，这样的维度称为分割时间列（Partition Date Column）。

2、增量构建过程

在进行增量构建时，将增量部分的起始时间和结束时间作为增量构建请求的一部分提交给Kylin的任务引擎
任务引擎会根据起始时间和结束时间从Hive中抽取相应时间的数据，并对这部分数据做预计算处理
将预计算的结果封装成为一个新的Segment，并将相应的信息保存到元数据和存储引擎中。一般来说，增量部分的起始时间等于Cube中最后一个Segment的结束时间。

5、增量Cube的创建-案例

准备动作

1.执行建表语句

-- 1. 创建数据库、创建表
create database if not exists `kylin_dw`;

-- 2. 创建用户维度表
create table `kylin_dw`.`dim_user`(
    id string,
    name string
)
row format delimited fields terminated by ',';

-- 3. 创建订单事实表
create table `kylin_dw`.`fact_order`(
    order_id string,
    user_id string,
    price int
)
partitioned by (dt string)
row format delimited fields terminated by ',';

2.导入数据

load data local inpath '/export/datas/kylin_demos/data_dim_user.txt' overwrite into table `itcast_kylin_dw`.`dim_user`;
load data local inpath '/export/datas/kylin_demos/data_order_20191011.txt' overwrite into table `kylin_dw`.`fact_order` partition(dt='20191011');
load data local inpath '/export/datas/kylin_demos/data_order_20191012.txt' overwrite into table `kylin_dw`.`fact_order` partition(dt='20191012');
load data local inpath '/export/datas/kylin_demos/data_order_20191013.txt' overwrite into table `kylin_dw`.`fact_order` partition(dt='20191013');

创建增量Cube的过程和创建普通Cube的过程基本类似，只是增量Cube会有一些额外的配置要求

Hive的SQL语句


select 
    t1.user_id,
    t2.name,
    max(t1.price)

from itcast_kylin_dw.fact_order t1
left join itcast_kylin_dw.dim_user t2
on t1.user_id = t2.id
group by t1.user_id,t2.name;

Kylin操作步骤

1、配置Model

增量构建的Cube需要指定分割时间列。

例如：将日期分区字段添加到维度列中

在设置中，配置分区列，并指定日期格式

2.配置Cube

运行Cube

注意事项

注意构建Cube时，选择的分区时间为，起始时间（包含）、结束时间（不保存），对应了从Hive从获取数据源的条件

INSERT OVERWRITE TABLE `kylin_intermediate_cube_order_1582ee64_45f9_cf22_bef2_e0b455efc284` SELECT
`FACT_ORDER`.`DT` as `FACT_ORDER_DT`
,`FACT_ORDER`.`USER_ID` as `FACT_ORDER_USER_ID`
,`FACT_ORDER`.`PRICE` as `FACT_ORDER_PRICE`
 FROM `ITCAST_KYLIN_DW`.`FACT_ORDER` as `FACT_ORDER`
INNER JOIN `ITCAST_KYLIN_DW`.`DIM_USER` as `DIM_USER`
ON `FACT_ORDER`.`USER_ID` = `DIM_USER`.`ID`
WHERE 1=1 AND (`FACT_ORDER`.`DT` >= '20191011' AND `FACT_ORDER`.`DT` < '20191012');

查看增量构建Cube对应的Segment

增量构建Cube 的时候，每个时间段的数据对应一个 Segment ,一个 Segement 对应一个HBase表。

二、Cube碎片管理

1、增量构建的问题

日积月累，增量构建的Cube中的Segment越来越多，该Cube的查询性能也会越来越慢，因为需要在单点的查询引擎中完成越来越多的运行时聚合。为了保持查询性能：

需要定期地将某些Segment合并在一起
或者让Cube根据Segment保留策略自动地淘汰那些不会再被查询到的陈旧Segment

2、管理Cube碎片

上述案例，每天都会生成一个Segment，对应就是HBase中的一张表。增量构建的Cube每天都可能会有新的增量。这样的Cube中最终可能包含上百个Segment，这将会导致Kylin性能受到严重的影响。

从执行引擎的角度来说，运行时的查询引擎需要聚合多个Segment的结果才能返回正确的查询结果
从存储引擎的角度来说，大量的Segment会带来大量的文件，给存储空间的多个模块带来巨大的压力，例如Zookeeper、HDFS Namenode等

因此，有必要采取措施控制Cube中Segment的数量。

3、手动触发合并Segment

Kylin提供了一种简单的机制用于控制Cube中Segment的数量：合并Segments。在Web GUI中选中需要进行Segments合并的Cube

操作步骤：

1、单击Action→Merge

2、选中需要合并的Segment，可以同时合并多个Segment，但是这些Segment必须是连续的

单击提交后系统会提交一个类型为“MERGE”的构建任务，它以选中的Segment中的数据作为输入，将这些Segment的数据合并封装成为一个新的Segment。新的Segment的起始时间为选中的最早的Segment的起始时间，它的结束时间为选中的最晚的Segment的结束时间。

注意事项

在MERGE类型的构建完成之前，系统将不允许提交这个Cube上任何类型的其他构建任务

在MERGE构建结束之前，所有选中用来合并的Segment仍然处于可用的状态

当MERGE构建结束的时候，系统将选中合并的Segment替换为新的Segment，而被替换下的Segment等待将被垃圾回收和清理，以节省系统资源

3、删除Segment

使用WebUI删除Cube

1、disable Cube

2、点击 delete Segment，删除指定的segment

4、自动合并

手动维护Segment很繁琐，人工成本很高，Kylin中是可以支持自动合并Segment。

在Cube Designer的“Refresh Settings”的页面中有：

Auto Merge Thresholds
Retention Threshold

两个设置项可以用来帮助管理Segment碎片。这两项设置搭配使用这两项设置可以大大减少对Segment进行管理的麻烦。

1、Auto Merge Thresholds

允许用户设置几个层级的时间阈值，层级越靠后，时间阈值就越大
每当Cube中有新的Segment状态变为 READY的时候，会自动触发一次系统自动合并
合并策略
- 尝试最大一级的时间阈值，例如：针对（7天、28天）层级的日志，先检查能否将连续的若干个Segment合并成为一个超过28天的大Segment
  - 如果有个别的Segment的时间长度本身已经超过28天，系统会跳过Segment
  - 如果满足条件的连续Segment还不能够累积超过28天，那么系统会使用下一个层级的时间阈值重复寻找

示例1 - 理解Kylin自动合并策略

假设自动合并阈值设置为7天、28天
如果现在有A-H8个连续的Segment，它们的时间长度为28天（A）、7天（B）、1天（C）、1天（D）、1天（E）、1天（F）、1天（G）、1天（H）
此时，第9个Segment I加入，时间长度为1天。

自动合并策略为：

1、Kylin判断时候能将连续的Segment合并到28天这个阈值，由于Segment A已经超过28天，会被排除

2、剩下的连续Segment，所有时间加一起 B + C + D + E + F + G + H + I （7 + 1 + 1 + 1 + 1 + 1 + 1 + 1 = 14） < 28天，无法满足28天阈值，开始尝试7天阈值

3、跳过A（28）、B（7）均超过7天，排除

4、剩下的连续Segment，所有时间加一起 C + D + E + F + G + H + I（1 + 1 + 1 + 1 + 1 + 1 + 1 = 7）达到7天阈值，触发合并，提交Merge任务。并构建一个Segment X（7天）

5、合并后，Segment为：A（28天）、B（7天）、X（7天）

6、继续触发检查，A（28天）跳过，B + X（7 + 7 = 14）< 28天，不满足第一阈值，重新使用第二阈值触发

7、跳过B、X，尝试终止

一句话总结：局部相加满足小的阈值合并

2、示例：配置自动合并2天的Segment

操作步骤：

1、配置自动合并阈值为（2、3）

2、分别按照天构建分区Cube

3、自动触发合并Segment构建

5、配置保留Segment

自动合并是将多个Segment合并为一个Segment，以达到清理碎片的目的。保留Segment则是及时清理不再使用的Segment。

在很多场景中，只会对过去一段时间内的数据进行查询，例如：

对于某个只显示过去1年数据的报表
支撑它的Cube其实只需要保留过去一年类的Segment即可
由于数据在Hive中已经存在备份，则无需在Kylin中备份超过一年的历史数据

可以将Retention Threshold设置为365。每当有新的Segment状态变为READY的时候，系统会检查每一个Segment。如果它的结束时间距离最晚的一个Segment的结束时间已经大于等于“Retention Threshold”，那么这个Segment将被视为无需保留。系统会自动地从Cube中删除这个Segment。

需求：

配置保留Segment为2天，分别构建增量Segment，测试Segment保留情况

操作步骤：

1、在Cube中设置Retention Range为2

2、重新构建Cube

3、测试超过指定保留时间的Segment，是否被自动移除

三、使用JDBC连接操作Kylin

要将数据以可视化方式展示出来，需要使用Kylin的JDBC方式连接执行SQL，获取Kylin的执行结果
使用Kylin的JDBC与JDBC操作MySQL一致
- jdbc url
  - jdbc:kylin://node01:7070/itcast_dw
- 用户名密码：ADMIN/KYLIN

需求

通过JDBC方式，查询按照日期、区域、产品维度统计订单总额/总数量结果

开发步骤

导入驱动依赖


    
    
        org.apache.kylin
        kylin-jdbc
        2.6.3
    
    
        com.google.guava
        guava
        27.1-jre

1、加载驱动

2、创建Connection连接对象

3、构建SQL语句

4、创建Statement对象，并执行executeQuery

5、打印结果

参考代码


public static void main(String[] args) throws Exception {
    // 1、加载驱动
    Class.forName("org.apache.kylin.jdbc.Driver");
    // 2、创建Connection连接对象
    // 连接字符串：jdbc:kylin://ip地址:7070/项目名称
    Connection connection = DriverManager.getConnection("jdbc:kylin://node01:7070/kylin_dw_test",
                                                        "ADMIN",
                                                        "KYLIN");

    // 3、创建Statement对象，并执行executeQuery，获取ResultSet
    Statement statement = connection.createStatement();

    // 构建SQL和语句
    String sql = "select\n" +
        "  t1.date1,\n" +
        "  t2.regionname,\n" +
        "  productname,\n" +
        "  sum(t1.price) as total_money,\n" +
        "  sum(t1.amount) as total_amount\n" +
        "from\n" +
        "  dw_sales t1\n" +
        "inner join dim_region t2\n" +
        "on t1.regionid = t2.regionid\n" +
        "inner join dim_product t3\n" +
        "on t1.productid = t3.productid\n" +
        "group by\n" +
        "  t1.date1,\n" +
        "  t2.regionid,\n" +
        "  t2.regionname,\n" +
        "  t3.productid,\n" +
        "  t3.productname";
    ResultSet resultSet = statement.executeQuery(sql);

    // 4、打印ResultSet
    while(resultSet.next()) {
        // 4.1 获取时间
        String date1 = resultSet.getString("date1");
        // 4.2 获取区域名称
        String regionname = resultSet.getString("regionname");
        // 4.3 获取产品名称
        String productname = resultSet.getString("productname");
        // 4.4 总金额
        String total_money = resultSet.getString("total_money");
        // 4.5 总数量
        String total_amount = resultSet.getString("total_amount");

        System.out.println(date1 + " " + regionname + " " + productname + " " + total_money + " " + total_amount);
    }

    connection.close();
}

四、Kylin Cube优化-Cuboid剪枝优化

1、为什么要进行Cuboid剪枝优化

将以减少Cuboid数量为目的的Cuboid优化统称为Cuboid剪枝。在没有采取任何优化措施的情况下，Kylin会对每一种维度的组合进行预计算，每种维度的组合的预计算结果被称为Cuboid。

如果有4个维度，可能最终会有2^4 =16个Cuboid需要计算。但在实际开发中，用户的维度数量一般远远大于4个。
如果有10个维度，那么没有经过任何优化的Cube就会存在2^10 =1024个Cuboid
如果有20个维度，那么Cube中总共会存在2^20 =104 8576个Cuboid

这样的Cuboid的数量就足以让人想象到这样的Cube对构建引擎、存储引擎压力非常巨大。因此，在构建维度数量较多的Cube时，尤其要注意Cube的剪枝优化。

Cube的剪枝优化是一种试图减少额外空间占用的方法，这种方法的前提是不会明显影响查询时间。在做剪枝优化的时候，

需要选择跳过那些“多余”的Cuboid
有的Cuboid因为查询样式的原因永远不会被查询到，因此显得多余
有的Cuboid的能力和其他Cuboid接近，因此显得多余

Kylin提供了一系列简单的工具来帮助他们完成Cube的剪枝优化

2、检查Cuboid数量

Apache Kylin提供了一个简单的工具，检查Cube中哪些Cuboid最终被预计算了，称这些Cuboid为被物化的Cuboid，该工具还能给出每个Cuboid所占空间的估计值。由于该工具需要在对数据进行一定阶段的处理之后才能估算Cuboid的大小，因此一般来说只能在Cube构建完毕之后再使用该工具。

使用如下的命令行工具去检查这个Cube中的Cuboid状态：

bin/kylin.sh org.apache.kylin.engine.mr.common.CubeStatsReader CUBE_NAME 
# CUBE_NAME 想要查看的Cube的名字

示例：


bin/kylin.sh org.apache.kylin.engine.mr.common.CubeStatsReader cube_order 

============================================================================
Statistics of cube_order[20191011000000_20191015000000]

Cube statistics hll precision: 14
Total cuboids: 3
Total estimated rows: 20
Total estimated size(MB): 1.02996826171875E-4
Sampling percentage:  100
Mapper overlap ratio: 0.0
Mapper number: 0
Length of dimension KYLIN_DW.FACT_ORDER.DT is 1
Length of dimension KYLIN_DW.FACT_ORDER.USER_ID is 1
|---- Cuboid 11, est row: 12, est MB: 0
    |---- Cuboid 01, est row: 4, est MB: 0, shrink: 33.33%
    |---- Cuboid 10, est row: 4, est MB: 0, shrink: 33.33%
----------------------------------------------------------------------------

输出结果分析：

Cube statistics hll precision: 14
Total cuboids: 3
Total estimated rows: 20
Total estimated size(MB): 1.02996826171875E-4
Sampling percentage:  100
Mapper overlap ratio: 0.0
Mapper number: 0

估计Cuboid大小的精度（Hll Precision）
总共的Cuboid数量
Segment的总行数估计
Segment的大小估计，Segment的大小决定mapper、reducer的数量、数据分片数量等

|---- Cuboid 11, est row: 12, est MB: 0
    |---- Cuboid 01, est row: 4, est MB: 0, shrink: 33.33%
    |---- Cuboid 10, est row: 4, est MB: 0, shrink: 33.33%

所有的Cuboid及它的分析结果都以树状的形式打印了出来
在这棵树中，每个节点代表一个Cuboid，每个Cuboid都由一连串1或0的数字组成
数字串的长度等于有效维度的数量，从左到右的每个数字依次代表Rowkeys设置中的各个维度。如果数字为0，则代表这个Cuboid中不存在相应的维度；如果数字为1，则代表这个Cuboid中存在相应的维度
除了最顶端的Cuboid之外，每个Cuboid都有一个父亲Cuboid，且都比父亲Cuboid少了一个“1”。其意义是这个Cuboid就是由它的父亲节点减少一个维度聚合而来的
最顶端的Cuboid称为Base Cuboid，它直接由源数据计算而来。Base Cuboid中包含所有的维度，因此它的数字串中所有的数字均为1
每行Cuboid的输出中除了0和1的数字串以外，后面还有每个Cuboid的具体信息，包括该Cuboid行数的估计值、该Cuboid大小的估计值，以及这个Cuboid的行数与父亲节点的对比（Shrink值）
所有Cuboid行数的估计值之和应该等于Segment的行数估计值，所有Cuboid的大小估计值应该等于该Segment的大小估计值。每个Cuboid都是在它的父亲节点的基础上进一步聚合而成的

3、检查Cube大小

在Web GUI的Model页面选择一个READY状态的Cube，当我们把光标移到该Cube的Cube Size列时，Web GUI会提示Cube的源数据大小，以及当前Cube的大小除以源数据大小的比例，称为膨胀率（Expansion Rate）

一般来说，Cube的膨胀率应该在0%~1000%之间，如果一个Cube的膨胀率超过1000%，那么应当开始挖掘其中的原因。通常，膨胀率高有以下几个方面的原因：

Cube中的维度数量较多，且没有进行很好的Cuboid剪枝优化，导致Cuboid数量极多
Cube中存在较高基数的维度，导致包含这类维度的每一个Cuboid占用的空间都很大，这些Cuboid累积造成整体Cube体积变大
存在比较占用空间的度量，例如Count Distinct，因此需要在Cuboid的每一行中都为其保存一个较大度量数据，最坏的情况将会导致Cuboid中每一行都有数十KB，从而造成整个Cube的体积变大。

对于Cube膨胀率居高不下的情况，需要结合实际数据进行分析，优化。

4、使用衍生维度

示例：

有两张表用户维度表（dim_user）、订单事实表（fact_order），要根据各个维度建立MOLAP立方体

用户维度表（dim_user）

订单事实表（fact_order）

问题：

生成Cube时，如果指定维度表中的：姓名、出生年份、政治面貌、职业、性别、民族、省份、市、区等维度生成Cube，这些维度相互组合，会造成较大的Cube膨胀率

使用衍生维度用于在有效维度内将维度表上的非主键维度排除掉，并使用维度表的主键（其实是事实表上相应的外键）来替代它们。Kylin会在底层记录维度表主键与维度表其他维度之间的映射关系，以便在查询时能够动态地将维度表的主键“翻译”成这些非主键维度，并进行 实时聚合。

创建Cube的时候，这些维度如果指定为衍生维度，Kylin将会排除这些维度，而是使用维度表的主键来代替它们创建Cuboid。后续查询的时候，再基于主键的聚合结果，再进行一次聚合。

优化效果：维度表的N个维度组合成的cuboid个数会从2^N降为2。

只把normal 类型的维度列生成为 Cuboid

不适用的场景：

如果从维度表主键到某个维度表维度所需要的聚合工作量非常大，此时作为一个普通的维度聚合更合适，否则会影响Kylin的查询性能

美团“维度爆炸”问题在实践中是可解的

提到MOLAP Cube方案，很多没接触过Kylin的人会担心“维度爆炸”的问题，即每增加一个维度，由于维度组合数翻倍，Cube的计算和存储量也会成倍增长。我们起初其实也有同样的担心，但调研和使用Kylin一阵子后发现，这个问题在实践中并没有想象的严重。这主要是因为

Kylin支持Partial Cube，不需要对所有维度组合都进行预计算
实际业务中，维度之间往往存在衍生关系，而Kylin可以把衍生维度的计算从预计算推迟到查询处理阶段

以事实表上的衍生维度为例，我们业务中的很多维度都是(ID, NAME)成对出现的。查询时需要对ID列进行过滤，但显示时只需要取对应的NAME列。如果把这两列都作为维度，维度个数会翻倍。而在Kylin中，可以把NAME作为ID列的extendedcolumn指标，这样Cube中的维度个数就减半了。

下面分享一些我们线上Cube的统计数据。

可以看到，采用衍生维度后，90%的场景可以把Cube中的维度个数（Rowkey列数）控制在20个以内。指标个数呈现长尾分布，小于10个指标的Cube是最多的，不过也有近一半的Cube指标数超过20。总共有382个去重指标，占到了总指标数的10%，绝大多数都是精确去重指标。49%的Cube膨胀率小于100%，即Cube存储量不超过上游Hive表。68%的Cube能够在1小时内完成构建，92%在2小时内完成构建。

5、聚合组

聚合组（Aggregation Group）是一种更强大的剪枝工具
聚合组假设一个Cube的 所有维度 均可以根据业务需求划分成若干组
同一个组内的维度更可能同时被同一个查询用到，每个分组的维度集合均是 Cube 所有维度的一个子集
不同的分组各自拥有一套维度集合，它们可能与其他分组有相同的维度，也可能没有相同的维度
每个分组各自独立地根据自身的规则贡献出一批需要被物化的Cuboid，所有分组贡献的Cuboid的并集就成为了当前Cube中所有需要物化的Cuboid的集合
不同的分组有可能会贡献出相同的Cuboid，构建引擎会察觉到这点，并且保证每一个Cuboid无论在多少个分组中出现，它都只会被物化一次

对于每个分组内部的维度，用户可以使用如下三种可选的方式定义它们之间的关系，具体如下：

强制维度（Mandatory）
- 如果一个维度被定义为强制维度，那么这个分组产生的所有Cuboid中每一个Cuboid都会包含该维度。所有cuboid必须包含的维度，不会计算不包含强制维度的cuboid
- 每个分组中都可以有0个、1个或多个强制维度
- 如果根据这个分组的业务逻辑，则相关的查询一定会在过滤条件或分组条件中，因此可以在该分组中把该维度设置为强制维度
- 适用场景
  - 可以将确定在查询时一定会使用的维度设为强制维度。例如，时间维度。
- 优化效果
  - 将一个维度设为强制维度，则cuboid个数直接减半
层级维度（Hierarchy）
- 每个层级包含两个或更多个维度
- 假设一个层级中包含D1，D2…Dn这n个维度，那么在该分组产生的任何Cuboid中，这n个维度只会以（），（D1），（D1，D2）…（D1，D2…Dn）这n+1种形式中的一种出现
- 每个分组中可以有0个、1个或多个层级，不同的层级之间不应当有共享的维度
- 如果根据这个分组的业务逻辑，则多个维度直接存在层级关系，因此可以在该分组中把这些维度设置为层级维度
- 使用场景
  - 年，月，日；国家，省份，城市这类具有层次关系的维度
- 优化效果
  - 将N个维度设置为层次维度，则这N个维度组合成的cuboid个数会从2^n -1 减少到N
联合维度（Joint）
- 每个联合中包含两个或更多个维度，如果某些列形成一个联合，那么在该分组产生的任何Cuboid中，这些联合维度要么一起出现，要么都不出现
- 每个分组中可以有0个或多个联合，但是不同的联合之间不应当有共享的维度（否则它们可以合并成一个联合）。如果根据这个分组的业务逻辑，多个维度在查询中总是同时出现，则可以在该分组中把这些维度设置为联合维度
- 适用场景
  - 可以将确定在查询时一定会同时使用的几个维度设为一个联合维度
- 优化效果
  - 将N个维度设置为联合维度，则这N个维度组合成的cuboid个数会从2^n-1减少到1

你可能感兴趣的:(Kylin)

【K8s】专题十一：Kubernetes 集群证书过期处理方法行者Sun1989 Kubernetes kubernetes 云原生容器
本文内容均来自个人笔记并重新梳理，如有错误欢迎指正！如果对您有帮助，烦请点赞、关注、转发、订阅专栏！专栏订阅入口Linux专栏|Docker专栏|Kubernetes专栏往期精彩文章【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法（续）【Docker】MySQL源码构建Docker镜
【深入剖析】Kylin架构全景及其组件详解 2401_85763639 kylin 架构大数据
标题：【深入剖析】Kylin架构全景及其组件详解ApacheKylin是一个开源的分布式分析引擎，提供大数据集上的即时分析能力。它通过预计算技术，将数据以多维立方体的形式存储，从而加快查询速度。本文将详细探讨Kylin的架构及其组件，包括数据源、元数据存储、Cube构建、协调节点、查询引擎等关键部分。1.Kylin架构概述Kylin的架构设计为分层结构，每一层负责不同的功能和任务。2.数据源层Ky
使用ansible的剧本制作salt-master与salt-minion的安装与启动服务过程 qq_42750608 linux ansible ansible
虚拟机版本：RockyLinuxrelease8.6(GreenObsidian)准备几台虚拟机ipv4地址主机名192.168.137.13center192.168.137.14sp-1192.168.137.15sp-2192.168.137.16sp-3一、center主机的配置1.vim/etc/hosts127.0.0.1localhostlocalhost.localdomainlo
C++ | Leetcode C++题解之第218题天际线问题 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{public:vector>getSkyline(vector>&buildings){autocmp=[](constpair&a,constpair&b)->bool{returna.second,vector>,decltype(cmp)>que(cmp);vectorboundaries;for(auto&building:buildings){bo
Kylin JDBC使用案例风_间 Apache Kylin JDBC Java 数据查询数据库连接
一、新建空的maven工程二、在项目中导入依赖org.apache.kylinkylin-jdbc3.0.2三、编写classpublicclassTestKylin{publicstaticvoidmain(String[]args)throwsException{//Kylin_JDBC驱动StringKYLIN_DRIVER="org.apache.kylin.jdbc.Driver";//
2024年大数据高频面试题(下篇）猿与禅 Java架构师面试大数据面试 scala 即席查询分桶调度系统数据倾斜
文章目录Scala数据类型函数式编程闭包函数柯里化面向对象样例类对象与伴生对象特质(trait)模式匹配隐式转换即席查询KylinKylin特点Kylin工作原理核心算法Kylin总结Kylin的优点什么场景用KylinKylin的缺点Impala什么是ImpalaImpala为什么快FrontendBackendImpala总结：Presto什么是PrestoPresto的执行过程Presto总
受邀参加 2024 中国操作系统产业大会星辰天合获“最优协同奖” XSKY星辰天合软件定义存储云计算
8月8日，主题为“麒麟遨天，AI创无界”的2024中国操作系统产业大会在北京召开。本届大会由中国版权协会指导，中国电子信息产业集团公司、中国软件行业协会主办，麒麟软件有限公司、openKylin社区承办。作为麒麟软件的重要合作伙伴之一，XSKY星辰天合受邀参加此次大会，与产业链相关代表共同见证中国操作系统在技术产品、生态建设、市场应用、开源成果、人才培养等层面全新高度，并获得麒麟软件颁发的“最优协
在Kylin3.2上安装dotnet SDK 2.1.300 奔跑伯爵
1.下载ICUlibraries下载地址dotnetSDK2.1.300RHEL6专用版下载地址2.安装ICUlibraries用管理员权限，直接解压icu包到根目录，这包里嵌套了usr/local目录，所以解压只需指定根目录/就行tar-xficu4c-57_1-RHEL6-x64.tgz-C/3.安装dotnetSDK解压至任意目录tar-xfdotnet-sdk-2.1.300-rhel.6
优麒麟 20.04 LTS Pro安装Canon LBP2900打印机 ericden Ubuntu Linux 打印驱动优麒麟 ubuntu linux windows
最近优麒麟发布了最新的操作系统Ukylin20.04Pro，使用了一段时间总体感觉是不错的，运行效率较高，美中不足的是一些界面方面的字体和默认主题需要手动去做一些修改。现在基本上在办公环境中使用优麒麟的操作系统了，在使用中逐渐发现了一个新的问题，办公室的CanonLBP2900打印机还是用不了，接上打印机线，操作系统还是会发现打印机并安装为CanonLBP3000打印机，但是打印测试页面都没有反应
【K8s】专题十三：Kubernetes 容器运行时之 Docker 与 Containerd 详解行者Sun1989 Kubernetes kubernetes 云原生容器 containerd docker
本文内容均来自个人笔记并重新梳理，如有错误欢迎指正！如果对您有帮助，烦请点赞、关注、转发、订阅专栏！专栏订阅入口Linux专栏|Docker专栏|Kubernetes专栏往期精彩文章【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法（续）【Docker】MySQL源码构建Docker镜
银河麒麟v10-arm SEALOS离线部署k8s集群（v1.22.8） xjudt arm开发 kubernetes docker
一、环境说明1.版本说明1.1.操作系统版本银河麒麟V10SP3[root@localhost~]#cat/etc/os-releaseNAME="KylinLinuxAdvancedServer"VERSION="V10(Lance)"ID="kylin"VERSION_ID="V10"PRETTY_NAME="KylinLinuxAdvancedServerV10(Lance)"ANSI_CO
nginx访问控制、用户认证、https 时迁10 nginx https 数据库
环境rockylinux9虚拟机，时钟同步已完成，基本工具，命令已安装192.168.100.111nginx服务器192.168.100.112客户端访问192.168.100.114客户端访问nginx已经配置完成做了平滑升级一、nginx访问控制默认允许所有主机访问stub_status模块stub_status模块主要作用于查看nginx的一些状态信息[root@nginx~]#vim/u
FTP服务基础搭建时迁10 服务器 linux 运维
环境：两台rockyLinux虚拟机，yum仓库与时钟同步均已配置完成，firewalld与selinux均以关闭；server作为服务器端，client作为客户端。一、FTP理论FTP:文件传输协议（FileTransferProtocol简称FTP），采用c/s模式工作控制端口:21数据端口:20FTP工作原理：1、主动模式standardFTP客户端从任意一个非特权端口N（N>1024）发送
Kylin的工作原理及使用分享操作指南 vvvae1234 kylin
ApacheKylin是一个分布式的分析引擎，专为大数据环境中的快速分析和查询而设计。它通过构建OLAP（联机分析处理）立方体，使得对海量数据的实时分析成为可能，极大地提升了数据查询的效率。本文将详细介绍Kylin的工作原理，结合实际操作案例，分享如何有效使用Kylin进行大数据分析。1.Kylin概述Kylin是一个开源项目，支持SQL查询，兼容与Hive和MapReduce等大数据技术的集成。
kylin系统永久关闭iptables yuer011 服务器 linux 网络
1关闭iptables,并且相关规则写入文件firewall.rulessudoiptables-save>/root/firewall.rulesiptables-Xiptables-tnat-Fiptables-tnat-Xiptables-tmangle-Fiptables-tmangle-Xiptables-PINPUTACCEPTiptables-PFORWARDACCEPTiptabl
Kylin系列-入门 Dingdangr kylin
Kylin系列-入门ApacheKylin是一个开源的分布式分析引擎，提供Hadoop/Spark之上的SQL查询接口及多维分析（OLAP）能力，以支持超大规模数据。以下是对Kylin系列的入门介绍：一、基本概念1.定义ApacheKylin是由eBay开发并捐赠给Apache基金会的一个开源项目。它基于Hadoop和HBase构建，通过预计算数据立方体（Cube）来加速查询，使得复杂查询可以在亚
Kylin的工作原理及使用分享丁爸大数据 kylin
1.简介1.1.概述ApacheKylin是一个开源的分布式分析引擎，它最初由eBay开发，并贡献给了开源社区。Kylin提供了一个Hadoop之上的SQL查询接口及多维分析(OLAP)能力，能够支持大规模数据，处理TB乃至PB级别的分析任务，并且能够在亚秒级查询巨大的Hive表。更多介绍查看之前文章《Kylin系列（一）入门》1.2.主要特点SQL接口与多维分析（OLAP）：Kylin提供了标准
使用VMware安装银河麒麟桌面操作系统 iangyu 服务器运维
安装银河麒麟桌面操作系统（KylinDesktopOS）在VMware虚拟机上是一项相对简单的任务。以下是具体步骤：1.准备工作VMwareWorkstation或VMwarePlayer：确保已在您的计算机上安装了VMware。银河麒麟桌面操作系统的ISO镜像：从银河麒麟官网或其他可靠来源下载合适的版本。2.创建新的虚拟机打开VMware：启动VMwareWorkstation或VMwarePl
llama.cpp 编译安装@Ubuntu skywalk8163 项目实践人工智能 llama ubuntu linux 人工智能
在Kylin和Ubuntu编译llama.cpp，具体参考：llama模型c语言推理@FreeBSD-CSDN博客现在代码并编译：gitclonehttps://github.com/ggerganov/llama.cppcdllama.cppmkdirbuildcdbuildcmake..cmake--build.--configRelease#可选安装makeinstall#或可选添加路径ex
RockyLinux8 & RockyLinux9安装postgresql16-devel开发包 ynzhangyao postgresql
1、PG的插件扩展有些需要自行编译，需要安装PG开发包2、RockyLinux8安装#创建用户先useraddpostgressudodnfinstall-yhttps://download.postgresql.org/pub/repos/yum/reporpms/EL-8-x86_64/pgdg-redhat-repo-latest.noarch.rpmsudodnf-qymoduledisa
Linux 制作 OpenSSH RPM 包 dongsong1117 linux 运维服务器 OpenSSH
文章目录1.安装依赖2.建立编译目录3.下载源码包并解压4.复制编译配置5.修改编译配置6.编译制作RPM包本文适用系统：RockyLinux9、AWSAmazonLinux20231.安装依赖RockyLinux:dnf-yinstallepel-releasegccinitscriptskrb5-develmakeopensslopenssl-develpam-develperlrpm-bui
kylin V10 +docker +Ros 落九山 docker kylin 自动驾驶容器
一、前言麒麟系统下运行ros的daocker镜像，国内资源查阅可参考的并不多。在经历一番挫折之后，今天初步实现kylinV10系统下使用docker运行起ros测试程序小乌龟及rviz等，说明配置初步完成。鉴于现有网络上参考资源不多，故在此熬夜将配置过程分享与众，愿有抛砖引玉之效。网上搜索了许多，linux系统下关于ubuntu、centos资料颇多，介绍也颇为详尽。因麒麟系统V10与ubuntu
全方位了解：在麒麟KYLINOS上检查系统激活状态的方法鹏大圣运维 linux 统信 UOS linux 运维服务器 uos 统信国产化 kylin
原文链接：全方位了解：在麒麟KYLINOS上检查系统激活状态的方法大家好！在使用麒麟KYLINOS操作系统时，了解当前系统的激活状态是非常重要的。无论是进行系统维护、软件安装还是性能监控，掌握如何查看系统状态都是必需的基础知识。今天，我将为大家介绍两种检查麒麟KYLINOS系统激活状态的方法：图形化界面方式和命令行方式。这两种方法各有优势，适用于不同的使用场景。1.图形化界面方式对于大多数用户来说
统信UOS_麒麟KYLINOS上不覆盖高版本依赖包的情况下批量安装软件鹏大圣运维 linux 统信 UOS linux 操作系统国产化服务器桌面统信麒麟
原文链接：统信UOS/麒麟KYLINOS上在不覆盖高版本依赖包的情况下批量安装软件大家好！在使用基于Debian的Linux发行版，如统信UOS和麒麟KYLINOS时，deb包作为软件安装包的格式非常常见。今天，我将为大家带来一个实用的技术分享，即如何在不覆盖系统中已有更高版本软件依赖包的情况下，批量安装deb包。这个需求在日常管理工作中尤为重要，尤其是当我们需要在多台机器上部署软件，或者更新某个
统信UOS_麒麟KYLINOS上使用命令行配置NTP服务器鹏大圣运维统信 linux UOS 服务器 php 运维 UOSID UOs linux
原文链接：统信UOS/麒麟KYLINOS上使用命令行配置NTPhello，大家好啊，今天我要给大家介绍的是在统信UOS/麒麟KYLINOS操作系统上使用命令行配置NTP（NetworkTimeProtocol）服务器的方法。在内网环境下，许多企业都会搭建自己的NTP服务器来确保网络中所有设备的时间同步。这对于维护网络安全、日志审计和数据一致性等方面至关重要。今天的内容将结合之前关于系统镜像制作及模
统信UOS_麒麟KYLINOS上多种方式查看物理硬盘信息鹏大圣运维 UOS 统信 linux uos 操作系统 linux 国产化统信桌面麒麟
往期文章：统信UOS无需开发者模式安装软件包大家好！在日常的系统管理和维护工作中，了解和检查物理硬盘信息是一项基本而重要的任务。今天，我为大家带来一篇关于在统信UOS和麒麟KYLINOS操作系统上，如何通过多种命令行工具列出所有物理硬盘信息的文章。无论您是系统管理员还是普通用户，掌握这些命令都将帮助您更好地管理和诊断硬盘问题。文章中列举的命令包括：df-h-显示挂载的文件系统的磁盘空间使用情况。l
统信UOS_麒麟KYLINOS上使用远程SSH连接的工具electerm 鹏大圣运维 linux UOS 统信 ssh 运维 kylin kysec uos linux 国产
原文链接：统信UOS/麒麟KYLINOS上使用SSH工具electermHello，大家好啊！在我们日常的工作和学习中，远程控制和管理服务器已经成为一项常见且必要的技能。尤其是对于IT专业人士和开发者来说，一个高效、稳定的远程SSH连接工具是提高工作效率的关键。今天，我要给大家带来的，正是这样一款实用的工具介绍。我们在之前的文章中已经给大家介绍过在统信UOS/麒麟KYLINOS操作系统上使用Ter
统信UOS_麒麟KYLINOS上使用SSH远程工具Termius 鹏大圣运维 linux 统信 UOS ssh 运维数据库 mysql redis linux kylin
原文链接：统信UOS/麒麟KYLINOS上使用SSH远程工具Termiushello，大家好啊，今天给大家带来一篇在统信UOS/麒麟KYLINOS上使用SSH远程工具Termius的文章，Termius是一个功能强大的ssh工具，支持Linuxx86平台、windows、macos、iOS、Android等平台，并且支持sftp、端口转发、snippets等功能，大家可以按照提示去下载使用，算是我
精准控制：在统信UOS_麒麟KYLINOS上安装指定版本号的浏览器鹏大圣运维 UOS 统信 linux 服务器 linux 运维 kylin 统信 uos 国产化
原文链接：精准控制：在统信UOS/麒麟KYLINOS上安装指定版本号的浏览器大家好！在使用基于Debian的Linux发行版，如统信UOS和麒麟KYLINOS时，我们经常会用到APT（高级包管理工具）来安装、更新和管理软件包。今天，我要和大家分享的是，如何通过APT命令不仅更新软件包到最新版，更重要的是如何精确地安装或降级到指定版本的软件包——以浏览器为例。为何需要安装指定版本的软件？在某些情况下
VMware 安装银河麒麟高级服务器操作系统 V10 版本教程你可知这世上再难遇我银河麒麟 linux 国产操作系统
VMware安装银河麒麟高级服务器操作系统V10版本教程目录VMware安装银河麒麟高级服务器操作系统V10版本教程银河麒麟的前世今生安装过程银河麒麟的前世今生银河麒麟（KylinOS）原是在“863计划”和国家核高基科技重大专项支持下，国防科技大学研发的操作系统，后由国防科技大学将品牌授权给天津麒麟，后者在2019年与中标软件合并为麒麟软件有限公司，继续研制的以Linux为内核的操作系统。银河麒
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag