大数据技术架构

Kylin 在汽车之家的最佳实践大揭秘

Kylin 作为汽车之家的核心 OLAP 引擎，服务于多个业务线与商业数据产品，应用于流量、线索、用户行为、推荐效果等方面的数据分析场景。目前已有 500+ 个 Kylin Cube，存储约 300 T，整体 Segment 数约1.6 万；单个 Cube 原始数据过万亿，单个 Cube 最多 31 个维度；12万 HBase region，查询响应时间 TP 95 稳定在 2 秒以内。

本文导读

1. Kylin 在汽车之家的发展历程及现状:

Kylin 简介、架构与原理
使用现状
发展历程

2. Kylin 在商业化数据产品中的应用与实践：

业务场景
技术选型（Kylin vs Druid vs ES）
战略级数据产品-车智云
开发流程
Kylin 的常规优化经验（Cuboid 剪枝、查询性能、最大维度组合、超大字典问题、精确去重....）
其他实践
KylinSide系统-集群信息统计、集群管理

3. 集群升级和迁移的一些经验分享：

背景与挑战
整体方案
整体架构

4. 未来的规划：

实时 OLAP
云原生

Kylin 在汽车之家的发展历程及现状

1. Kylin 简介

Apache Kylin 是一个可扩展的超快的大数据分析型数据仓库，它有友好的 web 界面，有交互式查询能力，性能非常好，还有标准的 SQL 接口，支持 JDBC 查询。Kylin 的原理是基于预计算模型，是多维立方体的模式，在 Kylin 3.0 之后已经支持实时 OLAP 了，同时 Kylin 可以和现有的 BI 工具无缝结合。

2. Kylin 架构

这是 Kylin 官网的一张图，简单给大家说一下，左边是数据源，可以是 Hive 表，是可以离线的数据，也可以是 Kafka 里面的一些实时数据，还可以是普通关系型数据库里面的数据，中间这一块其实是核心的内容，最上层其实就是对外暴露的一些 REST 接口，REST API，除了 WEB 界面，还有 JDBC/ODBC 这些查询也都是访问的 REST 接口。再往下就是一个查询引擎，Kylin 其实是基于 Apache Calcite 来实现的 SQL 解析，包括生成执行计划。再往下是路由层，经过 SQL 解析后我们可以知道查询到的哪个表，用到了哪几个维度，用到哪些度量，根据这些信息就可以路由到提前构建好的 Cube 上，理想情况会精确命中到某一个维度组合上，来实现高效的查询。

元数据这一块包括 Hive 表的元数据和 Kylin 的元数据，Kylin 的元数据会包括 Project、Model、Cube、Segment 多种元数据信息，大多都会在内存中维护缓存。最下层其实是一个构建引擎，主要也是分两块，一块离线的，一块实时的，最终都会生成 HBase 表，存储在 HBase 里面，Kylin 大概的架构就是这样的。

3. Cube 预计算原理

Cube 本身的中文含义是立方体，其实右边这个图就是很形象的说明了 Cube 的含义，假如说我们有一张表，这个表里面有 ABCD 四个维度，所有的维度组合就构建出了这么一个立方体，就是 Cube，然后每一种维度组合在 Kylin 的概念里面就是 Cuboid，也就是对应图里面的一个点，ABCD 其实是一个最基础的维度组合,也就是 BaseCuboid，是我们可以预聚合的最细粒度，然后下面包括 ABC、ABA 等这些更粗粒度的维度组合，其实都可以基于 ABCD 的预计算结果再去构建出来。

我们举一个简单的例子，刚才说的这个表里面有 ABCD 四个维度，假设A字段有值度是 A1，B 字段有 B1 和 B2，C 字段和 D 字段分别对应 C1 和 D1，这个时候就引入一个基数的概念，就是维度 A 它其实只有一个值，就是 A1，我们说他的基数就为 1，维度B因为有 B1 和 B2 两个值，所以他的基数是 2。左边下面这两个表格对应的是字典，Kylin 为了加速查询，节省存储空间，它会对每个维度上的值去做编码，编码是从 0 开始，所以 A1 对应的编码为 0，维度 B 的值是 B1 和 B2，对应的编码就是 0 和 1。

我们来看一下最终的数据存储到 HBase 里面是什么样的，RowKey 中用绿色标注出来的四位数字，其实代表了四个维度，比如说黄色这一行数据是 1000，它其实代表的是 A 这个 Cuboid，也就是说维度为 A，这个组合里面只有 A 的这种情况。RowKey 首先是由四位数字标记出对应的 Cuboid 是哪一个，再后面这个 0 其实是维度 A 对应的值，这个例子里 A 只有一个值 A1（对应的字典编码为0），所以最终只在 HBase 里对应一行数据。

最后说下 Value，我们这个例子举的是 Count 的例子，这个表里面 A1 对应三条数据，所以 1000 这个 Cuboid 对应的 Count Value 就是3。

再看一下下面对应 AB 的这个 Cuboid，AB 这个组合，前两位都是 1，后两位 CD 是不包含的，所以是 0。因为 A 对应的只有 A1，B 对应 B1、B2，所以他们构建出来的值只有两行记录，也就是 00 和 01，对应的 Count 的值就是 2 和 1。以上就是 Kylin 预计算的基本原理，这里的 RowKey 是一个示意，和最终的 RowKey 会有些差别。

4. Kylin 的使用现状

Kylin 作为汽车之家的核心 OLAP 引擎，服务于多个业务线，支持多个商业数据产品，比如后面我们介绍的战略级商业数据产品-车智云，就是主要基于 Kylin 来建设的。

Kylin 在汽车之家支持包括流量、线索、用户行为、推荐效果等方面的数据分析场景。我们有 500 多个 Cube ，存储在 300 T 左右，整体 Segment 数在 1.6 万；单个 Cube 原始数据过万亿，单个 Cube 最多 31 个维度；12 万 HBase region，查询响应时间 TP 95 稳定在 2 秒以内。

5. Kylin 在汽车之家的发展历程

2016 年：我们开始调研 Kylin，当时是 1.5.4 的版本，最初只是组内使用，支持一些统计场景。
2017 年：车智云项目发起，此时我们借助这个商业数据产品的契机，深度地使用了 Kylin，同时也升级到 1.6，这个阶段 Cube 的规模在 100 多个，我们主要支持车智云项目的需求，并在Kylin的外围加了一些额外的监控和自动拉起的服务。
2018 年：主要是帮助业务团队去优化模型，以及提升整体的Kylin的稳定性，这个时候 Cube 已经在 200 多个了，已经支持多个业务线了，同时部署了 3 个集群。因为支持了商业数据产品，对稳定性及可用性要求很高，所以增加了HBase灾备的能力。
2019 年：我们升级到 2.6.3 这个版本，主要做了些集群升级和机房迁移的工作。升级之后，很多 Cube 切换到 Spark 构建引擎上。同时之家内部有了自己的 BI 产品——AutoBI，也在逐步和 Kylin 做对接，使 Kylin 的应用场景更加丰富。

Kylin 在商业化数据产品中的应用与实践

1. 业务及场景特点

汽车之家最就是以内容为主的，汽车之家的内容通常是全网是最早发布的，现在还融入了大量的自媒体以及小视频等板块。流量这一块是大家最关注的，主要是提升运营这一块，还有大量的用户行为数据和销售线索数据，大体上是这几类数据。

数据规模是千亿级，稳定性是我们很看重的一点，响应时间是秒级或者是亚秒级，数据主要以离线为主，还需要支持高并发。

2. 对比及选型

当时选型时，我们对比了 Kylin、Druid 还有 ES（Elasticsearch）。

性能：因为 Kylin 和 Druid 都是基于预计算的，所以他们性能会比较好。
支持数据量级：因为 Kylin 和 Druid 都是预计算，所以数据量级这一块是没有多大影响的，就算数据量级到万亿级也不需要去线性的扩展服务器，这一点是比较大的优势，ES 就是需要做线性扩展的。
稳定性：这几个都是比较成熟的开源产品，稳定性都是没有问题的。
高并发：高并发其实是相对来说的，在 OLAP 场景里面应该还没有真正意义上的高并发，Kylin 是基于预计算的，相对来说并发支持比较好。
SQL：因为 Kylin 原生就是支持 SQL 的，Druid 和 ES 早期都是不支持的。
易用性：Kylin 是有明显优势的，Kylin 有很友好的 Web 界面的，用户可以在界面上去做建模和运维，同时权限这一块原生就支持了。
明细查询：Kylin 是不支持的，是比较弱的一块。

经过试用和对比，我们最终选择了 Kylin，能满足我们大部分的场景。

3. 战略级数据产品-车智云

车智云的定位主要是推动车企的战略、营销、研发等全价值链的升级。汽车之家有海量的用户行为数据和态度数据，我们最开始是论坛起家的，这上面有用户针对每一个车型正面或者是负面的真实评价。数据规模占线上汽车媒体 73%，这是一个很大的优势，还融入了媒体、金融、电商、生活多维度的数据。我们首创了一个 UVN 的用户分群模型，并且以“用户营销漏斗”为核心打造大数据产品。

作为实时、智能的营销数据平台，车智云提供一体化营销闭环解决方案，为车企研发、营销、服务赋能，主要是从研发和营销这两个角度，未来还会在渠道方面，助力车企全面提升。

4. 面临的挑战

我们面临的挑战，首先是海量的数据。其次我们对查询性能是有很高要求的，因为我们最终要做商业化的数据产品。稳定性这一块也是比较重要的，也是商业化的基本要求。

5. 一个备选方案

其实最开始和开发人员对接的时候，了解到他们也有一个备选的方案，最简单的方案完全基于自研的：基于 Hive 表里面的明细数据，也是提前预计算好各种所需要的指标，然后把他们存到 HBase 存储里面，然后通过这个 MR 去把这些结果写到一个 HBase 存储引擎里面，在 Web 层去自己写接口，去查询这个结果数据。

这个方案其实有很多问题，首先是说开发成本是很高的，因为如果是完全自研的话没有界面操作，人肉去维护大量运行脚步，还需要编写代码，对代码质量要求很高，还有自行开发排重指标，还有维度组合过多，这是难以维护的，还有 HBase 表后续也会很多，这个时候 Kylin 已经挺有名气的了，很多公司已经在用了，经过一番对比最终我们选择 Kylin 作为核心 OLAP 分析引擎。

6. 基于 Kylin 开发，大大降低开发及运维成本

Kylin 开发流程的第一步就是在界面上去同步 Hive 表的元数据，然后基于这个元数据去创建模型，然后再进一步建 Cube 并构建，然后就可以用 JDBC 查询数据了。

关于调度，我们写了一个 Kylin 的调度的脚本，然后把调度脚本上传到我们内部的调度系统上，并配置上游依赖就可以了。

使用 Kylin 开发的优势其实很明显，Kylin 直接基于 Hive 做建模，并且有完善易用的界面，我们不再需要写代码，普通数据开发人员就可以做数据的建模、构建及维护。同时构建过程可以是资源隔离的，可以用他们自己的队列去做构建，不必担心构建资源被其他业务抢占。Kylin 完美支持 SQL 和 JDBC，对后端开发人员非常友好。Kylin 提供了丰富的配置，可以通过修改配置，提升构建及查询性能。Kylin 还在 Cube 级别支持针对构建状态设置报警，可以第一时间发现构建失败的作业，并通知给 Cube 的负责人。Kylin 还会默认做慢查询统计，开发人员可以针对这些明显低效的查询进行优化。

7. Kylin 的常规优化

再说一下 Kylin 的一些常规优化手段，其实这种多维立方体的模式下，对 Cuboid 的剪枝是非常重要的，最理想的情况就是需要查询什么，我们就提前预计算什么，不查就不算，这从存储和查询的角度都是最优的，所以 Kylin 在 Cuboid 剪枝这一块提供了丰富的优化手段。

首先是常规维度和衍生维度，因为 Kylin 本身是支持星型模型的，维表里面的维度都是衍生维度，其实这些维度是不参与 Cuboid 生成的，所以合理使用衍生维度是一个很好的优化手段。还有就是设置聚合组，这也是为了精细化的去定义哪些维度组合是有必要的，哪些是没必要的；还可以声明必要维度、层级维度、联合维度来确保在减少 Cuboid 个数的同时，尽量不影响查询性能。

然后是查询性能的优化，Kylin 原生提供了对字典的支持，通过对原始数据做编码，不仅可以解决存储空间，还可以用来过滤 segment 提升查询性能；但是前面的例子里面也提到了如果维度基数很高的话，字典也会很大，所以需要尽量避免高基维使用字典。最后是 RowKey 的顺序，HBase 本身的特性决定了 RowKey 顺序的重要性，通常是需要把常用的高频的维度要放在前面的。Kylin 的优化手段网上有很多资料，这里就不做过多的介绍了。

优化 1：最大维度组合

接下来说一下我们做的一些优化，第一个就是维度的最大组合数控制。当我们开始宣称 Kylin 这个技术很牛，针对上千亿的数据，可以秒级返回查询结果时，一些运营人员就找过来了。他们说这个东西这么牛，给我们分析流量用吧，我们这个表里有几十个维度，想要用 Kylin 加速查询。用他们的话描述就是“需求很简单”，只要支持任意维度做交叉 GROUP BY 统计就行。乍一听几十个维度，感觉这需求很难实现，但是稍微思考一下，他们每次查询会用到几个维度呢？通过了解下来，通常来说每次查询最多也就用到三四个维度。拿我们的一个 17 个维度的 Cube 举例，假设单次查询最多就用到三个维度，我们不做任何优化的话，其实这个 Cuboid 维度组合的数量，其实是 2 的 17 次方，也就是 13 万，这其实是一个很大的数字，Kylin 现在默认支持的最大 Cuboid 数是 32768（可以通过配置调整），也就是 2 的 15 次方，超过这个数就不允许构建了，需要借助前面提到的剪枝手段做优化才行。

这个场景下面我优化的思路就是我们设置一个最大可以同时查询的维度的个数，然后结合必选维度，生成多个聚合组，来减少 Cuboid 的数量。这是最多构建三个维度的时候，Cuboid 的个数其实就是 C（17，3），即Cuboid数目为4080个，通常会有一个时间维度是必选字段，其实就只有C（16，3），即Cuboid数目为 3360，这个优化效果是很明显的。新版 Kylin 中已经完美的支持了这一特性，可直接在cube中设置“Max Dimension Combination” 。

注：函数C(维度数量，MDX)的结果含义为通过MDX来剪枝得到的最终cuboid数量。

优化 2：优化 Segment 过滤，解决超大字典问题

我们早期没有限制高基数维度对字典的使用，而且业务开发是由另外一个业务团队负责的，他们也没有关注高基维这一块，造成高基数维度使用普通字典，没有使用全局字典，并且上线了，导致查询server偶尔会占满堆内存，影响查询性能。

后来我们了解到他们其实是按月去构建的，每个月对应一个Segment，并且业务上不会跨Segment查询，每次只查询一个月的数据。Kylin的每个Segment都会对应一份独立的字典，而每次查询时都会扫描多个Segment，也就是会加载多个字典，这会导致内存占用彪高。

这个问题我们的紧急优化了一版代码，思路就是只查询有效的Segment，避免查询无效的Segment，自然就避免加载无效的字典了。我们怎么过滤呢，就是根据用户指定的时间范围，比如SQL中指定的是19年1月的数据，那么我们只需要查一个Segment就可以了，我们不需要加载无效的字典到内存里面，所以我们定义了一个参数叫cube.time.dimensions，同时引入了一个选择器去过滤Segment，具体的实现其实就是拿到TupleFilter对象，根据其中的时间条件，以及每个Segment的DateRange去判断这个Segment是否符合条件，如果不符合条件我们就直接不查了。

优化 3：非精确去重、精确去重

第三个优化是说我们有一个比较特殊的场景，可能大家都没有碰到过。我们之前有一个模块最开始是非精确去重的，运行良好，查询也比较稳定，但是上线一年后，产品突然说要改用精确去重，同时历史数据不能重刷，也就是历史数据保持非精确去重，新数据是需要做精确去重，还有一个前提，这个Cube也是不会跨Segment去聚合的。

其实最简单的思路，就是创建一个全新的Cube，设置使用精确去重，用来构建新数据，再通过创建Hybrid把新Cube和旧Cube “绑定”在一起，同时支持新老数据的查询。但是这里遇到一个问题，就是Hybrid不支持同一个字段在两个Cube中度量不同这种情况。

我们做了一点改造，就是根据SQL里面的时间条件去动态选择使用新Cube还是旧Cube，并且设置正确的Measure类型，也就是HyperLogLog或Bitmap。这里也用到前面提到的DateRangeMatcher工具类，根据SQL中的时间条件和Cube对应的时间区间，来选择正确的Cube并设置正确的度量类型。

优化 4：调度性能优化

再说调度性能方面的优化，背景其实是我们机房迁移过程当中有一段时间是需要跨机房去访问HBase集群的，我们发现跨机房访问HBase的时候，每次调度构建任时候很慢，调度一次要十几分钟。

通过定位我们发现是因为每次调度的时候会查询job的信息，也就是频繁的访问HBase，当时跨机房的网络延迟在5毫秒以上，已经超过HBase本身的查询时间了，所以会导致调度性能很慢。这一块优化比较简单，就是在调度的过程中，跳过所有的成功状态的job，而成功状态的作业占到了99%以上，所以做过这个改动后，调度性能就没有问题了。

优化 5：设置 Cube 为不可查询状态

这个是优化是我们把Cube设置成临时不可查询的状态。背景是当业务需求发生变化时，比如增加维度，通常需要创建新的Cube并且构建数据，比如说需要构建两年的数据，但是我们无法一次构建出两年的数据，肯定是一个月一个月的去构建，当第一个月的数据构建成功时，Kylin就会默认把这个Cube的状态调整为Ready状态，此时用户查询就可能会路由到这个数据还不完整的新Cube上，会导致这个结果不符合预期。

应对这种情况，我们增加了一个Cube级别的配置，标记这个Cube不参与查询，当数据没有刷完的时候把这个配置设置成false，Cube就不参与路由了，当数据全部构建成功后，再设置为true，同时把旧的Cube disable掉就可以了。

优化 6：监控及自动拉起

我们监控主要是基于Kylin原生的Metric，Kylin提供了丰富的Metric，结合之家云监控平台提供的prometheus和grafana可以配置相对全面的监控图表。

在前期没有加健康检测的时候，服务有的时候还是会不稳定的，比如说之前提到的问题，可能会导致查询很慢，所以我们自己开发了监控程序，部署在每个Kylin节点上，用于监控Kylin服务的健康状况，并视情况进行重启。

首先就是我们会检查Kylin的进程是否存在，如果是存活状态，再去调一个REST API，判断响应时间是否符合预期，同时还会监控堆内存的占用，如果有一个指标连续几次不符合预期，就会上报metric并报警，同时重启Kylin。比如我们线上堆内存连续3次检测都超过95%，那么就会自动重起Kylin。另一方面，重启本身也会带来风险，所以需要合理设置每个阈值，避免误报，影响服务；同时需要指定合适的最小重启间隔，避免无限重启；同时监控程序本身也要负责监控自身的工作线程是否正常运行；最后监控程序本身会监听一个端口，方便其他的服务区监控自己。

这个是我们监控程序的一个示例，最上面通过pidCmd、startCmd、KillCmd用来声明检测进程存活状态的命令以及重启的命令，接下来是Kylin实例的一些基本信息，还有JMXExport端口的配置，最下面就是检测周期和报警的相关配置。

优化 7：HBase 主从集群

然后还有一个比较重要的点，就是HBase主从集群，因为我们是提供商业化的数据产品，所以我们需要保障SLA。所以我们把这个集群做了一个T+1的备份，我们为什么不用原生的储存备份？我们用的是HBase1.2.4版本，这个版本的主从复制是不支持Kylin使用的Bulkload方式的，所以我们自己开发了一套程序去做备份。

首先就是对比HBase对应的HDFS上的文件，增量的去拷贝这些文件，也就是用distcp去做文件同步，然后第二步就是让HBase去识别这些表，最后我们要把从集群上多余的表给定期Drop掉。因为我们主要的数据都是T+1的数据，都是离线的数据，每天都是在早上9点之前去把前一天的数据都构建好，所以我们每天十点的时候会调起的备份程序，把数据备份到HBase从集群上，尽量让从集群的数据和主集群保持一致。

这个从集群还有一个好处，就是我们可以把这个服务开放给分析师用，因为这个集群上的数据很重要，也比较全面，分析师会用这份数据产出一些行业报告，同时也会做一些探索性的查询。由于这部分都是手写的SQL查询，包含很多不确定性，如果这些操作直接在主集群上去做的话，有可能会把HBase给搞坏了，整个Kylin服务都会挂掉。有了这个从集群之后，顺便也把分析师的需求也支持了，让他们去查这个从集群，不用担心对线上的服务造成影响。

8. 其他实践

再说一下其他的一些实践，最基础的就是定期去备份Kylin的元数据，定期调用Kylin的清理脚本，删除无用的数据。同时定期清理Kylin生成的一些临时文件，不然他有的时候可能会报inode数超出限制的异常。我们还加了一个SQL黑名单的功能，就是前期的时候有些查询会导致HBase的region server批量挂掉，这个时候负责HBase的同学会定位到是因为哪个Query ID导致的，我们会找到对应的SQL，然后把这个SQL加入到黑名单里面去，临时把这个异常查询排掉。同时我们也加了一个功能，就是强制去要求用户必须制定Where条件，这也是为的保证稳定性的。然后我们去完善了一下原来的REST API，比如支持查询更长时间的job。还有完善了慢查询的告警，以及使用Filebeat将Kylin日志统一收集到Elasticsearch中，便于查询及分析。

9. KylinSide - 集群信息统计、集群管理

我们内部还有一个系统，我们叫做 KylinSide，他主要是生成一些统计信息，便于我们对集群做管理和维护，还有一些迁移和升级过程中用到的工具，也是 KylinSide 提供的。这个截图是 KylinSide 生成的一些集群统计数据，通过之家的 AutoBI 系统配置的 Dashboard。新版本的 Kylin已经自带了强大的 Dashboard 功能，目前我们两者都在使用。

集群升级的一些经验分享

1. 背景及挑战

集群升级的背景主要是说我们当时用到1.6的版本，其实是比较早期的一个版本了，功能也相对比较少，比如说Spark构建不支持，job server不支持高可用，我们很早就想升级了。因为是支持商业数据产品，服务不能长时间去中断服务，并且升级之后数据必须和原来保持一致，同时我们要规避升级过程带来的风险。

2. 整体方案

从1.6到2.6的版本，我们觉得升级跨度比较大，可能会有未知的风险，所以我们当时的方案是基于新版本的Kylin去搭建新的集群，然后并行运行，稳定运行后，直接切换域名解析。

整个过程分这几步，首先肯定是要把元数据同步到新集群，然后我们要把历史的这些Segment都构建起来，并且增量的构建要同步到新集群上进行自动构建，最后要对比新老集群的Segment数据量和大小以及连续情况。同时我们需要去收集老集群的一些SQL，然后把他们回放到新集群上，对比新老集群的SQL查询的结果并且生成对比报告。

3. 整体架构

这个是我们升级的一个整体架构，其实中间是基于KylinSide的工具，自动去构建和回放的一些功能。首先我们是对元数据的备份，相当于我们是直接对取HBase的元数据表，去把他同步到另一个HBase里面，其次是历史数据构建及增量构建，这也是一个自动的过程，还有就是我们收集老集群的SQL，写到kafka里面，然后存到MySql里面，然后KylinSide定期去回放这些SQL到新的集群里面去执行，最终会生成SQL结果的对比报告。

未来规划

1. 实时 OLAP

其实我们组是一个实时计算的小组，除了负责Kylin，我们还负责实时接入分发平台，消息中间件，实时计算平台这几块内容。我们目前遇到很多实时需求都是可以看成是实时OLAP需求，大部分场景都是让用户在我们平台上去写Flink SQL作业，将结果存储到Redis Sink或MySql Sink中。用Flink SQL开发，虽然一定程度上减轻他们的开发压力了，但还是没有Kylin的多维建模来的自然，同时Kylin本身支持lambda模式，可以很自然的实现实时和离线计算的口径统一。

目前我们也在调研了 Kylin 的实时OLAP的能力，我们内部也有几个场景在试用，虽然目前还没有正式上生产，但我们相信Flink SQL 的实时ETL加上Kylin的实时多维建模是一个不错的选择。

2. 云原生

我们很期待4.0云原生时代的Kylin，尤其是实时OLAP这一块，实时OLAP目前的运行方式，Streaming Receiver的维护成本还是有点高的，相信4.0时代，可以支持在Cube级别动态部署Streaming Receivers，让实时模块更加易用。

作者：邸星星，汽车之家实时计算平台负责人，长期从事实时计算与 OLAP 领域的平台建设工作，致力于为公司提供大规模、高效、稳定的计算与查询服务。

往期推荐
▬
Uber基于Apache Hudi构建PB级数据湖实践

数据湖 | 一文读懂Data Lake的概念、特征、架构与案例

认识 Delta Lake：让数仓进化到数据湖

干货 | Kafka 内核知识梳理，附思维导图

你可能感兴趣的:(Kylin 在汽车之家的最佳实践大揭秘)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不