师太，老衲把持不住了

OLAP引擎这么多，为什么苏宁选择用Druid？

51CTO传媒 2018-12-21 11:24:12

【51CTO.com原创稿件】随着公司业务增长迅速，数据量越来越大，数据的种类也越来越丰富，分析人员对数据处理的响应延时要求也越来越高，传统的大数据处理工具已经无法满足业务的需求。

特别是 OLAP 分析场景，需要对各种维度和度量进行上卷、下钻、切片和切块分析，并要求分析结果能够实时返回。

因此我们调研和对比了一些目前主流的 OLAP 分析工具，针对聚合计算的实时分析，我们引入了开源分析工具 Druid。

Druid 介绍

说起 Druid，大家首先想到的是阿里的 Druid 数据库连接池，而本文介绍的 Druid 是一个在大数据场景下的解决方案，是需要在复杂的海量数据下进行交互式实时数据展现的 BI/OLAP 工具。

它有三个特点：

处理的数据量规模较大。
可以进行数据的实时查询展示。
它的查询模式是交互式的，这也说明其查询并发能力有限。

目前 Druid 广泛应用在国内外各个公司，比如阿里，滴滴，知乎，360，eBay，Hulu 等。

Druid 之所以能够在 OLAP 家族中占据一席之地，主要依赖其强大的 MPP 架构设计，关于它的架构，这里就不展开描述了，感兴趣的同学可以登陆官网 druid.io 进行了解。

除了 MPP 架构外，它还运用到了四点重要的技术，分别是：

预聚合
列式存储
字典编码
位图索引

预聚合算是 Druid 的一个非常大的亮点，通过预聚合可以减少数据的存储以及避免查询时很多不必要的计算。

由于 OLAP 的分析场景大多只关心某个列或者某几个列的指标计算，因此数据非常适合列式存储。

在列式存储的基础之上，再加上字段编码，能够有效的提升数据的压缩率，然后位图索引让很多查询最终直接转化成计算机层面的位计算，提升查询效率。

Druid 既然是 OLAP 工具，那它和其他 OLAP 工具有哪些差异呢?

图 1：OLAP 工具的对比

从上图可以看出，Kylin 和 Druid 整体上相比较其他两个还是很有优势的：

相比较 Kylin，Druid 没有模型管理和 cube 管理的能力，Kylin 无法提供实时查询。

相比较 ES，Druid 的优势在于聚合计算，ES 的优势在于查明细，在苏宁，对 Druid 的使用，一般应用在需要对数据进行实时聚合查询的场景。

Druid 在苏宁的应用场景

苏宁很多业务场景都使用到了 Druid，本文将列举两个例子，分别是门店 App 系统以及诸葛系统。

门店 App 系统

门店 App 系统是一款集数据服务、销售开单、会员营销、收发盘退、绩效管理、V 购用户沟通、学习中心等于一体的门店店员移动工作平台，其销售界面如下所示：

图 2：销售界面

图 3：客流界面

门店 App 业务大致情况如下：

数据量：保存近几年的数据。
数据接入方式：Kafka 实时数据接入，隔天离线数据覆盖昨天数据。
查询方式：实时查询。
业务实现：topN 实现销售额曲线展示，groupby 分组楼层客流分布，timeserise 做天汇总。

诸葛报表系统

诸葛报表系统是苏宁重要的系统之一，能够帮助业务做出决策分析，减少手工分析成本，帮助提高销售，该系统可以主动给业务发送销售数据，推动业务进行销售关注和分析。

图 4：诸葛报表系统

诸葛业务大致情况如下：

数据量：保存近几年数据。
数据接入方式：Kafka 实时数据接入。
查询方式：实时查询。
业务实现：topN 实现销售饼图展示，groupby 分组实现大区销售排名。

上文简单介绍了一下什么是 Druid 以及 Druid 在苏宁的两个业务场景应用，那 Druid 在苏宁的平台建设是怎样的呢?

Druid 在苏宁的平台建设

图 5：两种架构

Druid 的平台建设在苏宁主要有两种：

通过 OCEP(提供负载均衡，查询路由功能等)，使用 Druid 原生的能力，满足业务一系列的需求。
结合苏宁的天工系统和百川系统，Druid 作为 OLAP 引擎的底层加速系统，提供统一报表的查询能力。

目前，大部分的业务使用 Druid 的方式主要还是第一种，有少量的业务使用的是第二种方式，随着第二种方式的逐渐成熟，后面大家的业务会逐渐从第一种方式迁移到第二种上去，实现资源统一。

基于 OCEP 的平台架构

图 6：基于 OCEP 的平台架构

该平台主要依赖 OCEP，对外提供一系列的 OLAP 查询服务，满足集团内部各种业务的维度指标分析需求：

通过 tranquility 实时消费业务数据，发送到 Druid 的 realtime peon，并进行 handoff 持久化到 HDFS 上，由 coordinator 进行加载到 historical 中，提供查询服务。
通过苏宁自研的 IDE 任务调度系统，将 HDFS 上的离线数据(一般是数仓数据)经过 mapreduce 任务处理完写入到 Druid 指定的 HDFS 路径下，同样由 coordinator 进行加载到 historical 中，提供查询服务。
最后通过 OCEP，将业务的查询路由到各个 broker 上，broker 再分发给 historical，经过 historical 计算后，再向上一层一层返回给业务。

基于 OLAP 引擎的平台架构

图 7：基于 OLAP 引擎的平台架构

为保证数据的一致性和统一性，该平台基于 OLAP 引擎，为集团各个业务提供统一的维度指标分析系统：

百川系统通过 OLAP 引擎构建模型，OLAP 引擎根据业务需求，将模型拆分成若干个 cube，存储到底层的 Druid，Hive，PG 和 ES。我们称这个过程为模型加速，另外，百川系统自身会构建各种各样的指标。
业务方，比如天工，诸葛等系统通过百川提供的指标，选择其中一个或多个进行报表的构建，其查询请求会发送到百川系统。
百川系统构造 SQL 语句，再把请求发送到 OLAP 引擎，OLAP 引擎通过底层的 Spark 平台，解析 SQL 语句，将请求路由到 Druid，ES，Hive 和 PG，其中，时序化数据的聚合查询，将路由到 Druid 平台，最后查询结果一层一层汇总到上层的业务系统。
整个系统的监控，通过云迹系统、华佗系统等进行监控，将系统日志接入云迹，将系统的 metric 信息接入华佗。

随着 Druid 平台建设的不断推进，使用 Druid 的业务也越来越多，在使用的过程中也会遇到各种各样的问题，下文总结了苏宁业务开发人员在使用 Druid 中遇到的一些问题，希望对正在阅读本文的读者有些帮助。

Druid 使用建议

本小节主要想结合实际问题，给大家提供一些 Druid 的使用建议，供大家参考。

①什么样的业务适合用 Druid?

建议如下：

时序化数据：Druid 可以理解为时序数据库，所有的数据必须有时间字段。
实时数据接入可容忍丢数据(tranquility)：目前 tranquility 有丢数据的风险，所以建议实时和离线一起用，实时接当天数据，离线第二天把今天的数据全部覆盖，保证数据完备性。
OLAP 查询而不是 OLTP 查询：Druid 查询并发有限，不适合 OLTP 查询。
非精确的去重计算：目前 Druid 的去重都是非精确的。
无 Join 操作：Druid 适合处理星型模型的数据，不支持关联操作。
数据没有 update 更新操作，只对 segment 粒度进行覆盖：由于时序化数据的特点，Druid 不支持数据的更新。

②如何设置合理的 Granularity?

图 8：Granularity 设置

首先解释下 segmentGranularity 和 queryGranularity，前者是 segment 的组成粒度，后者是 segment 的聚合粒度。

要求 queryGranularity 小于等于 segmentGranularity，然后在数据导入时，按照下面的规则进行设置。

segmentGranularity(离线数据导入的设置)：

导入的数据是天级别以内的：“hour”或者“day”。
导入的数据是天级别以上的：“day”。
导入的数据是年级别以上的：“month”。

需要说明的是，这里我们仅仅是简单的通过 intervals 进行 segmentGranularity 的设置，更加合理的做法应该是结合每个 segment 的大小以及查询的复杂度进行综合衡量。

考虑到 tranquility 实时任务的特殊性和数据的安全性，我们建议实时数据导入时，segmentGranularity 设置成“hour”。

queryGranularity：根据业务查询最小粒度和查询复杂度来定，假设查询只需要到小时粒度，则该参数设置为“hour”。

③需要去重的维度到底需不需要定义到维度列中?

图 9：去重维度定义

如果去重的维度只需要去重计算，没有其他的作用，譬如进行过滤或者作为分组字段，我们建议不要添加到维度列中，因为不添加的话，这样数据的预聚合效果更好。

④如何选择查询方式?

常用的三种查询：

select sum(A) from DS where time>? [timeseries]
select sum(A) from DS where time>? group by B order by C limit 2 [topN]
select sum(A) from DS where time>? group by B，C order by C limit 2[groupby]

没有维度分组的场景使用 timeseries，单维度分组查询的场景使用 topN，多维度分组查询场景使用 groupby。

由于 groupby 并不会将 limit 下推(Druid 新版本进行了优化，虽然可以下推，但是对于指标的排序是不准确的)，所以单维度的分组查询，尽量用 topN 查询。

我们做的工作

从 Druid 引入苏宁之后，不久便承担起了 OLAP 分析的重任，作为底层核心引擎支撑模型和指标服务，并为集团各条业务线的 OLAP 分析服务，在过去的时间里，我们做了很多工作，本文列举一些进行说明。

①OCEP(Druid 集群前置 proxy)

图 10：OCEP(Druid 集群前置 proxy)

OCEP 是 Druid 集群一个前置 proxy，通过它来提供更加完备的 Druid 集群化和服务化能力，并解决当前 Druid 服务存在的各种问题。

它提供的功能主要有：

访问鉴权(针对每个 datasource 提供 token 访问鉴权，保证数据安全)。
访问审计(对每个查询都会生成唯一的 queryId，提供完整的请求来源)。
请求拦截(对非预期的访问，制定拦截策略，细化到具体的 datasource 和查询语句)。
请求路由(根据集群名称和 datasource，将请求路由到指定的 Druid 集群，并根据后端 broker 的压力，将请求负载均衡各个 broker 上)。
服务隔离(可设置策略，对于不同的 datasource 的请求，可路由到指定的 broker 上，实现 broker 隔离)。

②Druid 查询客户端

官方提供的查询方式是通过编写 Json 文件，以 HTTP 的方式请求 Druid，然而这种方式的缺点也很明显，首先 Json 内容书写繁琐，格式极易写错，另外在 Java 开发时，出现问题不利于定位。

图 11：Json 语句

于是我们封装了一层 Java API，如下图：

图 12：Druid Java Client

③资源隔离

图 13：资源隔离

不同业务的数据量有大小之分以及对服务稳定性要求不一样，我们通过以下三点实现业务层面的隔离：

Historical 分组：集群设置不同的 tier，存储不同的业务数据。
Broker 隔离：通过 OCEP 设置 datasource 白名单，不同的 broker 只提供某个或某几个 datasource 的查询。
冷热数据隔离：通过设置 datasource 的 rule，将冷热数据分别存储在不同的 tier 中。
Druid 白名单控制。

集群稳定性压倒一切，防止控制以外的机器对集群进行无效查询和攻击，我们通过增加一个 whitelist 的 extension，以模块的方式在服务端进行白名单的控制。

并且可以针对不同的服务进行控制，将 whitelist 的配置文件写在 Druid 的 metadata 的 config 表中，实现动态更新。

图 14：白名单 extension

图 15：Druid 白名单配置

④Druid 离线导入时对 intervals 的控制

有些离线导入的任务，占用了 YARN 太多的资源，个别任务消耗了上千个或者上万的 container 资源，分析发现是由于业务设置的 segmentGranularity 不合理，最终会导致 segment 过多，产生很多 HDFS 小文件。

于是我们在 overlord 服务端，增加参数“druid.indexer.intervals.maxLimit”，对离线任务进行判断。

如果 segmentGranularity 和 interval 设置的不合理，将禁止提交。譬如，segmentGranularity 设置的是小时，interval 设置的间隔是 1 年，这种是不合理的，服务端将禁止数据导入。

图 16：离线导入对 intervals 的控制参数配置

⑤Coordinator 自动 merge segment 时启动 task 的并发数控制

在集群中，我们打开了 coordinator 自动 merge segment 的功能，coordinator 默认每隔 30 分钟，启动 merge 线程，扫描所有的 datasource，将过小的 segment 按要求进行合并。

每当一批 segment 符合 merge 要求了，就会请求 overlord 进行启动 merge task。

如果集群内小 segment 很多，merge task 将启动无数个，堵塞 middleManager 的 peon 资源，我们增加限制 merge task 的并发数的参数，保证每次 merge 线程只启动一定数量的 task。

图 17：设置 merge task 的并发数

⑥Druid 监控

监控对于任何一个系统而言都是非常重要的，可以帮助我们提前预知系统的健康状况，Druid 的监控主要有两点，业务查询情况和平台运行情况。

前者主要包括 datasource 的查询量、查询耗时、网络流量等;后者主要包括各个服务的 gc 情况、cpu 和内存使用情况、空闲 Jetty 线程数等。

我们的监控方案是 Druid_Common 集群和 Druid_OLAP 集群相互监控，互相存储对方的 metric 信息，然后通过 superset 展示。

图 18：Druid 的监控方案

未来规划

Druid 在苏宁还有很长一段路要走，无论从查询优化方面还是集群管理方面，都有很多事情要做。

查询优化方面：

高基数问题：高基数查询一直是 OLAP 查询的一大痛点，新版本虽然支持 limit 下推，但也只是对维度进行排序的时候，才能保证准确性。
SQL 支持：进行 Druid 版本升级，提供丰富的 SQL 查询接口。
精准去重：目前 Druid 对去重的计算，无论是 HyperLogLog、ThetaSketch 还是最新版本提供的 HLLSketch 都是非精确的，后面考虑是否可以通过集成 bitmap 解决。

集群管理方面：

Kafkaindex service 使用：tranquility 的时间窗口限制会造成延迟很大的数据丢失，而且实时 peon 的管理不够灵活，某些场景下，也会造成数据丢失。

而 Kafka index service 的实时 peon 调用了 Kafka 底层的 API，管理更灵活，依赖 Kafka 实现数据的不丢不重。

Datasource 跨集群迁移：Druid 无论是数据导入还是数据查询都非常依赖 Zookeeper，当集群规模越来越大，datasource 越来越多的时候，Zookeeper 也许会成为瓶颈。

这样的话，就需要做 datasource 的迁移，而迁移工作涉及到 datasource 元数据和 HDFS 数据的迁移，如何让迁移工作轻量化，是我们需要思考的。

作者：李成露

简介：苏宁易购 IT 总部大数据中心大数据平台研发工程师。多年大数据底层平台开发经验。现负责苏宁大数据底层平台的计算资源调度平台以及 Druid 平台的研发工作，提供离线计算平台和实时计算平台的资源调度方案，提供基于 Druid 的 OLAP 平台，为集团各种维度指标分析业务提供稳定保障。

【51CTO原创稿件，合作站点转载请注明原文作者和出处为51CTO.com】

Docker后端部署 cui_hao_nan 后端技术总结 docker 容器运维
1、构建Docker容器首先编写Dockerfile，将后端项目打包为Docker容器镜像。Dockerfile是一个文本配置文件，包含一系列指令，用干自动化构建Docker容器镜像。我们需要在Dockerfile中定义:基础环境(比如预装JDK的Linux系统)有哪些原始文件?(比如项目源代码)如何构建项目?(比如mavenpackage命令打包)如何启动项目?(比如java-jar命令).2、
为什么C#中int值 1_2是对的呢？
intIntTest=25_23;这个结果是int值2523,intIntTest=12_9;这个结果是int值129.底层逻辑：下划线仅作用于数字可视化分隔，编译时会被忽略。若夹杂其他非数字字符（如字母、运算符）则会报错。该特性遵循Java7+的语言规范，旨在提升长数字的可读性而不改变数值
《手把手教你》系列技巧篇（二十二）-java+ selenium自动化测试-webdriver处理浏览器多窗口切换上卷（详细教程）北京-宏哥 java selenium 测试工具开发语言自动化
1.简介上一篇讲解和分享了如何获取浏览器窗口的句柄，那么今天这一篇就是讲解获取后我们要做什么，就是利用获取的句柄进行浏览器窗口的切换来分别定位不同页面中的元素进行操作。2.为什么要切换窗口？Selenium在当前页面打开了新的窗口，此时就需要跳转到新的窗口去，就需要把窗口进行切换。宏哥这里简单举例一个测试场景，你在页面A点击一个连接，会在新的tab窗口打开页面B，这个时候，你在页面B点击一个连接，
C#配置全面详解：从传统方式到现代配置系统阿蒙Armon C#工作中的应用 c#网络数据库
C#配置全面详解：从传统方式到现代配置系统在软件开发中，配置是指应用程序运行时可调整的参数集合，如数据库连接字符串、API地址、日志级别等。将这些参数从代码中分离出来，便于在不修改代码的情况下调整应用行为。C#提供了多种配置管理方式，从传统的XML配置文件到现代的多源配置系统，每种方式都有其适用场景。本文将全面介绍C#中的配置技术，帮助开发者根据项目需求选择合适的配置方案。一、配置基础与核心概念1
C#读取文件夹和文件列表：全面指南阿蒙Armon C#工作中的应用 c#开发语言服务器
C#读取文件夹和文件列表：全面指南在C#开发中，经常需要获取文件夹中的文件列表或子文件夹结构，例如文件管理器、批量处理工具、备份程序等场景。本文将详细介绍C#中读取文件夹和文件列表的各种方法，包括基础操作、递归遍历、过滤搜索、高级属性获取等，帮助开发者根据实际需求选择最合适的实现方式。一、基础方法：使用Directory类的静态方法System.IO.Directory类提供了一系列静态方法，可快
stack_queue扩展学习 --- 反向迭代器茉莉玫瑰花茶 C++反向迭代器 C/C++
反向迭代器的实现思路源码及框架分析迭代器是用来遍历容器的，是一种封装，它不需要去关注容器的底层实现（底层是数组，链表，还是树等等这些结构），我们都是用统一的方式去对容器进行访问，访问行为是类似指针的。我们之前学习了普通迭代器和const迭代器：普通迭代器：能读能写；const迭代器：只能读，只能遍历数据，得到数据，不能修改数据，是不能写的。我们之前学的普通迭代器是正向迭代器，如果我想逆方向遍历呢？
内网穿透和端口映射的区别在哪？局域网提供互联网访问方案对比选择详解搬码临时工智能路由器网络
内网穿透和端口映射是两个经常被提及的概念，它们对于实现网络中的内外网通信起着关键作用。内网穿透和端口映射都能够有效地将本地局域网地址提供给互联网上外网访问，但二者之间存在着显著的区别。内网穿透与端口映射的核心区别在于实现方式和依赖条件不同‌，下面来看看它们之间从原理到实现上的差异详解。一、技术原理与依赖性‌不同端口映射‌：基于‌网络地址转换（NAT）技术‌，通过路由器或防火墙等设备实现。它需要在公
云存储的应用场景都包含哪些？
云存储是一种网上在线存储的模式，可以将重要的数据信息存放在由第三方托管的虚拟服务器当中，云存储是在云计算概念上所延伸和衍生出的一个新的概念，保证企业中数据的安全性，同时还帮助企业节省了一定的存储空间，让用户可以更加便捷的存取所需的数据资源，实现文件共享和协作功能。本文将来具有了解一下云存储的应用场景都有哪些吧！云存储所应用的场景也较为广泛，其高度的灵活性和可扩展性成为了各个企业的首要选择，尤其是对
鸿蒙分布式开发实战指南：让设备协同像操作本地一样简单 harmonyos
摘要在如今设备高度互联的时代，一个用户往往会同时使用手机、平板、电视、手表等多个设备。鸿蒙系统基于“分布式能力”，让多个设备协同工作变得更简单，比如手机控制电视播放、手表调节空调，甚至多设备之间自动分工协作。这篇文章就带你从开发者角度出发，手把手了解鸿蒙分布式能力的实现方式。引言：为什么要用鸿蒙的分布式能力？随着物联网的发展，单设备运行逻辑已经难以满足日常复杂场景。鸿蒙系统设计了独特的分布式架构，
Spark运行架构 EmoGP Spark spark 架构大数据
Spark框架的核心是一个计算引擎，整体来说，它采用了标准master-slave的结构如下图所示，它展示了一个Spark执行时的基本结构，图形中的Driver表示master，负责管理整个集群中的作业任务调度，图形中的Executor则是slave，负责实际执行任务。由上图可以看出，对于Spark框架有两个核心组件：DriverSpark驱动器节点，用于执行Spark任务中的main方法，负
Ubuntu 20.04 搭建gitlab
更新apt源sudoaptupdate安装依赖项#PostfixConfiguration选择Noconfiguration就好sudoapt-getinstallcurlopenssh-serverca-certificatespostfix下载gitlab-ce软件包sudowgethttps://mirrors.tuna.tsinghua.edu.cn/gitlab-ce/ubuntu/po
「源力觉醒创作者计划」_以FastDeploy为例部署ERNIE-4.5-21B大模型全流程实践 cooldream2009 大模型基础 AI技术文心大模型 FastDeploy
目录前言1环境准备与依赖安装1.1硬件要求1.2Python环境与pip升级2下载ERNIE-4.5模型权重2.1安装HuggingFaceCLI工具2.2设置国内镜像加速（可选）2.3下载模型文件3安装FastDeploy与Paddle推理引擎3.1安装PaddlePaddle-GPU版本3.2安装FastDeploy-GPU4启动ERNIE-4.5本地服务4.1启动OpenAI兼容API服务4
关于有时候使用VPN后，关闭系统代理后短时间无法正常使用网络的原因及解决办法
为什么？以下是可能的原因代理设置残留关闭代理后，部分应用或系统服务仍尝试通过原代理服务器连接，导致短暂无法访问网络。DNS缓存未刷新VPN可能修改了DNS服务器，关闭代理后旧DNS缓存未及时清除，需等待缓存过期（通常几分钟到几小时）。路由表未即时恢复VPN会添加特殊路由规则，关闭后系统需要时间恢复默认路由，期间流量可能错误转发。DHCP租约续期延迟校园网/DHCP服务器可能需要时间重新分配IP或更
在WPF中使用CommunityToolkit.Mvvm——（一）为什么使用CommunityToolkit.Mvvm 永远的久远 wpf
前言阅读我文章的同学可能已经发现了，我总是会在一个系列文章的第一篇抛出问题，为什么要用到这个技术。因为一些成熟的库和技术会给我们带来生产力大幅的提升，同时通过学习一些优秀的开源项目，对我们个人的能力提升也会有帮助。接下来我们一起来看一下MVVMToolkit能为我们带来哪些惊喜～～CommunityToolkit.Mvvm是什么微软的官方文档这样介绍的CommunityToolkit.Mvvm包（
技术解析｜可灵AI全球首部AI单元剧《新世界加载中》工作流揭秘：提示词工程如何解决口型同步/复杂动作生成？
昨天，在北京首映礼的暗场中，一段黏土风格的荒诞喜剧画面投映在银幕上：一根「宇宙肥肠」在太空中漂浮，讽刺着人类对虚假进步的盲目崇拜。这便是快手可灵AI与异类Outliers团队共同推出的《新世界加载中》，全球首部AI单元剧集。这部与传统短剧不同的全新作品，用全新的呈现方式为观众带来了更具视觉冲击力的视觉效果和观影体验，成为AIGC领域的创新之作。然而，涵盖7个不同题材的单元剧集，必定涉及复杂的人物表
（二）MATERIAL DESIGN框架安装和使用 Chen住气* UI主题框架的Material Design C#ui
在WPF中使用MaterialDesign需要安装MaterialDesignThemes程序包。通过安装该程序包，您将获得MaterialDesign所需的样式和控件，以及相关的资源字典引用。通过NuGet包管理器进行安装的具体步骤如下：打开VisualStudio。在解决方案资源管理器中，右键单击项目名称，选择“管理NuGet程序包”。在NuGet程序包管理器中，选择“浏览”选项卡。在搜索框中
Windows 环境下 Nginx 搭建 HTTPS 图片存储服务器（阿里云域名、SSL 证书与安全配置）只因在人海中多看了你一眼摸索学习心得 windows nginx https
在互联网应用中，图片存储是至关重要的一环。为了保证图片的安全性和访问速度，搭建一个基于HTTPS的图片存储服务器是最佳选择。本文将详细介绍如何在Windows环境下使用Nginx搭建一个HTTPS图片存储服务器，并涵盖域名购买、DNS解析、SSL证书申请与配置、Nginx部署以及端口开放等关键步骤。一、准备工作Nginx：下载Windows版本的Nginx(建议选择稳定版)。Q1:Nginx(en
GO语言中二次插值算法实现预测
基础介绍：给定给定区间，函数连续且，那么根据介值定理，函数必然在区间内有根。二分法：将区间不断二分，使端点不断逼近零点。下一次迭代的区间为或，其中。割线法（线性插值）：基本思想是用弦的斜率近似代替目标函数的切线斜率，并用割线与横轴交点的横坐标作为方程式的根的近似。即给定两个点,。其割线方程为，那么令，x的值即为下一次迭代的结果。逆二次插值法：为割线法的进化版本。使用三个点确定一个二次函数，二次函数
为什么在 macOS 中运行 Python 项目必须使用虚拟环境？ coding随想 Python macos python 开发语言
为什么在macOS中运行Python项目必须使用虚拟环境？在macOS上开发Python项目时，虚拟环境（VirtualEnvironment）是一个不可或缺的工具。无论你是初学者还是资深开发者，理解虚拟环境的意义和使用方法，都是提升开发效率和项目稳定性的关键。本文将从macOS的特殊性出发，深入浅出地解释为什么在macOS中运行Python项目必须使用虚拟环境。一、macOS系统Python的局
从0开始学习计算机视觉--Day08--卷积神经网络
之前我们提到，神经网络是通过全连接层对输入做降维处理，将输入的向量通过矩阵和激活函数进行降维，在神经元上输出激活值。而卷积神经网络中，用卷积层代替了全连接层。不同的是，这里的输入不再需要降维，而是可以保留输入的空间结构，例如输入的是32×32×3的图片，在全连接层中是3072×1的向量，而卷积层里则保持不变。这里的改变的地方是对于同样的WX的函数形式，这里是把5×5×3的权重矩阵（也叫卷积核）向量
二进制部署Kubernetes1.32.4最新版本高可用集群及附加组件 Nova_CaoFc 容器云技术专栏 kubernetes 容器云原生
一、前言在云原生技术席卷全球的今天，Kubernetes（K8s）已成为容器编排领域的事实标准。当大家都习惯了kubeadm、kubeasz等自动化工具一键部署的便利时，选择通过二进制方式手动搭建K8s集群更像是一场"知其然亦知其所以然"的深度修行。这种方式将带您穿透抽象层，直面etcd的分布式存储机制、kube-apiserver的RESTful接口设计、kubelet与CRI的交互细节，以及各
macOS使用minicom调试串口坚果-大发智能硬件极客玩物
macOS开发Arduino时有时候需要调试串口1.配置minicom$minicom-sctl-AZ按下O或选择进入“Serialportsetup”选项修改Device为/dev/tty.usbmodem1411保存为默认参数，选择“Savesetupasdfl”并回车即可：接下来选择“Exit”并回车。2.再次运行$minicom初始化完成之后，minicom就会连接到串口，并显示。3.使用
Java手动打印执行过的sql GoodStudyAndDayDayUp java sql 开发语言
1.拦截器packagecom.xxx.platform.common.interceptor;importcom.baomidou.dynamic.datasource.toolkit.DynamicDataSourceContextHolder;importcom.xxx.platform.common.aop.OLAPQuery;importcom.xxx.platform.constant
【容器】优质文章分享
文章目录加速器Docker教程安装坑volumn网络配置踩坑其他dockerfiledocker-compose手册教程网络坑docker使用dockermysqldockermongoredisdocker-rabbitmqnginxtomcatnacoszookeeperelasticsearch加速器现在docker镜像站真的不好找了。阿里什么的加速目前只能给阿里自己的容器用了。且用且珍惜D
cubase教程分享：Cubase录音时如何自动激活监听按钮
Cubase是一款功能全面且强大的音频处置工具，具有MIDI音序功用、音频编辑处置功用、多轨录音缩混功用、视频配乐以及环绕声处置功用，简直能满足用户的一切需求，并且最新版的Cubase着重提升了音质和稳定性，补足本人的短板，值得更多人选择。前面所说的是Cubase的主要功用，它还有许多小功用，很多用户喜欢用Cubase来录音，但是有的人不晓得如何自动激活监听按钮，所以这篇文章就向大家分享一下Cub
怎样录制电脑内部发出的声音 qq_40918187
第一步：右键点击任务栏处的声音图标点击录音设备(R)。第二步：接下来的界面就是录音设备的选项。点击右键，选择“显示禁用的设备”。第三步:然后就会出现下面标注的“stereoMix”设备。第四步:右键点击这个设备，选择第一项，启用。第五步:这时这个设备显示准备就绪。这样就点击确定关闭窗口了。第六步:打开录音机开始录制电脑发出的声音
软件架构设计中消息总线的应用详解半青年消息总线网络协议信息与通信 kafka MQTT 物联网系统架构
目录一、消息总线的核心原理1.解耦与异步通信2.消息路由与协议适配3.可靠性保障二、消息总线的核心功能1.动态扩展与负载均衡2.容错与高可用性3.数据转换与集成三、典型应用场景1.微服务架构中的服务解耦2.大规模数据流处理3.复杂事务管理4.边缘计算与物联网四、设计考量与选型建议1.通信模式选择2.协议与生态适配3.容错与监控五、案例分析：SpringCloudBus与物联网平台1.SpringC
一文读懂Python+Pytest+Allure+Jenkins+Gitee自动化测试框架，手把手教你搭建
Python+Pytest+Allure+Jenkins+Gitee自动化测试框架一、框架整体架构1.技术栈分工Python：测试脚本开发语言Pytest：测试用例管理和执行引擎Allure：测试报告生成与展示Jenkins：持续集成和任务调度Gitee：代码版本管理和触发机制2.数据流向Gitee代码提交→Jenkins触发构建→Pytest执行用例→生成Allure结果→Jenkins收集报告
【vue】用conda配置nodejs，一键开通模版使用权温择之 conda
特此鸣谢我的好同学@重中之重的特级教学，非常之好用一、conda环境下载安装二、创建包含nodejs的conda环境创建一个新环境：condacreate-n【自定义环境名字】python=3.9condacreate-nmy_nodejs_envpython=3.9激活新环境：condaactivate【环境名字】condaactivatemy_nodejs_env下载安装nodejs：cond
Vue3 响应式原理揭秘：为什么数据一改页面就变？ qqqdqd vue.js javascript 前端
Vue3最大的底层变革之一，就是响应式系统由Object.defineProperty转向了现代浏览器的ProxyAPI。你是否好奇：为什么state.count++，页面就自动更新了？一切的秘密，就藏在Vue的reactive()函数背后！核心原理：用Proxy劫持对象的读写操作简化实现如下：js复制编辑functionreactive(obj){returnnewProxy(obj,{get(
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

OLAP引擎这么多，为什么苏宁选择用Druid？

你可能感兴趣的:(OLAP引擎这么多，为什么苏宁选择用Druid？)