Apache IoTDB

2023 IoTDB Summit：天谋科技高级开发工程师田原《尽其用：如何用 IoTDB 发掘数据的无限潜能》...

12 月 3 日，2023 IoTDB 用户大会在北京成功举行，收获强烈反响。本次峰会汇集了超 20 位大咖嘉宾带来工业互联网行业、技术、应用方向的精彩议题，多位学术泰斗、企业代表、开发者，深度分享了工业物联网时序数据库 IoTDB 的技术创新、应用效果，与各行业标杆用户的落地实践、解决方案，并共同探讨时序数据管理领域的行业趋势。

我们邀请到天谋科技高级开发工程师，Apache IoTDB PMC Member 田原参加此次大会，并做主题报告——《尽其用：如何用 IoTDB 发掘数据的无限潜能》。以下为内容全文。

IoTDB 强大的查询性能

具有时序意义的算子

UDF 函数库

典型查询场景示例

大家好，我是来自天谋科技的田原，在天谋科技主要负责 IoTDB 的查询引擎的相关工作。今天 talk 的题目刚才主持人也介绍了，主要也是跟数据查询相关的。

我今天的演讲主要分这四个部分去展开。先跟大家简单介绍一下 IoTDB 强大的查询性能，然后就是 IoTDB 一些具有时序特色的查询的算子。第三个部分会跟大家介绍一下 UDF 函数库，在早上的时候王老师可能也提过了，我们清华团队，其实宋老师组去做了不只有压缩的算法，还有一些工业上的数据质量的函数库，都在我们 UDF 函数库里面会去介绍。第四，会跟大家介绍一些真实的时序场景，并且会跟关系型的 SQL 去做一些对比，大家能够真实地去感受到，用 IoTDB 的 SQL 去写一些查询语句，会比关系型数据库更加容易。

IoTDB 强大的查询性能

首先，第一个部分就是 IoTDB 强大的查询性能。程序员可能经常会说的就是：“Talk is cheap, show me the code.” 所以在数据库领域，大家经常也会说：“talk is cheap, show me the benchmark result.” 在时序场景里面，大家可能比较公认的一个测试套件叫 TSBS，那么 IoTDB 在今年也是上榜了 benchANT。benchANT 是位于德国的一家第三方的，做云设施或者说数据库测评的一个机构，作为第三方的一个机构，它当然不仅仅是做时序数据库。它在时序数据库的这个板块，主要采用的就是刚刚说的 TSBS 这样一个测试套件。它包含两种环境，都是大家在 AWS 上面可复现的，一种是 2 核 8GB 的，还有一种是 4 核 16GB 的这两种环境。

IoTDB 在这两种环境下面表现都相当优异，不能说全面碾压，只能说遥遥领先。大家可以看到，在 small 环境，就是刚刚提到的 4 核 16GB 的这个环境下面，因为查询性能分两方面，第一方面是 QPS，这里列出它每秒能达到 11497 次的查询操作，比 VictoriaMetrics 高出了 36%，是 InfluxDB 的 5 倍多，是 QuestDB 的 16 倍多。

在我们的查询延迟方面，查询延迟也只有 2 到 3 毫秒，也是远低于同类的数据库，大家也可以看到。

下面是 xsmall 环境，也就是刚刚提到的 2 核 8GB 的这样一个环境，其实都跟刚刚类似，IoTDB 也是排名第一，比同类的数据库也高出不少倍。

包括它的查询延迟。因为这是一个第三方的机构，大家也可以通过下面这个网址去访问的，在网上也可以看到。

这个比较好的测试结果其实是得益于 IoTDB 强大的查询引擎，它是基于 MPP 的。一条 SQL 过来之后，在 IoTDB 的节点里面，查询的节点角色分为两种：第一种是 Coordinator，它负责去接收用户的 SQL，根据这个 SQL 涉及的数据，然后根据数据分区，把它切分成不同的查询分片，再把它的查询分片发放到不同的 Worker 节点，这是另一个角色，发到 Worker 节点去做真正的执行。

当你有多副本的时候，这样一个架构可以帮你达到一个高可用的效果，因为有节点宕机或者网络分区的时候，我们可以选择把查询分片路由到它的另外一个分片上，也可以根据我们的节点负载去做实时的负载均衡。并且，这个 MPP 天然就可以把查询发到各个节点上去运行，所以它能够充分利用这种多机多核的特性。

刚刚提到的是查询的切分过程，一个查询被切分之后，刚刚提到，一个单个的查询的分片会被发到一个 Worker 节点上去做执行。那这样一个 Worker 节点上在执行的时候，它还会再进一步地去做切分，进一步地去利用单机多核的特性。

这个切分的时候分两个方面，一方面可能这个算子数还是很庞大，那我还是要在这个算子数上再进行一次切分。切分完了之后，它可能每一个分片，这里的分片是指的 Pipeline，就是已经到单个 Worker 上面了。那每一个 Pipeline 可能涉及很多个数据文件，那很多个数据文件，我们还能把数据文件再分组，这些分组就对应了多个 Driver，每个 Driver 就是真正可以调度的一些 Task，所以能够进一步降低我们的查询延迟。

有了这个查询的分片任务之后，那就需要去调度了。IoTDB 设计查询调度的目标主要有三个：第一个就是因为不同的查询任务可能有不同的优先级，短任务可能有更高的优先级，因为是实时的分析任务，还有一些批量的历史数据查询，它可能涉及的时间范围比较广，它的查询的时间会比较长，那它优先级可能稍微低一些没有关系。当然，我们的长查询不能长时间地给饥饿掉，因为它的实时查询可能不断地再来，我们要保证我们的历史分析查询也能够正确地去完成。第三点就是，引入一个新的调度器之后，你要确保调度器的开销就足够小。

IoTDB 去做设计的时候也是固定了查询的线程数，可能各个数据库都会这么去做，也定制了自己的调度算法，并且也做了一些内存控制，能够去控制查询任务的总内存空间，当超过内存阈值的时候就进行服务降级，去避免突发的查询导致的 OOM。还有就是查询超时，就是一个长的查询任务，可能是一些业务人员不小心去误触发的，那这样的一个查询任务在达到查询超时时间之后，也会被自动的终止掉，去避免这样一个长查询一直占着我们服务器的资源。

刚刚提到我们定制的，或者说自己去实现的一个调度算法叫多级反馈队列，这个其实也是操作系统里面比较经典的一个调度算法。它能够做到我们刚刚说的几点：第一点就是它的短查询会拥有更高的优先级，因为所有的任务进来的时候，都是被认为它的优先级是最高的。如果你在我给你的时间分片内执行完，那它其实就是一个短任务，永远都在第一级队列里面就执行完了。而当长查询进来的时候，第一个队列的时间分片可能用完之后还没有结束，那我就会把你放到第二级队列里面，那第二级队列里面意味着它的优先级会比较低，调度器尽量会去调度 Level 更低的队列里面的任务。

随着长查询慢慢会被放到最后一级 Level 的队列里面，那我们怎么保证它不会被饥饿呢？因为如果第一级队列一直有实时任务进来的话，其实这个 MLFQ 算法会把所有还存在的这些 Task，定期地去提高到 Level 0，这样的话就能够达到长查询不会被饥饿的效果。

具有时序意义的算子

跟大家简单介绍过查询大的框架之后，跟大家去具体的介绍一下有一些时序语义的特色的算子。时序查询能力分类主要分为这几种：第一种，也是比较常见的，就是我们的降采样查询，就是把一段时间的数据的趋势去做出来就行了，因为我们可能并不需要每一个具体的点，每个具体的点画出来的时候，它可能非常不直观。上面这张图，大家也可以看到，如果能够通过降采样，其实只要反映它一定的趋势就行了。

第二点其实就是我们的分段算法，时间序列去做分段。它跟关系型数据库里面的 GROUP BY 很像，但是关系性数据库里面它大部分都是 GROUP BY 某一列，只是根据值去做这个分列，它并没有去做分组，并没有一个顺序的语义，也不会有任何除了值分组之外的一些操作，当然它会有一些 Window Function ，那后面我也会提到。

第三点就是在时序场景里面也会非常常见的，就是我们的空值补齐查询。

这个就是刚刚提到的，在 IoTDB 里面会去通过 GROUP BY TIME 这样一个时间分组的功能，去实现我们的聚合降采样的功能。这个可能大家会比较熟悉，它有三个参数，当然第三个参数是一个 Optional 可选的。第一个参数就是指定我们查询的整个时间窗口，第二个参数是指定我们聚合的，也就是降采样的窗口大小。

通过一个例子大家可以看到，这个例子是去做了 11 月 1 号到 11 月 7 号这七天，每一天我需要按天去做降采样，就是这么简单的一个 SQL，可以看到它会得出来每一天的最大值，还有它的每一天的行数。

刚刚是没有用到第三个参数，那如果用到第三个参数，它能做到什么呢？它能够做到我还是按每一天去对这个数据做降采样，但是我可能并不需要这一整天的数据，我可能只需要每天凌晨 0 点到凌晨 3 点的数据，那就可以通过第三个参数，这样一个滑动步长的方式去解决。

除了刚刚说到的，也有一个大家可能不太会注意到的方式。我们的 GROUP BY TIME 其实是支持两种方式的，是通过左开右闭，和左闭右开的这种方式去做到。大家可能用第一种方式，左闭右开比较多，左闭右开的话，它可能包含 0，但不包含 9，当有 0、1、2、3、4、5、6、7、8 这九个点的时候，它做完分组之后，第一个分组包含 0、1、2，第二个就包含 3、4、5，第三个就包含 6、7、8。因为 IoTDB 每一个结果集都会有一列 Time，它显示的时候也是用的起始时间，也就是我们的左端点去展示的。

但如果是左开右闭的话，那就是 0 不包含，它包含的时间点是 1 到 9。分组同样的也会做改变：1、2、3；然后 4、5、6，然后 7、8、9。它做 Time 列的展示的时候，是会用右端点进行展示的，这里是 3、6、9。

降采样跟大家提了一下，第二个就是刚刚我们说的分段的方式。这边提到了一个定义叫差值分组，它是什么意思呢？就是它会根据所有的时间序列的值，跟这个组的第一个的差值去做分段。如果这个差值超过我们所设定的阈值了，那它就不属于这个分组，它就属于下一个分组了。从这张图大家可以很容易的看出来，第一个值规定了这样分组的一个区间，后面的值如果超过它比较多，那就明显不属于这个组了，它就会属于下一个组。

这也是一个实际的例子。如果我们以 s1 这个序列去做分段，0.1 就是我们设定的阈值，从 0.9 跳到 1.2，差值已经是 0.3 了，所以它属于下一个分组了。

这个 GROUP BY SESSION 也是在时序场景里面可能比较常见的，它叫会话分组。会话分组和刚刚不一样的地方在于，它是对时间列去做分组操作的。比如说一台机械，它可能并不是时时刻刻都是开机的，我想要它每一次开机的平均值。它的状态可能一直是 1，就是它一直是开机的，你能看到数据，但是我要对它每一段开机做一个分段，那其实就是根据我们当前的这个时间点，它跟上一个时间点的间隔，如果超过了我们设定的阈值，我们就认为它中间可能发生了一些问题，或者发生过关机，那我们就可以把它认为是下一次开机时的状态。这个其实也是比较常见的，我们是可以通过 GROUP BY SESSION 这样一种方式去指定的。

这边给了一个例子，比如说我们设定的阈值是 24 秒，这里第 4 行到第 5 行的时候，它的跨度超过了 24 秒，达到了 37 秒，那我们就把它自然而然地放到了下一个分组。

GROUP BY COUNT 这个函数很简单，跟大家快速过一下，它就是按照固定的点数分组，比如说每 5 个点分一个组。

这里也提到，因为有一些 null 值，我们还有一些参数可以支持指定忽不忽略 null 值。

GROUP BY CONDITION 这个稍微有一些复杂，它其实可以让用户自定义一个分组条件，它的分组条件是通过 Expression 去指定的，如果计算出来的 Expression 是 true，也就是说满足我们的自定义条件，那我们就把它保留下来，那些不满足过滤条件的值可能就自动被过滤掉了，它不会放到我们的分组里面。

并且因为时序有天然的连续性，它还通过第二个参数去指定了我们连续满足多少的时候，它才会被认定为我们需要选定的分组。

这里大家可以看到，我们指定 s1=1，并且它要连续超过两个 s1=1 为 true 的时候，我们才保留它。可以看到这里只有两个 group，即使第四行它得出来是 true，但是它连续的行数只有一个，所以它并不会被摘出来，所以我们得到的分组只有 group-1 跟 group-2。

其实刚才这个查询也可以用 GROUP BY VARIATION 去实现，无非就是多一个 having，having 后面可能加一个 count(*)>=2，那它相比而言有什么好处呢？第一是它更加灵活，它支持很多这种自定义的条件，并且它的执行代价更小，因为我们不会对于不满足分组的这些数据做聚合计算。我们如果用这种 GROUP BY VARIATION 的话，它其实是一开始得到很多很多的分组，那这些分组它也会做聚合计算，只不过最后在 having 的时候被过滤掉了。

刚刚讲的都是我们分段、分组的一些方式，那这边其实讲了一个我们的标量函数，叫差值函数。这个也是在时序场景很常见，就是我们要求当前值跟上一个值的差值，这个在后面的一些例子里面我也会提到，这里给大家已经展示了一下，比如说 5-5=0。

还有就是刚刚提到，最后的空值填充的功能，我们除了能够支持 PREVIOUS 填充之外，还能支持线性填充、常量填充等等，并且在前值填充的过程当中，我们还支持指定第二个参数，这个第二参数是什么意思呢？就是我们不是无脑地直接用前一个值去填充的，如果前一个真实的值跟当前的时间戳已经超过了我们指定的一个时间范围，比如说 2 分钟，我就认为它并不是一个有效值了，不需要去填充，我就继续保持 null 就行了，所以在这一块我们也可以支持指定第二个参数。

这是刚刚提到了，有三种填充方式。

除了刚刚说到的，我们还支持最新点查询。最新点查询的语法有一点特殊，只有这种语法去做的时候，它可以去命中我们的缓存，单个序列的最新点的查询，它的延迟能够达到微秒级别。

UDF 函数库

第三个部分是我们的 UDF 函数库的部分，主要跟大家介绍我们实用的一些 UDF。我刚刚提到宋老师组在做的 UDF 函数库，我们现在一共有 59 个通用的函数，它包含数据质量函数、数据画像函数、异常检测、频域分析，还有数据匹配、数据修复、序列发现，包括我们今天早上提到的机器学习的一些函数。

这里给大家举几个例子，比如说 ValueFill，这个其实跟刚刚的 FILL 很像，中间断了一个我们可以给你自动的填充项。

还有就是我们的异常值修复，目前是支持两种修复方式。这里可以看到，它可能有一些异常值会非常影响你的展示，上面这个图中间这些数据趋势都是平的了，但是其实把这些异常点给去掉之后，或者说修复之后，它展示出来的真正的趋势应该是下面这个图。这个还是在工业场景里面比较常用的 UDF 函数。

我们原来只支持行式的、迭代式的接口，在 1.3.0 版本里面，我们也支持了这种批量处理的接口，原来是一次处理一行，有 N 次的 function call，并且没有向量化优化的空间，因为我们知道 JDK 越往后发展，可能也会有一些 SIMD 的一些接口，现在在最新 JDK 版本里已经有了，但还是预览版。

那我们新的接口一次能够处理一批数据，对于一批数据只有一次 function call，并且有向量优化的可能，没有任何拆装箱的开销。

这里列了一下，我们原来用的是比较简单的加法去实现，这是原来的接口。

这是现在的实现接口的方式。

结果是差距比较大的，如果我们用批量接口的话，性能能够提升大约 6.5 倍。大家也可以试着把自己的一些旧的 UDF Function 更新成用现在的批量接口去实现，IoTDB 现在的函数库里面，如果是能够用这种优化去做的，我们都已经做了，大家也可以替换一下新的版本。

典型查询场景示例

第四个部分，也是今天会重点跟大家介绍的，一些典型的查询场景的实例。

第一个，刚刚其实也跟大家稍微提到一下，就是一些 UDF，它能够做异常检测，异常检测是什么意思？就是它可能是一个序列里面，我们要找出异常的点，但对异常的这个点，每个人的定义方式可能是不一样的。比如说这里，我定义异常的方式就是平均值的差距，超过我们 k 倍的标准差的数据的时候，我们会将它视为异常数据。右边这个表里面也给大家展示了，我标红的是会被选出来的异常数据。

那在 IoTDB 里面你可能不需要自己去实现这种 UDF 了，因为天然有这样一个 ksigma 的函数，你直接去调用，指定这个 k 倍的 k 就够了，它就能自动帮你去筛选出来了。

除了刚刚说的这个 ksigma 之外，还支持 IQR、LOF、MissDetect、Range、TwoSidedFilter、Outlier、MasterTrain，或者 MasterDetect 等等，总共是八种的异常检测算法，当然这个异常检测算法也在不断地补充。

第二个其实刚刚也是提到过了，就是我们需要对数据进行降采样，其实这个降采样函数也是 GROUP BY 加上我们的 FILL 去做到的功能。比如这里，我想对数据进行整点，也就是整分钟的这种采样的时候，如果这个分钟内，比如说 12:01 分，这个分钟没有数据，那怎么办？我想要用离它最近的前一个点去做填充。

首先，既然是整点整分钟，那肯定是跟 GROUP BY TIME 相关的了。如果没有，再用前一个值填充，刚刚其实也提到过了，可能就用前值填充，FILL 的方式去做到。最后就是，我之前提到，如果前面一个值距离我当前这个值已经超过 3 分钟了，我就不需要了，我就认为这个点就是没有值的，你不需要再给我填充了。

那通过我刚刚提到的 GROUP BY TIME，确定一个时间范围，然后第二个参数去指定降采样的一个 1 分钟的时间点，然后再通过 FILL PREVIOUS 这样一个前值填充的方式，第二个参数去指定它填充的超时阈值，就能够达到这样一个效果。

最后得出来的结果，刚刚可以看到，上面是我们的原始数据结果，它只在 14:01:50、14:01:51、14:06:50 和 14:08:50 有数据，中间的 14:03 分、14:04 分、14:05 分，14:06 分这些，还包括 14:08 分、14:10 分的数据都是需要去填充的。只不过对于 14:05 分跟 14:06 分，这两行数据是因为超过了我们的填充阈值，我们没有对它进行填充。

第三点其实在工业里面也比较常见，就是我们每个机器去开启跟关闭的时长。这个跟我刚刚说的还不一样，我刚刚说的 GROUP BY SESSION，它可能对关闭的状态就不会去采集数据了，但有一些机器，它关闭的时候也要去采集它的数据。所以它有一个字段就是专门用来标识它的关闭或开启的状态的，就是这个 on 字段，那它想做什么查询呢？就是去查询每一次机器它开启和关闭的时长。

这里可以看到它虽然只有 0/1 值，但可以看到它每一次 0 的时候，连续的 0 的时间范围是多少，连续的 1 的时间范围是多少。那在关系型数据库里面，使用 GROUP BY ON 的话，它没有办法区分第一段跟第三段，因为都是 0，这两段会被放在一起。

在 IoTDB 里面，可能只需要用 GROUP BY VARIATION 就可以做到，因为 GROUP BY VARIATION 其实就是做这个的，它只要当前值跟上一个值不一样，那不一样是指多少呢？其实这里就是和 0 对比，默认就是 0。也就是说，你只要不一样，差值超过 0 了，我就认为你是下一个分组了。time_duration 就是一个我们的聚合函数，也是用来求这一段的最后一个值跟第一个值的时间戳的差值，也能够达到我们这个求时长的效果。

第四点是一个车联网场景里面比较常见的，它想要去查车的里程跳变的时刻。因为车的里程单位统计可能是用公里，开一段时间以后，里程就会一公里跳一下，那我们可能想要去筛选出来这些跳变的时刻，这就是里程跳变的含义。其实我们用肉眼去看的话，很容易找到这些里程跳变的时刻，比如图中框出的这些 5、6、7、8，框出的 5 是第一个里程值，所以我们也会把它选出来。

这种情况下关系 SQL 该如何写呢？因为最近 ChatGPT 比较火，我就去跟 ChatGPT 聊，我说你给我建一张关系表，这个关系表里面第一列是时间列，第二列是这个车列，即车的 ID，第三列是我刚刚说的 mileage，我跟它去描述了里程跳变的含义是什么，然后我让它给我去写一个 SQL。

该说不说，ChatGPT 还是很聪明的，它知道要用窗口函数去实现这样一个功能，比如说这边的 LAG 函数，就是去求当前行的上一行。因为关系数据库中是无序的，所以这个窗口函数想要有序，它需要在窗口函数的子句里面去指定排序键，也就是这边的 ORDER BY Time，它根据时间戳的排序是这样排的。

但是 ChatGPT 其实忽略了一个事情，它需要人去慢慢给它提示，所以我告诉它，我只需要查一辆车的值，查询的时候需要指定具体的 vinId，因为它前面其实是没有指定 vinId 的。然后它就给出了一个比较正确的查询，它在 where 子句里面指定了这个 vinId。

可以看到，用关系 SQL 写出来，可能还要用嵌套、子查询，包括 CTE 这些表达，这些写出来已经是比较长的语句了，对一个不熟悉窗口函数的人来讲，它可能还写不出来这样的方式。

而在 IoTDB 里面其实非常简单，就是用我刚刚提到的 DIFF 函数，只要 DIFF 不等于 0，就证明里程发生跳变了，然后用 where time 指定一个时间区间，就能够直接做到将里程跳变时刻的数据筛选出来了。

这里我还想举一个例子，就是发生里程跳变之后，我们想要知道一天内发生里程跳变的次数。对于关系型数据库，刚刚子查询的部分，需要再做一个 COUNT。

那在 IoTDB 里面其实也比较容易做到，它不需要用任何子查询也能做到，就是在我们的 COUNT 里面嵌套一个 CASE WHEN 的子句，只不过在 CASE WHEN 里面，我们指定了 DIFF 这样一个标量函数，只要 DIFF 不等于 0，输出结果就是 1，然后再把这些数起来就行了。

第五个典型的查询还是车联网场景的，需要去知道某台车哪些天发生了定位异常，那定位异常的含义是什么？就是我们定义 GPS 的经纬度坐标都连续为 0 的次数大于 10 的时候，它才算一次定位异常。这里的数据其实都没有定位异常。

那同样的，我们问问 ChatGPT，上面场景的关系 SQL 该怎么去写？我给它一个建模，它就给出来了这样的查询语句。当然它这个查询语句肯定是错的，因为它并没有考虑到任何连续性的含义，我告诉它要连续超过十天才能是异常。它把这个语句写在 HAVING 里面了，但它这个是不对的，所以它并没有体现我们要求的连续 10 次才算异常的这样一个语句。

我就再次告诉它需要这样去做，然后它就给出了另外一个更复杂的操作。但它这个操作其实是有它自己的思考的，我们可以看一下它是想怎么去做的。它想要去给每条数据一个标号，首先它列出的 num_1 ，就是对应代码这里的第三行，即 ROW_NUMBER 里面的第一个，被减数。它想去做的就是给每一行标一个顺序，这样一个从 1 到 8 的序号，然后它要根据每一个经纬度坐标做一个分组，每一个分组内去再做一个序号的标定，最后它想通过 num_1 减去 num_2 之后得到的这样一个 group 进行标定。

我一开始思考了一下，它为什么要去这么做，大家可以看到，这里很明显，我标黄的这个部分，其实它是一个连续为 0 的分组，2 减 1、3 减 2、4 减 3，得出来都是 1，所以 ChatGPT 想通过这样一种方式，找到这样连续的异常分组。

但是它忽略了一个事情。第一个是 where 的过滤是要优先于窗口函数执行的，所以在它做那个计算的时候，除了我标颜色的这些，其它的行都不会有，所以它从一开始就错了。那即使按照它的这个方法，我把 where 条件过滤，放到后面去做，它也是错的，因为大家可以看到最后一行，8 减 3 结果也是 5，但明显它跟前面标绿的不是一个分组。

所以有时候 ChatGPT 也不是特别可信，如果用它来替代程序员或者 DBA 做一些查询的话，大家目前也不用太担心被取代以致失业的问题。

其实真正去写关系 SQL 的话，可能写出来会非常长。我们会用一些窗口函数去定义，因为要检查 10 行，所以往前倒 10 个，写出来是非常非常长的。

在 IoTDB 中其实是比较简单的，这里就是用了 COUNT_IF 的功能，它主要就是在 COUNT_IF 里面去写。因为 COUNT_IF 就是做了这样一个事情，要数出来有多少个异常点，KEEP 连续大于等于 10 的时候，它才是定位异常点，并且要按天去做分组，去得到具体的日期，因为想知道的是哪一天的定位异常点。

第六个典型查询，想要找出所有的车的休眠时间的首末条数据，并计算出时间差。那什么是休眠呢？就是当 gw_nm 这个字段不是 1 或者 0 的时候，我们都认为这个车处于休眠状态。这边数据标红的就是休眠状态，它有这种不规则的 “-”，或者 null 值，都被我们认为是休眠状态，我们需要找出它的首末条数据，最后再计算出它的时间差。

我同样也去问了一下 ChatGPT，但是大家可以忽略 ChatGPT 做出来的这个结果，因为它已经混乱了，在这种比较复杂语义的情况下，它写出来的语句已经算是牛头不对马嘴了。

真正的关系型 SQL 写法我也给大家列了一下，写出来大概是这个样子，虽然没有刚刚的长，但它的思考过程可能比刚刚的要更复杂一点。大家可以看一下，在这里我就不跟大家展开介绍了，可以看到其实是比较复杂的，这边只是得到了一张 temp 表，从这张表中，我们要过滤出来它开始的那一行和结束的那一行，这是 temp_a 表。然后 temp_b 表里面还要对它进行分组，得到它的分组 id，最后再根据我们刚刚得到的 id，去做这张表的自 JOIN，把它的首行和末行拼在同一行之后，我们的关系数据库才能做这个时间差的计算。

所以这个关系 SQL 写出来非常长，我这里是 3 页 PPT，通过四张 temp 表才能够去写出来。

然而在 IoTDB 中依然比较简单，这得益于我们的 GROUP BY CONDITION 函数。使用 GROUP BY CONDITION， gw_nm 这个字段不在 0、1 里面，并且它超过 2 次，我们就认为它是一个休眠分组了。然后只需要取到首条数据、末条数据，用我们的 FIRST_VALUE、LAST_VALUE。最后计算休眠时长，就是最后的时间戳减去第一个时间戳，就能得到我们的休眠时长。

最后一个典型查询场景是要取出 60 秒以上的连续信号的第一条和最后一条数据，那这个连续信号怎么定义呢？就是我们的时间戳排序之后，一台车的前后两条数据的时间差不能够超过 24 秒，其实刚刚讲 GROUP BY SESSION 的时候可能跟大家提过了，这就是用 IoTDB 里面的 GROUP BY SESSION 去做的一个查询。

在 IoTDB 里面很简单，但是在关系型数据库里面，可能它也会比较复杂。当然这里 ChatGPT 写出来还是错的，但是我也没有去费时间给大家把这个关系 SQL 写出来了。

给大家展示一下在 IoTDB 中写出来的，会比较简单，同样的，FIRST_VALUE、LAST_VALUE 来取首末条数据，然后连续信号的时间跨度，使用 GROUP BY SESSION，即刚刚提到的连续信号的分组。并且我们需要持续时间超过 60 秒以上，可以通过 HAVING 的子句去做到。

OK，那我今天的演讲就到这里了，谢谢。

可加欧欧获取大会相关PPT

微信号：apache_iotdb

你可能感兴趣的:(iotdb,科技)

低空经济：未来五年投资风口的新蓝海 IT程序媛-桃子低空经济科技区块链低空经济 ai
随着全球科技的迅猛发展，低空经济逐渐从一个概念走向了实际应用，成为新时代下的重要经济增长点。2024年被行业普遍称为“低空经济元年”，低空经济产业正在迎来前所未有的发展机遇。根据《低空经济产业发展白皮书》以及多个顶层政策的发布，低空经济已经正式被列入国家战略新兴产业，并且预计在未来五年将迎来万亿级市场的爆发式增长。那么，哪些领域将成为未来五年低空经济投资的热点呢？本文将从政策支持、产业链布局、资本
DeepSeek 提示词：常见指令类型伏羲栈人工智能 deepseek提示词人工智能
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
用大白话解释数据库分库分表sharding是什么有什么用怎么用心心祥蓉数据库
Sharding是什么？Sharding（分片）就像把一整个图书馆的书拆开放到多个小房间，每个房间只存一部分书。这样找书的人不用挤在一个大厅里翻找，效率更高。技术定义：把一个大数据库拆分成多个小数据库（分片），分散到不同服务器上，解决单台服务器性能不足的问题。比如原本一个数据库存10亿条用户数据，拆成10个库，每个存1亿条。场景类比：图书馆分房间：按书的类型（科技、文学）或首字母分房间。电商分订单
2024年云计算的发展趋势如何？网络安全我来了 IT技术云计算
2024年云计算的发展趋势在这个瞬息万变的科技时代，你是否也曾想过，云计算的发展究竟对我们每一个人意味着什么？它不仅是存储和计算能力的提升，更是整个行业的未来构建与转型之道。接下来，我们将一起探索2024年云计算的发展趋势，借此揭示其中的奥秘和前景。云计算的技术进步计算能力的提升在过去的几年里，计算机技术的飞速发展让我们见证了什么叫“飞跃”——特别是在处理器领域。想象一下，你的电脑如同一个超人，拥
云计算如何助力金融科技企业实现高效运营易通慧谷互联金融云计算金融科技
一、引言随着信息技术的飞速发展，云计算作为一种新兴的计算模式，正在逐渐改变着传统金融行业的运营模式。金融科技企业作为金融行业的重要组成部分，面临着日益增长的业务需求和技术挑战。在这一背景下，云计算凭借其弹性扩展、高可用性、低成本等优势，成为金融科技企业实现高效运营的重要工具。本文将从云计算的定义、特点出发，探讨云计算如何助力金融科技企业实现高效运营，并分析其面临的挑战和未来发展趋势。二、云计算概述
《Python代码实战！基于鸿蒙系统开发智慧农业病虫害AI识别系统》 python
在科技赋能传统产业的大趋势下，智慧农业成为农业领域发展的新方向。病虫害识别是智慧农业的关键环节，借助AI技术实现精准的病虫害类目标签，能有效提升农作物的防护水平，降低损失。本文将详细介绍如何基于HarmonyOSNEXTAPI12及以上版本，使用Python开发用于智慧农业病虫害识别的AI类目标签功能，为开发者提供从理论到实践的全面指导。一、开发背景与技术原理在农业生产中，病虫害种类繁多，准确识别
华为鸿蒙2025,转载：华为鸿蒙，一个本属于2025年的产品激光不是红外线华为鸿蒙2025
华为鸿蒙，一个本属于2025年的产品原创老局长星海情报局昨天昨天，2020年9月16日，可能在很多人眼中是新中国科技史上“最为耻辱”的一天——美国针对华为的禁令正式生效，华为迎来了“断供时代”的第一个清晨。再往前几天，在东莞的松山湖，华为在“全球开发者大会”上高调地发布了“鸿蒙OS2.0”操作系统。在美国人收紧绞索的前一刻仍然能够淡然自若地发布新产品，明明是一个处在包围圈中的企业却表现得像是一个胜
图神经网络实战（9）——GraphSAGE详解与实现盼小辉丶图神经网络从入门到项目实战图神经网络 GNN pytorch
图神经网络实战（9）——GraphSAGE详解与实现0.前言1.GraphSAGE原理1.1邻居采样1.2聚合2.构建GraphSAGE模型执行节点分类2.1数据集分析2.2构建GraphSAGE模型3.PinSAGE小结系列链接0.前言GraphSAGE是专为处理大规模图而设计的图神经网络(GraphNeuralNetworks,GNN)架构。在科技行业，可扩展性是推动系统增长的关键驱动力。因此
三七互娱，蓝禾，顺丰，oppo，游卡，汤臣倍健，康冠科技，作业帮，高途教育25届春招内推 weixin_53585422 java 算法游戏美术嵌入式硬件求职招聘
三七互娱，蓝禾，顺丰，oppo，游卡，汤臣倍健，康冠科技，作业帮，高途教育25届春招内推①康冠科技【职位】算法、软件、硬件、技术，结构设计，供应链，产品，职能，商务【一键内推】https://sourl.cn/2Mm9Lk【内推码】EVBM88②蓝禾（秋招投过还可投）【岗位】国内/国际电商运营，设计，营销，职能，工作地：深圳【请选择“校园大使推荐码”】71T3HES【一键内推】https://so
AI赋能智能家居，CES Asia 2025论坛深度探讨行业未来赛逸展张胜人工智能科技
在科技飞速发展的当下，人工智能（AI）正以惊人的速度渗透到各个领域，智能家居便是其中备受瞩目的应用场景之一。2025年，第七届亚洲消费电子技术贸易展（CESAsia2025）以“科技重塑生活，创新定义未来”为主题盛大举行，同期举办的“AI赋能未来：从技术创新到商业落地”论坛，聚焦AI在智能家居领域的应用与发展，吸引了众多企业的高度关注。AI重塑智能家居新生态随着人们对生活品质的追求不断提高，智能家
苹果折叠屏iPhone突破折痕难题或将在2026年发布北京自在科技 iphone ios findmy 库克折叠屏
（2025年2月26日）据供应链最新消息，苹果联合三星与美国安费诺公司，在折叠屏核心技术上取得重大突破，首款折叠屏iPhone样品已接近理想水平，最快将于2026年底上市。屏幕采用三星供应的内折OLED柔性屏，搭配蓝思科技研发的UTG超薄玻璃（厚度仅30微米），通过中央减薄技术实现10万次折叠无破损。安费诺提供新型铰链结构，结合苹果自研的"指状物+月牙槽"专利设计，使折痕几乎不可见，折叠厚度控制在
科技快讯 | DeepSeek宣布开源DeepGEMM；多个团队开发AI论文反识别技术；OpenAI GPT 4.5现身Android测试版，即将发布最新科技快讯科技
DeepSeek宣布开源DeepGEMM财联社2月26日电，Deepseek于开源周第三天宣布开源DeepGEMM。DeepGEMM是一个专为简洁高效的FP8通用矩阵乘法（GEMM）设计的库，具有细粒度缩放功能，如DeepSeek-V3中所提出。它支持普通和混合专家（MoE）分组的GEMM。该库采用CUDA编写，在安装过程中无需编译，通过使用轻量级的即时编译（JIT）模块在运行时编译所有内核。FP
量子位招聘 | DeepSeek帮我们改的招聘启事量子位
关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具；拥有解读论文的能力，能深入浅出讲解原理；有写代码能力；量子位长期读者。加入我们，你可以获得：
机器视觉线阵相机分时频闪选型/机器视觉线阵相机分时频闪选型视觉人机器视觉杂说数码相机计算机视觉人工智能
在机器视觉系统中，线阵相机的分时频闪技术通过单次扫描切换不同光源或亮度，实现在一幅图像中捕捉多角度光照效果，从而提升缺陷检测效率并降低成本。以下是分时频闪线阵相机的选型要点及关键考量因素：一、分时频闪技术的核心需求多光源同步控制分时频闪需相机支持多路光源独立控制，每行图像采集时切换光源类型（如明场、暗场、侧光等）或亮度。例如：苏州大视通智能科技CL-L8KM-R1-100KT相机提供8路光源控制信
【Golang】Go语言Web开发之模板渲染景天科技苑 Go语言开发零基础到高阶实战 golang 前端开发语言 Go语言模板渲染模板渲染 golang模板渲染
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，Golang开发，PyQt5和Tkinter桌面开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flas
Springboot 整合 Java DL4J 实现企业门禁人脸识别系统伏羲栈人工智能深度学习 Java DL4J -深度学习实战 spring boot java Deeplearning4j deep learning 人工智能深度学习 spring
博主简介：历代文学网（PC端可以访问：https://literature.sinhy.com/#/literature?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于
2008-2020年各省国内发明专利申请授权量数据 2501_90487648 数据 #省份数据库
2008-2020年各省国内发明专利申请授权量数据1、时间：2008-2020年2、来源：国家统计局、统计年鉴3、指标：行政区划代码、地区、年份、国内发明专利申请授权量(项)4、范围：31省5、指标解释：国内发明专利申请授权量是指在一个特定时期内，国内机构或个人提交的发明专利申请中，经过国家知识产权局审查并被授权的专利数量。它是衡量一个国家科技创新能力、技术成果转化水平以及知识产权保护力度的重要指
Arduino OLED 动画全攻略：UNO、u8g2、Adafruit GFX、SSD1306 教程星际编程喵 Python探索之旅 python 单片机开发语言嵌入式硬件硬件工程
前言在这个电子化的时代，Arduino让每个人都能变身为创意十足的科技达人。而OLED显示屏，作为小巧却极具表现力的工具，成了我们展示创意的舞台！通过它，我们可以轻松实现炫酷的图形与动画效果，简直让人忍不住想要一展身手。本文将详细介绍如何使用Arduino与OLED屏幕结合，打造动感十足的显示效果。通过分步讲解，我们不仅带你走进OLED的世界，还会用幽默的故事和实用的技巧让你更好理解每一个步骤。无
CES Asia 2025聚焦可持续发展，绿色科技成亮点赛逸展张胜科技
随着全球对气候变化的关注度不断攀升，可持续发展已成为科技行业的重要使命。将在首都北京举办的CESAsia2025第七届亚洲消费电子技术贸易展（赛逸展），将目光聚焦于可持续发展与绿色科技领域，为企业提供展示创新成果、交流前沿技术的平台，有望引领科技行业绿色发展新潮流。在数据中心节能减排技术方面，众多企业积极探索创新，取得了显著进展。数据中心作为数字经济的核心基础设施，规模持续扩大，但其能耗问题也日益
CES Asia 2025：电子行业前沿展望与盛会契机赛逸展张胜大数据科技人工智能百度
在全球科技浪潮汹涌澎湃之际，2025年电子行业的消费电子、半导体和人工智能三大关键领域备受瞩目，其发展走向不仅关乎行业兴衰，更蕴含着无数投资机遇，而即将到来的CESAsia2025则成为聚焦这些热点的重要舞台。消费电子领域，中国经济复苏带动内需升温，与产品生命周期形成良性互动。苹果公司在AI领域的战略布局，如2024年WWDC大会推出的AppleIntelligence，使中国电子产业链在其供应链
新一代信息技术：从技术范畴到未来趋势的全景洞察漫谈网络 IT前沿视界科普网络
新一代信息技术（NewGenerationInformationTechnology）是当前全球科技革命和产业变革的核心驱动力之一，也是各国政策文件中重点支持的战略性技术领域。它并非单一技术，而是一系列前沿信息技术的融合与集成，旨在推动数字化转型、智能化升级和经济社会高质量发展。以下是其核心构成和特点：核心技术范畴5G/6G通信技术高速率、低时延、大连接的新一代移动通信网络，为物联网、工业互联网等
AI写代码新姿势：一个截图，代替千行代码量子位
原创关注前沿科技量子位现在写代码，最fashion的“姿势”应该是什么？答案或许就是：截图。没错，就像这样，先随便找个网页，截取想要的那部分界面，然后“喂”给AI，并附上一句Prompt：参考这个页面，生成一个类似的HTML页面。只是一张图和一句话，AI就“唰唰唰”的把代码给写出来了。有了这个功能，前端程序员搞简单的页面代码可就方便太多了（甚至编程小白都可以尝试做网页）~而且这个AI啊，还不是国外
3月1日（信息差） eqwaak0 信息差人工智能开发语言学习 python 开源软件
第一章信息差的技术本质：从数据流动到认知断层1.1全球科技信息链的拓扑结构在数字地球的神经系统里，信息差已演变为多层级复杂网络的结构性矛盾。通过测绘全球科技数据流动图谱可见：graphLRA[实验室原始数据]-->B[企业研发数据库]B-->C[政府监管平台]C-->D[证券交易所]D-->E[媒体传播网络]E-->F[公众认知池]F-->G[市场行为反馈]每个节点的信息过滤效率差异导致认知断层：
Android 开发使用 AI 提升效率 jiet_h AI android 人工智能
引言在当今快速发展的科技领域，人工智能（AI）正逐步渗透到各个行业。对于Android开发者而言，如何利用AI技术提升开发效率，已成为一个值得探讨的话题。本文将深入探讨如何在Android开发中有效地应用AI技术，以提高工作效率和代码质量。AI在Android开发中的应用场景1.代码自动补全与生成AI驱动的代码补全工具可以根据上下文，智能地预测并补全代码，减少手动输入，提高编码速度。例如，使用Co
嵌入式的应用领域、现状及未来趋势 Lemon__L 嵌入式嵌入式现状/趋势
嵌入式的应用领域、现状及未来趋势随着科技进步，嵌入式的出现，以及人们对生活质量，产品的智能化，成本的要求等，以及国家对与物联网、电子、科技的扶持，大量的电子产品都促使嵌入式的快速发展。使用嵌入式的产品如我们常用的手机、平板电脑、电子字典、可视电话、数字相机(DC)、数字摄像机(DV)、U-Disk、机顶盒(SetTopBox)、高清电视(HDTV)、游戏机、智能玩具、交换机、路由器、数控设备或仪表
嵌入式迷雾：现状谜团待解，未来行情走向何方？羑悻的小杀马特. c++嵌入式
嵌入式系统如同科技领域中一颗隐匿却璀璨的星辰，它悄无声息地融入我们生活的方方面面。从日常使用的智能手机、智能手表，到工业领域的自动化生产线、航空航天的飞行器控制系统，嵌入式系统无处不在。然而，尽管其应用广泛，但嵌入式领域目前却笼罩着一层迷雾，现状中的诸多谜团亟待解开，而其未来行情的走向更是备受关注。目录一·嵌入式系统概述：1·1嵌入式系统的定义：1.2嵌入式系统的特点：1.3嵌入式系统的应用领域：
苹果iPhone 17系列手机最新爆料，涉及五大方面更新 AntDreamer iOS iphone ios swift 智能手机
本文首发于公众号“AntDream”，欢迎微信搜索“AntDream”或扫描文章底部二维码关注，和我一起每天进步一点点iPhone17系列：科技革新与未来展望随着科技的不断进步，智能手机市场的竞争愈发激烈。苹果公司作为行业的领军者，每年推出的新款iPhone总能引发全球消费者的广泛关注。2024年7月，关于即将到来的iPhone17系列的新闻和传闻不断涌现，吸引了众多目光。以下是对这些信息的总结，
2月27日全球科技信息差：技术浪潮下的信息博弈与应对策略 eqwaak0 信息差开发语言人工智能开源软件科技
第一章信息差的定义与科技行业的特殊性**信息差（InformationAsymmetry）是经济学中的核心概念，指交易双方因信息获取能力或时效性差异导致的不平等博弈。在科技领域，这种不对称性尤为显著，原因在于：技术迭代速度快：例如量子计算、人工智能模型（如DeepSeekR2）的研发进展往往由少数企业或机构主导，公众与普通投资者难以实时掌握动态。行业专业壁垒高：生物技术（如CRISPR基因编辑）和
销售易NeoCRM与八骏科技CRM：全方位深度对比刘小奇�多 sass
在当今竞争激烈的CRM市场中，销售易NeoCRM和八骏科技CRM作为国内知名的CRM解决方案，各自拥有独特的优势和特点。本文将从功能、用户体验、价格、市场评价以及适用场景等方面对这两款CRM系统进行对比总结和盘点。一、功能对比销售易NeoCRM：销售管理：提供从线索获取、商机管理到订单成交的完整销售漏斗管理，实现销售过程的标准化管理。客户管理：提供全方位的客户画像功能，记录和追踪客户的所有互动历史
飞鱼科技游戏策划岗内推飞300 游戏策划业界资讯游戏 ue5
协助策划完成相关工作，包括但不仅限于策划配置，资料搜集，游戏体验；游戏策划相关作品；游戏大赛经历；游戏demo制作经历；游戏公司策划岗位实习经历优先内推码DSZP7YFU
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key