Quant_Learner

DolphinDB基础概念理解：流数据处理框架

专业术语解释实时流处理

实时流处理是指将业务系统产生的持续增长的动态数据进行实时的收集、清洗、统计、入库，并对结果进行实时的展示。在金融交易、物联网、互联网/移动互联网等应用场景中，复杂的业务需求对大数据处理的实时性提出了极高的要求。面向静态数据表的传统计算引擎无法胜任流数据领域的分析和计算任务。
DolphinDB的流数据框架

DolphinDB内置的流数据框架支持流数据的发布、订阅、预处理、实时内存计算、复杂指标的滚动窗口计算等，是一个运行高效，使用便捷的流数据处理框架。
- 吞吐量大，低延迟；
- 与时序数据库及数据仓库集成，一站式解决方案；
- 天然具备流表对偶性，支持使用SQL语句进行数据注入和查询分析；
- 内置时间序列及横截面聚合引擎；
- 高频交易数据回放；
- 流数据过滤；
当前我也只是字面理解，后续清楚之后再用白话补充
流数据处理框架及概念准备

DolphinDB流数据模块采用发布-订阅-消费的模式。流数据首先注入流数据表中，通过流数据表来发布数据，数据节点或者第三方的应用可以通过DolphinDB脚本或API来订阅及消费**流数据。
流数据表

流数据表是用以存储流数据、支持同时读写的一种内存表。

发布一条消息等价于向流数据表插入一条记录。可使用SQL语句对流数据表进行查询和分析。
发布和订阅

采用经典的订阅发布模式。每当有新的流数据写入时，发布方会通知所有的订阅方处理新的流数据。数据节点使用subscribeTable函数来订阅流数据。
实时聚合引擎

实时聚合引擎指的是专门用于处理流数据实时计算和分析的模块。DolphinDB提供createTimeSeriesAggregator与createCrossSectionalAggregator 函数创建聚合引擎对流数据做实时聚合计算，并且将计算结果持续输出到指定的数据表中。

关于如何使用聚合引擎请参考流数据聚合引擎。
配置以开启流数据功能

配置发布节点

maxPubConnections：发布信息节点最多可连接几个节点。若maxPubConnections>0，则该节点可作为发布节点。默认值为0。
persistenceDir：保存共享的流数据表的文件夹路径。若需要保存流数据表，必须指定该参数。
persistenceWorkerNum：负责以异步模式保存流数据表的工作线程数。默认值为0。
maxPersistenceQueueDepth：以异步模式保存流数据表时消息队列的最大深度（记录数）。默认值为10,000,000。
maxMsgNumPerBlock：发布消息时，每个消息块中最多可容纳多少条记录。默认值为1024。
maxPubQueueDepthPerSite：发布节点消息队列的最大深度（记录数）。默认值为10,000,000。

配置订阅节点

subPort：订阅线程监听的端口号。当节点作为订阅节点时，该参数必须指定。默认值为0。
subExecutors：订阅节点中消息处理线程的数量。默认值为0，表示解析消息线程也处理消息。
maxSubConnections：服务器能够接收的最大的订阅连接数。默认值是64。
subExecutorPooling: 表示执行流计算的线程是否处于pooling模式的布尔值。默认值是false。
maxSubQueueDepth：订阅节点消息队列的最大深度（记录数）。默认值为10,000,000。

流数据发布

向流数据表（streamTable函数创建）写入数据，即意味着发布数据。

streamTable只是创建流数据表，并不是创建发布表，向

将流数据表共享（通过share命令），因为流数据表需要被不同会话访问，不被共享的流数据表无法发布数据。
```
# 定义并共享流数据表
share streamTable(10000:0, `timestamp`temperature, [TIMESTAMP, DOUBLE]) as pubTable
```

流数据订阅

订阅数据（通过subscribeTable函数实现）

subscribeTable([server], tableName, [actionName], [offset=-1], handler, [msgAsTable=false], [batchSize=0], [throttle=1], [hash=-1], [reconnect=false], [filter], [persistOffset=false])

只有tableName和handler两个参数是必须的，其他均为可选参数

subscribeTable函数的返回值是订阅主题，它是订阅表所在节点的别名、流数据表名称和订阅任务名称（如果指定了actionName）的组合，使用"/"分隔。如果订阅主题已经存在，函数将会抛出异常。

>> share streamTable(10000:0,`ts`temp, [TIMESTAMP,DOUBLE]) as subTable
>> topic1 = subscribeTable(, "pubTable", "actionName_realtimeAnalytics", 0, subTable, true)
>> topic1

NODE1/pubTable/actionName_realtimeAnalytics

参数	意义	备注
[server]	空或空字符串：发布节点在本地；服务器的别名：发布节点是同一集群的其他节点；远程连接handle：发布节点不在订阅节点所在集群。
`tableName`	被订阅的流数据表名
[actionName]	用于区分同一个流数据表被订阅用于不同场景的情况	流数据可以针对各种场景分别订阅消费。同一份流数据，可用于实时聚合运算，同时亦可将其存储到数据仓库供第三方应用做批处理。
[offset]	订阅任务开始后的第一条消息所在的位置; 消息：流数据表中的行	如果没有指定，或者为-1(默认)，或者超过了流数据表的记录行数，订阅将会从流数据表的当前行开始；如果-2，系统会自动获取持久化到磁盘上的offset，并从该位置开始订阅； offset的值永远与流数据表创建时的第一行对应，如果某些行因为内存限制被删除，在决定订阅开始的位置时，这些行仍然考虑在内。
`handler`	用于处理订阅数据，是一元函数或表。	若是函数：其唯一的参数是订阅到的数据；若是数据表：订阅数据直接插入到该表中；
[msgAsTable]	表示订阅的数据是否为表的布尔值	false（默认）：表示订阅数据是由列组成的元组； true：表示订阅数据是表
[batchSize]	表示出发批处理的消息的行数，是一个整数。用于数据缓冲，当流数据的写入频率非常高，以致数据消费能力跟不上数据进入的速度时，需要进行流量控制。否者订阅端缓冲区很快会堆积数据并耗光内存。可以根据订阅端的消费速度设定throttle参数，定时将数据导入订阅段，保障订阅端的缓冲区数据量稳定。	正数：直到消息的数量达到batchSize时，handler才会开始处理消息；没有指定或非正数：只要有一条消息进入，handler就会马上开始处理消息。
[throttle]	表示handler处理进来的消息之前等待的时间，是一个整数	以秒为单位，默认1。如果没有指定batchSize，则throttle将不会起作用。
[hash]	指定某个订阅线程处理进来的消息，是一个非负整数	如果没有指定该参数，系统会自动分配一个线程；当需要在两个或多个订阅的处理过程中保持消息数据的同步，可以将多个订阅的hash值设置成相同，这样就能使用同一个线程来同步处理多个数据源，不会出现数据处理有先后导致结果误差
[reconnect]	布尔值	false(默认)：如果网络异常等导致订阅中断，订阅端不会自动重新订阅； true：订阅端会在网络正常时，自动从终端位置重新订阅。如果是发不断崩溃导致订阅中断，那么订阅端会在发不断重启后不断尝试重新订阅。若发布端对流数据表启用了持久化，那么发布端重启后会首先读取硬盘上的数据，直到发布端读取到订阅中断位置的数据，订阅端才能成功重新订阅。若发布端没有对流数据表启用持久化，那么将重新订阅失败。如果订阅端崩溃导致订阅中断，即使设置了reconnect=true，订阅端重启后也无法自动重新订阅。
[filter]	过滤数据（不支持BOOL类型数据），是一个向量	该参数需要配合`setStreamTableFilterColumn`函数一起使用。使用`setStreamTableFilterColumn`指定流数据表的过滤列，流数据表过滤列在filter中的数据才会发布到订阅端，不在filter中的数据不会发布。
[persistOffset]	表示是否持久化保存本次订阅已经处理的数据的偏移量，是一个布尔值	false(默认)。持久化保存的偏移量用于重订阅，可通过`getTopicProcessedOffset`函数获取。

注释：

handler中订阅到的数据：可以是一个数据表或元组；订阅数据表的每一列是元组的一个元素。
offset中持久化到磁盘：关于持久化，参见下文；
offset中当前行：指插入数据后，最新的一行，也就是从这里开始接受新数据。即只有当新数据进入发布表时才能订阅到数据；
相关代码在执行之前，需要先对streaming功能进行配置，才能启用streaming；
share函数创建共享表，与subscribe创建订阅表需要分开、顺序执行，同时执行会出错；

发布者与订阅者所在节点关系的三种可能

发布者与订阅者是同一节点

# 参数server使用空字符串或者为空
subscribeTable(, 'pubTable', 'actionName', 0, subTable, true)

发布者与订阅者是同一集群内的不同节点

# 参数server使用发布节点别名
subscribeTable('NODE2', 'pubTable', 'actionName', 0, subTable, true)

发布者与订阅者不再同一个集群内

# 参数server使用发布节点的远程连接handle
pubNodeHandler=xdb("192.168.1.13",8891)
subscribeTable(pubNodeHandler, "pubTable", "actionName", 0, subTable, true)

断线重连

DolphinDB的流数据订阅提供了自动重连的功能。如果要启用自动重连，发布端必须对流数据持久化。

当reconnect参数设为true时，订阅端会记录流数据的offset，连接中断时订阅端会从offset开始重新订阅。

如果订阅端崩溃或者发布端没有对流数据持久化，订阅端无法自动重连。
发布端数据过滤

发布端可以过滤数据，只发布符合条件的数据。使用setStreamTableFilterColumn指定流数据表的过滤列，过滤列的值在filter指定值中的数据会发布到订阅端，不在filter指定值中的数据不会发布。目前仅支持对一个列进行过滤。
取消订阅

每一次订阅都由一个订阅主题topic作为唯一标识。

如果订阅时topic已存在，那么会订阅失败。这时需要通过unsubscribeTable命令取消订阅才能再次订阅。取消订阅示例如下：
1. 取消订阅一个本地表
```
unsubscribeTable(,"trades", "actionName1")
```
2. 取消订阅一个远程表
```
unsubscribeTable("NODE_1","pubTable","actionName1")
```
3. 删除共享的流数据表
```
# 使用undef之前，需要先取消订阅
undef("pubStreamTable", SHARED)
```
流数据持久化

默认情况下，流数据表把所有数据保存在内存中。基于以下三点考量，可将流数据持久化到磁盘：
1. 避免内存不足；
2. 流数据的备份和恢复，当节点出现异常重启时，持久化的数据会在重启时自动载入到流数据表；
3. 持久化的一个重要目的是可以从任意位置开始重新订阅数据；
我们可事先设定一个界限值。若流数据表的行数达到设定的界限值，前面一半的记录行会从内存转移到磁盘。持久化的数据支持重订阅，当订阅指定数据下标时，下标的计算包含持久化的数据。

要启动流数据持久化，首先要在发布节点的配置文件中添加持久化路径：

persisitenceDir = /data/streamCache
enableTablePersistence持久化流数据

在脚本中执行enableTablePersistence命令设置针对某一个流数据表启用持久化。下面的示例针对pubTable表启用持久化，其中asyn = true, compress = true, cacheSize=1000000，即当流数据表达到100万行数据时启用持久化，将其中50%的数据采用异步方式压缩保存到磁盘。
```
enableTablePersistence(pubTable, true, true, 1000000)
```
若执行enableTablePersistence时，磁盘上已经存在pubTable表的持久化数据，那么系统会加载最新的cacheSize=1000000行记录到内存中。

对于持久化是否启用异步，需要在持久化数据一致性和性能之间作权衡。当流数据的一致性要求极高时，可以使用同步方式，这样可以保证持久化完成以后，数据才会进入发布队列；若对实时性要求极高，不希望磁盘IO影响到流数据的实时性，那么可以启用异步方式。只有启用异步方式时，持久化工作线程数persistenceWorkerNum配置项才会起作用。当有多个发布表需要持久化，增加persistenceWorkerNum的配置值可以提升异步保存的效率。
clearTablePersistence删除持久化数据

当不需要保存在磁盘上的流数据时，通过clearTablePersistence命令可以删除持久化数据：
```
clearTablePersistence(pubTable)
```
disableTablePersistence关闭持久化
```
disableTablePersistence(pubTable)
```

getPersistenceMeta获取流数据表的持久化细节情况

getPersistenceMeta(pubTable)

输出结果是一个字典：

//内存中的数据记录数
sizeInMemory->0
//启用异步持久化
asynWrite->true
//流数据表总记录数
totalSize->0
//启用压缩存储
compress->true
//当前内存中数据相对总记录数的偏移量，在持久化运行过程中遵循公式 memoryOffset = totalSize - sizeInMemory
memoryOffset->0
//已经持久化到磁盘的数据记录数
sizeOnDisk->0
//日志文件的保留时间，默认值是1440分钟，即一天。
retentionMinutes->1440
//持久化路径
persistenceDir->/hdd/persistencePath/pubTable
//hashValue是对本表做持久化的工作线程标识。
hashValue->0
//磁盘上第一条数据相对总记录数的偏移量。例如，若diskOffset=10000，表示目前磁盘上的持久化流数据从第10000条记录开始。
diskOffset->0

数据回放

replay函数，实现历史数据按照时间顺序“实时”导入流数据表中。

这也是对量化回测价值最大的地方。
流数据API

流数据的消费者可能是：
1. DolphinDB本身的聚合引擎；
2. 第三方的消息队列；
3. 第三方程序。
DolphinDB提供了streaming API供第三方程序来订阅流数据。当有新数据进入时，API的订阅者能够及时的接收到通知，这使得DolphinDB的流数据框架可与第三方的应用进行深入的整合。
Java API

Java API处理流数据的方式有两种：轮询方式(Polling)和事件方式(EventHandler)。
C++ API

C++ API处理流数据的方式有三种：ThreadedClient, ThreadPooledClient和PollingClient。
C# API

当流数据到达客户端时，C# API有两种处理数据的方式：
1. 客户端应用定期检查是否有新数据，当客户端发现有新数据，会获取并消费流数据。
2. 通过预先定义的MessageHandler直接消费新数据。
Python API

《 DolphinDB使用案例16：Python实现流数据订阅》
状态监控

当通过订阅方式对流数据进行实时处理时，所有的计算都在后台进行，用户无法直观的看到运行的情况。DolphinDB提供getStreamingStat函数，可以全方位监控流数据处理过程。该函数返回的是一个dictionary，包含pubConns, subConns, persistWorkers, subWorkers四个表。

pubConns表

pubConns表监控本地发布节点和它的所有订阅节点之间的连接状态。每一行表示本地发布节点的一个订阅节点。它包含以下列：

列名称	说明
client	订阅节点的IP和端口信息
queueDepthLimit	发布节点消息队列允许的最大深度（消息数）。每个发布节点只有一个发布消息队列。
queueDepth	发布节点消息队列深度（消息数）
tables	该节点上的所有共享的流数据表。若多表，彼此通过逗号分隔。

# GUI界面中运行
getStreamingStat().pubConns

subConns表

subConns表监控本地订阅节点与其订阅的发布节点之间的连接状态。每个订阅的发布节点为表中一行。

列名称	说明
publisher	发布节点别名
cumMsgCount	累计接收消息数
cumMsgLatency	累计接收消息的平均延迟时间(毫秒)。延迟时间指的是消息从进入发布队列到进入订阅队列的耗时。
lastMsgLatency	最后一次接收数据延迟时间(毫秒)
lastUpdate	最后一次接收数据时刻

# GUI界面中运行
getStreamingStat().subConns

persistWorkers表

persistWorkers表监控流数据表持久化工作线程，每个工作线程为一行。

列名称	说明
workerId	工作线程编号
queueDepthLimit	持久化消息队列深度限制
queueDepth	持久化消息队列深度
tables	持久化表名。若多表，彼此通过逗号分隔。

只有持久化启用后，才能通过getStreamingStat获取persistWorkers表。这张表的记录数等于persistenceWorkerNum配置值。

subWorkers表

subWorkers表监控流数据订阅工作线程，每条记录代表一个订阅工作线程。

列名称	说明
workerId	工作线程编号
queueDepthLimit	订阅消息队列最大限制
queueDepth	订阅消息队列深度
processedMsgCount	handler已处理的消息数量
failedMsgCount	handler处理异常的消息数量
lastErrMsg	上次handler处理异常的信息
topics	已订阅主题。若多个，彼此通过逗号分隔。

配置项subExecutors与subExecutorPooling这两个配置项的对流数据处理的影响，在这张表上可以得到充分的展现。

# 在GUI界面中运行
getStreamingStat().subWorkers

pubTable表

pubTables表监控流数据表被订阅情况，每条记录代表流数据表一个订阅连接。

列名称	说明
tableName	发布表名称
subscriber	订阅方的host和port
msgOffset	订阅线程当前订阅消息的offset
actions	订阅的action。若有多个action，此处用逗号分割

# 在GUI界面中运行
getStreamingStat().pubTables

性能调优与可视化

这部分作为高阶，后续再说。

你可能感兴趣的:(TSDB,DolphinDB,KDB+)

【golang】量化开发学习（一）幺零九零零量化开发语言 go
均值回归策略简介均值回归（MeanReversion）假设价格会围绕均值波动，当价格偏离均值一定程度后，会回归到均值。基本逻辑：计算一段时间内的移动均值（如20天均线）。当当前价格高于均值一定比例，做空；当低于均值一定比例，做多。持仓等待价格回归后平仓。官网下载DOLGPHINDB总结✅Docker运行DolphinDB✅创建模拟股票数据表✅Golang连接DolphinDB进行查询这样，Gola
【云平台监控】Prometheus 监控平台部署与应用 Karoku066 prometheus 容器 kubernetes docker 运维云原生
文章目录Prometheus监控系统概述TSDB存储引擎特点核心特点生态组件工作流程局限性部署Prometheus1.PrometheusServer部署2.部署Exporters3.部署Grafana4.服务发现Kubernetes集群部署Prometheus和Grafana全流程指南1.环境准备2.部署NodeExporter功能：采集节点资源指标（CPU、内存、磁盘等）步骤：3.部署Prom
Prometheus存储原理及数据备份还原 JohnnySongXY prometheus 网络运维 linux devops
prometheus将采集到的样本以时间序列的方式保存在内存（TSDB时序数据库）中，并定时保存到硬盘中。与zabbix不同，zabbix会保存所有的数据，而prometheus本地存储会保存15天，超过15天以上的数据将会被删除，若要永久存储数据，有两种方式：方式一：修改prometheus的配置参数“storage.tsdb.retention.time=10000d”；方式二：将数据引入存储
Nightingale滴滴夜莺监控系统入门（四）--聊聊夜莺的后端储存运维翁 Nightingale linux 运维服务器
Nightingale滴滴夜莺监控系统入门（四）—聊聊夜莺的后端储存1-默认版本默认是使用夜莺的两个组件来实现：TSDB+INDEXTSDB实际上使用的是老牌的图形数据库rrdtool，记录ts和value，有很多老牌的监控使用比如Cacti；INDEX是索引模块，夜莺把监控metric记录在这里，查询数据的时候是通过索引去查询；存储目录分别对应TSDB:/home/n9e/dataINDEX:/
TDengine和DolphinDB哪个更好，哈哈哈哈，闲来无聊分析了一下。(1) 2401_84023482 程序员 tdengine 大数据时序数据库
TDengine是专为时序数据设计的，针对的是物联网、工业互联网、IT运维场景。这些场景是不需要特殊的查询函数的，更关心的是写入速度、查询速度。而且这些场景下，也需要一些其他数据库不具备的功能，比如插值、时间聚合等等如果要问TDengine和DolphinDB最大的特色，存储引擎可能是TDengine最大的特色，性能也非常好；DolphinDB的最大特色毫无疑问是它的计算引擎。可以毫不夸张的说，D
大规模时序数据存储（三）| 核心功能设计 AIOPstack
作者简介运小尧百度高级研发工程师一、简介基本功能方面，我们的TSDB在数据的收集上提供了HTTP、Thrift等API；对查询，除了提供API之外还提供了命令行工具（CLITool），这些基本功能的设计在不同的TSDB中大同小异，因此本文不再赘述。由于数据规模庞大且出于业务数据隔离和定期清理的需要，我们设计了分库分表功能；为了提升历史数据存储和查询效率，同时节省存储成本，我们又设计了多级降采样功能
dolphinDB创建适合存放股票代码的分布式数据库呆萌的代Ma 数据库分布式数据库
这里我们使用基于哈希分区的数据库：my_db=database(db_path,HASH,[SYMBOL,10])这行代码指定基于哈希分区，同时哈希值使用10个长度，这样既可以存放一般的股票代码，也可以存放比如期权这种比较长的代码更多的分区表情况请参考：https://github.com/dolphindb/Tutorials_CN/blob/master/partitioned_in_memo
dolphinDB使用select筛选时间字段呆萌的代Ma 数据库 sql 数据库
在dolphinDB中，使用：timestamp(2020-01-01)得到的结果是：timestamp(1970.01.0100:00:02.018)，因为dolphinDB中日期格式是2020.01.01的写法，而2020-01-01会认为是2020-1-1=2018，因此在select中也是，比如：selecttop5*fromtablewheredt>timestamp(2020.01.0
prometheus监控系统 ʀᴇʟɪᴇʏ Go 1024程序员节云原生服务发现 golang prometheus
prometheus介绍Prometheus是一款时序（timeserier）数据库，但它的功能却并不止于TSDB，而是一款设计用于进行目标（Target）监控的关键组件；集合生态系统内的其他组件，例如pushGateway、Altermanager和Grafana等，可构成一个完整的IT监控系统。时序数据，是在一段时间内通过重复测量而获得的观察值的集合；将这些观测值绘制于图形之上，有一个数据轴和
Hbase 数据迁移运维那些事儿 hbase hbase hadoop 大数据
Hbase数据迁移可选方案对比l已验证方案操作说明：nExport&importu导出命令及示例hbaseorg.apache.hadoop.hbase.mapreduce.Export“表名”文件路径导出至本地文件系统：./bin/hbaseorg.apache.hadoop.hbase.mapreduce.Export‘default:tsdb-uid’file:///tmp/tsdb-uid
prometheus原理简介运维那些事儿 Prometheus 运维 java 开发语言
Prometheus一、Prometheus简介Prometheus是一款时序（timeseries）数据库，但它的功能却并非止步于TSDB，而是一款设计用于进行目标（Target）监控的关键组件；Prometheus是一个开源的系统监控和报警系统，现在已经加入到CNCF基金会，成为继k8s之后第二个在CNCF托管的项目，在kubernetes容器管理系统中，通常会搭配prometheus进行监控
使用grafana可视化opentsdb（基于docker） nnnnxcj
dockerrun-d-p4242:4242--nameopentsdbpetergrace/opentsdb-dockerdockerrun-d--name=grafana-tsdb--link=opentsdb:opentsdb-p3000:3000grafana/grafana启动之后http://localhost:4242opentsdb界面http://localhost:3000gr
数据导入时，最容易忽略的10个细节 DolphinDB智臾科技 DolphinDB与大数据数据导入数据处理数据分析数据库时序数据库
数据导入是使用DolphinDB的重要一环。无论是从磁盘文件（如csv文件、txt文件等）导入数据，还是使用插件从其他来源导入，如果忽略了一些操作细节，会导致导入失败或导入结果不符合预期。本文将介绍使用DolphinDB进行数据导入时，最容易忽略的10个细节，涉及了数据格式、数据类型、导入速率、数据预处理、连接失败、分区冲突等方面，并给出了正确的解决方案，一起来看看吧。1.表头包含数字时的文件导入
实用性再提升！DURATION 数据类型现已支持交易日历！ DolphinDB智臾科技量化金融时序数据库使用教程交易日历时序数据库数据库交易所量化交易
DolphinDB自2.00.9/1.30.21版本开始，提供交易日历功能，并内置世界五十多个交易所的交易日历。借助交易日历，用户可以在DolphinDB中便捷查询指定范围内的交易日，或搭配内置函数，基于交易日进行日期偏移计算、数据采样等操作。最近，交易日历功能再次进行了更新。自2.00.11.1版本起，DURATION数据类型已支持交易日历。DURATION数据类型介绍在使用交易日历进行计算时，
干货收藏丨DolphinDB 节点启动流程简析与常见问题一览 DolphinDB智臾科技时序数据库使用教程时序数据库数据库运维开发运维管理 DolphinDB
DolphinDB的重启是运维工作的重要部分，在启动节点时可能会遇到一些问题，例如启动太慢、启动失败等。本教程以DolphinDBv2.00.11版本为例，结合运行日志简析DolphinDB整体的启动流程和重要模块的启动流程，并分析启动时常见问题的现象、原因和解决方案。1.节点整体启动流程DolphinDB节点整体的启动流程可分为7个阶段：初始化内部基础模块；解析和校验参数、配置文件、licens
DolphinDB 智慧楼宇场景：门禁异常监测 DolphinDB智臾科技工业物联网流计算物联网时序数据库智慧楼宇流计算门禁安防
物联网的发展为智能安防和自动化监控带来了更多便利，同时，新型城镇建设、智慧城市与智慧社区的发展也为门禁管理等安防问题智能化提出了更高的要求。在智能化发展的背景下，门禁成为一套集成了访客、考勤、消费、巡更、梯控等更多功能的全面便捷的系统安全应用，随着门禁系统应用愈发广泛，对海量数据的实时快速处理也成为了日益重要的问题。作为一款高性能分布式时序数据库，DolphinDB提供了流数据表和流计算引擎用于实
DolphinDB 与盈米基金达成战略合作，打造领先的资管机构投顾解决方案 DolphinDB智臾科技大数据数据分析时序数据库数据库量化金融资管
1月16日上午，DolphinDB与盈米基金在上海签署战略合作协议，共同开启专业资管投顾投研合作新篇章。DolphinDB联合创始人、COO初阳春与盈米基金副总裁、研究院院长杨媛春出席仪式，并代表双方完成签约。打造市场领先的资管机构投顾服务盈米基金旗下的蜂鸟团队针对专业资管机构提供全场景数字化服务解决方案，为资管机构提供集交易运营、投研支持、科技赋能、营销赋能于一体的集成服务。借助DolphinD
云上自动部署丨使用 Terraform 在 AWS 上搭建 DolphinDB DolphinDB智臾科技 DolphinDB与大数据时序数据库使用教程 terraform aws 云服务时序数据库数据库
HashiCorpTerraform是一款基础架构即代码工具，旨在实现"Write,Plan,andCreateInfrastructureasCode"。它通过配置文件来描述云资源的拓扑结构，包括虚拟机、存储账户和网络接口。Terraform几乎支持市面上所有的云服务，能够通过代码管理IT资源，并自动化部署资源，从而避免手动部署可能引发的错误。此外，Terraform的命令行接口（CLI）简化了
Victoria Metrics quick start（使用docker +python操作）九十辰 python脚本编程 docker python 数据库 django 容器 prometheus
1.VictoriaMetric数据库介绍（这一部分主要来自官方文档，但是经过我的筛选，主要是面向使用VictoriaMetric，和一些使用它必知必会的概念）VictoriaMetrics是一种快速、可扩展的监控解决方案和时间序列数据库（tsdb）它可以用作Grafana中Prometheus的直接替代品，因为它支持Prometheus查询API它实现了类似PromQL的查询语言-Metrics
【大数据实战】阿里巴巴双11千万级实时监控系统技术揭秘 yoku酱
一、时序业务全景TSDB自2016年开始服役，到现在已经三年了，参与了三次阿里巴巴双11大促。2016年是TSDB元年，2017年开始在阿里巴巴内部做大规模推广。下图展示了2017年和2018年大促状态下TSDB吞吐表现。写入的峰值从2017年的2000wTPS到2018年有了翻倍的增长，增长到了4000wTPS。查询峰值从8000QPS转到了2wQPS。这些都是阿里巴巴核心业务的吞吐量情况，日均
kubernetes部署Prometheus 陈骄 Prometheus k8s kubernetes prometheus docker
文章目录准备工作整一个PV来存放TSDB数据部署Prometheus准备工作开始部署Prometheus部署Grafana准备工作开始部署Grafana部署Ingress，通过Ingress代理Prometheus和Grafana安装Ingress对接Prometheus和Grafana准备工作先新建一个namespace给Prometheus、Grafana用,新建一个目录来存放后续写的YAML
【Prometheus】Prometheus的二进制部署+Grafana koeda（粉丝冲刺一个亿） Prometheus prometheus grafana kubernetes 容器云原生
目录一、Prometheus概述1、概念2、核心组件prometheusserver：3、Prometheus的特点：4、prometheus的存储引擎：TSDB5、Prometheus组件：6、Prometheus的工作流程：7、Prometheus的局限性，以及和zabbix的对比：二、实验：二进制部署Prometheus三、总结：一、Prometheus概述1、概念Prometheus：普罗
DolphinDB学习（2）：增删改查数据表(分布式表的基本操作) 呆萌的代Ma 数据库学习分布式
文章目录创建数据表1.创建数据表全流程2.核心：创建table3.在已有的数据表中追加新的数据数据表自身的操作1.查询有哪些数据表2.删除某张数据表3.修改数据表的名称博客里只介绍最常见的分区表（createPartitionedTable）的创建方法，更多自定义的操作请参考：https://github.com/dolphindb/Tutorials_CN/blob/master/partiti
ZABBIX6.0+TSDB+psql+grafana出图+微信报警使用时序数据库（基于ubtun20.04） GEGEWU- 运维监控时序数据库 postgresql 数据库
环境：ubtun20.04+zabbix6.05postgresql-14+timescaledb-2-postgresql-14配置文件位置pspl远程连接配置文件：vim/etc/postgresql/14/main/pg_hba.confpsql主配置文件：vim/etc/postgresql/14/main/postgresql.confzabbix后端日志目录后端日志查看目录：cat/v
DolphinDB学习（1）：数据库的增删查与常用操作呆萌的代Ma 数据库学习数据库
下载并配置好DolphinDB，同时添加vscode的插件，我们就在vscode上进行操作创建xxx.dos文件后，就会被识别为DolphinDB的运行文件，非常方便文章目录登录数据库的操作创建数据库查找与删除数据库示例登录如果是vscode，已经连接上了就不需要login，而在其他语言的接口中，需要先登录，对应的代码是：login("admin","123456")//DolphinDB的注释与
DolphinDB学习（0）：DolphinDB基本概述呆萌的代Ma 数据库学习
DolphinDB的学习难度不小，主要是写法比较多，官方示例是一次性给一大堆代码，在没有成体系的学习基础的前提下，总有种力不从心的感觉，所以博主汇总这一个系列的文章，尝试从最简单的基础常规操作开始，一边学习一边记录探索DolphinDB的过程，同时对一些函数做更形象的解释博主用DolphinDB的需求有以下几点：（股票/股指期权）使用流处理，处理实盘中的Tick级别的数据，主要用于股票策略监控与期
遇到 Out of Memory 怎么办？DolphinDB OOM 应对指南请查收！ DolphinDB智臾科技时序数据库使用教程数据库时序数据库内存管理运维管理 OOM
OutofMemory，简称OOM，代表内存耗尽的一种异常状态。OOM的表现形式千差万别，可能是服务异常终止，亦或是系统性能急剧下降。这一现象背后的根本问题在于内存的不足。造成OOM的原因有很多，其中包括数据量庞大、频繁的数据写入和查询操作，以及可能存在的内存泄漏问题。了解这些原因，能够帮助我们更好地规划、优化和维护系统，从而提高其稳定性和性能。本文将针对在使用DolphinDB时遇到OOM这一问
DolphinDB 高可用集群迁移指南 DolphinDB智臾科技 DolphinDB与大数据量化金融时序数据库使用教程网络服务器集群
在业务发展初期，资源有限的情况下，为了提高系统的可用性，我们会搭建一个伪高可用环境。伪高可用集群的特点在于其控制节点的元数据文件虽然有多副本，但存在多副本在同一台服务器的情况。与伪高可用集群不同，高可用集群控制节点的元数据文件副本均分布在不同的服务器上，确保在服务器故障或其他问题发生时系统能够保持稳定运行。这种架构设计提供了更强大的容错能力和可靠性，是业务规模扩大后的理想选择。因此，在业务可行并确
即刻预约 | Get 你的 DolphinDB 官方证书！ DolphinDB智臾科技大数据数据分析时序数据库量化金融
新年伊始，大家都在为2024年做规划。学习、搞钱、旅游、锻炼……DolphinDB在这里给大家提供一个全新的选项：获得官方技能认证！现在，赶紧将#参加DolphinDB的首场考试#列进你的计划清单，获取2024年的第一份证书吧~DolphinDB技能认证已登陆官网，点击“开发者中心”→“技能认证”进入现在，DolphinDB正逐渐成为国内量化金融领域的通用基础软件。越来越多的头部企业已经将“掌握D
用时序数据库 DolphinDB 搭建一套轻量化工业试验平台解决方案 DolphinDB智臾科技工业物联网时序数据库数据库工业物联网物联网数据分析大数据
DolphinDB作为集成了高容量高速度流数据分析系统和强大编程语言的一站式解决方案，旨在为用户提供快速存储、检索、分析和计算庞大的结构化数据服务。本文将提供一个轻量化的工业试验平台数据处理解决方案，快速简单地实现海量数据采集、存储、处理和分析，帮助企业提高产品的质量和竞争力。1.场景介绍工业试验平台在工业测试领域广泛应用，它是一种集成了各种传感器、数据采集器、控制器、计算机等设备的系统，可以提供
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin

DolphinDB基础概念理解：流数据处理框架

专业术语解释实时流处理

DolphinDB的流数据框架

吞吐量大，低延迟；

与时序数据库及数据仓库集成，一站式解决方案；

天然具备流表对偶性，支持使用SQL语句进行数据注入和查询分析；

内置时间序列及横截面聚合引擎；

高频交易数据回放；

流数据过滤；

流数据处理框架及概念准备

流数据表

发布和订阅

实时聚合引擎

配置以开启流数据功能

配置发布节点

配置订阅节点

流数据发布

流数据订阅

发布者与订阅者所在节点关系的三种可能

发布者与订阅者是同一节点

发布者与订阅者是同一集群内的不同节点

发布者与订阅者不再同一个集群内

断线重连

发布端数据过滤

取消订阅

取消订阅一个本地表

取消订阅一个远程表

删除共享的流数据表

流数据持久化

避免内存不足；

流数据的备份和恢复，当节点出现异常重启时，持久化的数据会在重启时自动载入到流数据表；

持久化的一个重要目的是可以从任意位置开始重新订阅数据；

enableTablePersistence持久化流数据

clearTablePersistence删除持久化数据

disableTablePersistence关闭持久化

getPersistenceMeta获取流数据表的持久化细节情况

数据回放

流数据API

DolphinDB本身的聚合引擎；

第三方的消息队列；

第三方程序。

Java API

C++ API

C# API

Python API

状态监控