Quant_Learner

DolphinDB基础概念理解：Orca与Pandas的差异

Orca

Orca在DolphinDB上实现了Pandas API。

《DolphinDB基础概念理解：Orca》

《DolphinDB使用案例21：orca入门及底层实现》

因为先有DolphinDB与Pandas，后有Orca，Dol的底层都已经写好了，导致Orca在实现Pandas时限于底层架构，会与Pandas有些细节差异。

数据类型的差异

	DolphinDB	Pandas	备注
整数字面量	默认解析为`32`位`INT`类型	默认解析为64位	`DolphinDB`支持`CHAR`、`SHORT`、`INT`、`LONG`等不同字节数的整数类型
字符串类型	- `STRING` 可以进行`max`，`min`等比较运算； - `SYMBOL` 不允许，类似`pandas`中`category`的功能	底层存储是`np.object`；经过优化的`category`类型，使用整数作为底层存储，对于取值范围有限的数据，能减少内存占用。	`pandas`允许将任何数据类型的数据转换为`category`类型，而`DolphinDB`只允许字符串类型。
日期和时间类型	`DATE`； `MINUTE`; `SECOND`; `TIME`; `NANOTIME`; …	`np.datetime64[ns]`,以`freq`表示时间单位
同一列数据类型	同一列中元素的数据类型必须相同	允许一个`Series`中的数据有不同数据类型	`DolphinDB`中字符串类型的`NULL`值实际上是一个空字符串，而`pandas`中字符串类型的空值是`np.NaN`。

通用函数的差异

Orca提供以下通用函数：

函数	描述
`connect`	将会话连接到`DolphinDB`服务器
`merge`	连接两个`DataFrame`
`concat`	按照`columns`对齐连接两个`DataFrame`
`date_range`	创建时间序列
`to_datetime`	将字符串转换成时间类型
`isna`	判断是否是空值
`isnull`	判断是否是空值
`notna`	判断是否不是空值
`notnull`	判断是否不是空值

Input/Output的差异

Orca现在支持的Input/output函数有：read_csv和read_table

下表展示Orca的read_csv与Pandas的read_csv函数的差异：

# engine = 'dolphindb'前提下的参数可能
read_csv(path, sep=',', delimiter=None, names=None,  index_col=None,engine='dolphindb', usecols=None, squeeze=False, prefix=None, dtype=None, partitioned=True, db_handle=None, table_name=None, partition_columns=None, *args, **kwargs):

	Orca	Pandas	备注
`engine`	{’`c`’,默认在`python`客户端目录下寻找要导入的文件 ‘`python`’, 默认在`python`客户端目录下寻找要导入的文件 ’dolphindb’默认在`DolphinDB`服务端目录下寻找要导入的文件}	{’`c`’，’`python`’}	当engine参数设置为‘python’或者‘c’时，Orca的`read_csv`函数相当于调用了pandas的`read_csv`函数进行导入。下面列出的差异均是在engine参数设置为‘dolphindb’的前提下的差异。
`dtype`	还支持以字符串的方式指定`DolphinDB`的提供的所有数据类型，包括所有时间类型和字符串类型	该参数接收一个字典，键是列名，值是Python原生类型（`bool`, `int`, `float`, `str`）或`np`的`dtype`（`np.bool`, `np.int8`, `np.float32`, `etc`.）
`sep`/`delimiter`	不支持	支持对正则表达式的解析
`partitioned`	`True`：允许分区方式将数据导入(实际上是调用`DolphinDB`的ploadText函数)； `False`：强制以非分区的方式导入数据(实际上是调用`DolphinDB`的loadText函数)		`bool`类型，具体见Orca分区表的特殊差异。
`db_handle`, `table_name`以及`partition_columns`	用于在导入数据的时通过指定`DolphinDB`的数据库和表等相关信息，将数据导入到`DolphinDB`的分区表		具体用法与示例请参见Orca分区表的特殊差异。（包括`read_table`函数）

Series、DataFrame的差异

Series和DataFrame的创建与修改

	Pandas	Orca	备注
创建	允许在定义一个`Series`时不设置`name`参数，或者使用数字作为`name`	相当于在`DolphinDB server`端新建一个只含有一列的表，而表的列名则不允许为`空值`且不能使用`数字`。因此，在创建`Orca`的`Series`而不指定名字时，系统会默认为该`Series`自动生成一个名字，当然，用户不会感知到自动生成的名字，只是会看到`Orca`抛出的`WARNING`信息。
修改	向下取整	四舍五入取整	将一个精度更高的数据类型的值赋值给一个精度更低的Series
追加数据	允许通过直接访问一个不存在的index去增加新的行	不允许

Series和DataFrame的四则运算

	Pandas	Orca
空值的处理	任何数与空值比较，返回都是False，这其实是Python中NaN比较的规则	将空值视为该类型的最小值
空字符串的处理	字符串会区分NaN值和空字符串	空字符串就是NaN
零的处理	非零数除以零得到同符号的无穷大；零除以零得到NaN	任何数除以零得到NULL

Series和DataFrame的属性与方法

	Pandas	Orca	备注
Attributes and underlying data		唯一没有支持的属性就是`memory_usage`
Conversion		由于`Orca`的优势在于对批量数据读写与计算，因此目前在`Conversion`方面的功能并不完善，现在仅支持`Series.to_numpy`这一功能
Indexing, iteration		见下表

关于Indexing, iteration，orca.DataFrame对象和orca.Series对象支持以下函数：

函数	描述
head	返回前n个值
tail	返回最后n个值
loc	通过index访问
iloc	通过下标访问
where	用NaN填充不符合过滤条件的值
mask	用NaN填充符合过滤条件的值

orca.DataFrame对象还具备以下函数：

函数	描述
items	遍历DataFrame
iteritems	遍历DataFrame
lookup	根据标签查询数据
get	访问某一列

loc与iloc（本质上属于indexing方面的事情）
1. 通过loc访问Series和DataFrame
  
  Orca暂不支持通过loc去访问带有DatetimeIndex的Series和DataFrame。
  
  当DataFrame的表中有重复的index时，pandas不支持以重复的index值为slice的下界，而Orca则以第一个出现的重复值为slice的下界输出结果。
2. 通过loc与iloc修改Series和DataFrame中值的类型
  
  pandas可以通过loc和iloc更改DataFrame中一个列（Series）的类型。更改其中一个值的类型会导致整列类型变更，也可以直接通过调用astype函数更改整列的类型。而Orca不允许修改列的类型。
3. 通过loc与iloc修改Series和DataFrame中的值
  
  Orca不支持：当index有重复的列，通过一个DataFrame以index对齐的原则去修改另一个DataFrame的值
4. 通过loc向DataFrame新增一行或者一列
  
  pandas支持直接通过loc访问不存在的index或者columns来新增行或者列，而Orca暂不支持。
5. loc与iloc暂不支持对MultiIndex的访问
Binary operator functions

除了combine和combine_first函数之外，Orca支持pandas提供的所有二元函数。
1. 二元运算函数的axis参数
2. 除数是负数
3. 求余运算

Function application, GroupBy & window

以下函数可用于orca.DataFrame对象和orca.Series对象：

函数	描述
apply	应用多个函数
agg	应用多个聚合函数
aggregate	应用多个聚合函数
groupby	分组运算
rolling	滑动窗口
ewm	指数加成滑动

Computations/descriptive stats的差异

以下函数可用于orca.DataFrame对象和orca.Series对象：

函数	描述
abs	绝对值
all	判断是否为空
any	判断是否为空
clip	返回介于阈值之间的值
clip_lower	返回大于下界的值
clip_upper	返回小于上界的值
corr	相关性
count	非空元素的个数
cov	协方差
cummax	累计最大值
cummin	累计最小值
cumprod	累乘
cumsum	累加
kurt	倾斜度
kurtosis	峰度
mad	平均绝对利差
max	最大值
mean	平均值
median	中位数
min	最小值
mode	众数
pct_change	百分比变化率
prod	返回乘积
product	返回乘积
quantile	分位数
rank	排名
round	规整
sem	无偏标准差
skew	无偏斜
std	标准差
sum	求和
var	方差
nunique	返回非重复值的个数

orca.Series对象还具备以下函数：

函数	描述
between	返回介于阈值之间的值
unique	返回不重复的值
is_unique	判断是否有重复的值
is_monotonic	判断是否单调
is_monotonic_increasing	判断是否单调递增
is_monotonic_decreasing	判断是否单调递减

Reindexing/selection/label manipulation的差异

以下函数可用于orca.DataFrame对象和orca.Series对象：

函数	描述
drop_duplicates	删除重复的值
duplicated	判断是否重复
first	返回第一个值
head	返回前n个值
idxmax	返回index的最大值
idxmin	返回index的最小值
last	返回最后一个值
rename	重命名
tail	返回最后n个值

orca.DataFrame对象还具有以下函数：

函数	描述
drop	删除某列
reindex	重置index
reset_index	重置index
set_index	设置index

Reshaping, sorting

Orca目前支持sort_values函数，该函数仅支持ascending参数。在排序中，Orca将NaN值视为最小值处理。
Serialization / IO / conversion

Orca支持pandas所支持的所有序列化相关函数，并提供一个to_pandas函数，该函数将一个Orca对象转化为pandas的对象。

Index Objects的差异

Orca目前支持的Index类型有Index,Int64Index,DatetimeIndex和MultiIndex，下面介绍Index对象所支持的属性和方法。

Index的属性

Orca的Index对象具有以下属性：

属性	描述
values	返回取值
is_monotonic	判断是否单调
is_monotonic_increasing	判断是否单调递增
is_monotonic_decreasing	判断是否单调递减
is_unique	判断是否有重复的值
hasnans	判断是否有空值
dtype	返回数据类型
shape	返回形状
name	返回名字
nbytes	返回字节数
ndim	返回维度
size	返回大小
T	返回转置

Modifying and computations

Orca的Index对象支持以下函数：

函数	描述
max	最大值
min	最小值

GroupBy的差异

Orca的groupby函数目前仅支持by参数，且只能对DataFrame进行groupby。

以下函数可用于orca.DataFrameGroupBy对象：

函数	描述
all	判断是否为空
any	判断是否为空
bfill	向后填充
count	非空元素的个数
cumcount	累计非空元素的个数
cummax	累计最大值
cummin	累计最小值
cumprod	累乘
cumsum	累加
ffill	向前填充
first	返回第一个元素
last	返回最后一个元素
mad	平均绝对利差
max	最大值
mean	平均值
median	中位数
min	最小值
ohlc	忽略空值求和
pct_change	百分比变化率
resample	重采样
size	元素个数
sem	无偏标准差
skew	无偏斜
std	标准差
sum	求和
var	方差

Resampling的差异

Orca支持resample函数，该函数目前支持的参数如下：

参数	说明
rule	DateOffset，可以是字符串或者是dateoffset对象
on	时间列，采用该列进行重采样
level	字符串或整数，对于MultiIndex，采用level指定的列进行重采样

Orca支持的DateOffset如下：

Date Offset	Frequency String
BDay or BusinessDay	‘B’
WeekOfMonth	‘WOM’
LastWeekOfMonth	‘LWOM’
MonthEnd	‘M’
MonthBegin	‘MS’
BMonthEnd or BusinessMonthEnd	‘BM’
BMonthBegin or BusinessMonthBegin	‘BMS’
SemiMonthEnd	‘SM’
SemiMonthBegin	‘SMS’
QuarterEnd	‘Q’
QuarterBegin	‘QS’
BQuarterEnd	‘BQ’
BQuarterBegin	‘BQS’
FY5253Quarter	‘REQ’
YearEnd	‘A’
YearBegin	‘AS’ or ‘BYS’
BYearEnd	‘BA’
BYearBegin	‘BAS’
FY5253	‘RE’
Day	‘D’
Hour	‘H’
Minute	‘T’ or ‘min’
Second	‘S’
Milli	‘L’ or ‘ms’
Micro	‘U’ or ‘us’
Nano	‘N’

Orca分区表的特殊差异
- Orca的分区表
  
  pandas作为全内存计算的分析工具，无法解决当数据量过大时带来的内存不足，计算效率低下等问题。DolphinDB是一个分布式时序数据库，并且内置了丰富的计算和分析功能。它可以将TB级的海量数据存储在多台物理机器上，充分利用CPU，对海量数据进行高性能分析计算。
  
  Orca作为基于DolphinDB开发的分布式pandas接口，其最大的优势就是在语法和pandas保持一致的前提下很好地解决了pandas的瓶颈：大数据场景下的性能问题。而这一问题的解决，则依赖于DolphinDB分区表。在Orca中，我们也引入Orca分区表的概念。
  1. read_csv函数
  2. read_table函数
- Orca分区表的特殊差异
  
  在DolphinDB中，分区表与内存表存在着一些差异，在Orca中，分区表的操作也存在这诸多限制。
  1. all，any和median函数
  2. 对非整数类型的index重复选择
  3. 以DataFrame的index为基准对齐设置某一列的值
References

Github >> Orca与pandas的差异

你可能感兴趣的:(TSDB,DolphinDB,KDB+)

时序数据库：高效处理时间序列数据的核心技术时序数据说时序数据库数据库开源物联网 iotdb
时序数据库概述时序数据库（TimeSeriesDatabase，TSDB）是一种专门为存储、处理和查询时间序列数据而优化的数据库系统。随着物联网、金融科技、工业互联网等领域的快速发展，时序数据呈现出爆炸式增长，传统的关系型数据库在处理这类数据时面临诸多挑战，时序数据库应运而生并成为关键技术解决方案。时序数据的特点时序数据具有几个显著特征，这些特征直接影响了时序数据库的设计理念：时间属性：每条记录都
电力行业 | 抽水蓄能场景下，百万测点数据如何统一采集与接入？ DolphinDB智臾科技物联网 dolphindb 数据库抽水蓄能电力数据采集数据接入
在电力行业，抽水蓄能是目前最成熟、已经大规模化应用、兼顾发电和储能的一项技术。为了保障电站的平稳运行，借助物联网、大数据等技术，对电站各类运行设备进行实时采集，如机组振动、油压波动、瓦温变化等生产监测数据，已成为电站稳定运维的重要技术手段。在之前的文章储能业|低成本部署！DolphinDB打造抽水蓄能一体化解决方案-CSDN博客中，我们介绍了DolphinDB在抽水蓄能场景中的全链路解决方案。今天
储能业 | 低成本部署！DolphinDB 打造抽水蓄能一体化解决方案 DolphinDB智臾科技物联网数据库大数据 DolphinDB 实时计算抽水蓄能电力
导语在电力行业抽水蓄电场景中，电力集团可以基于DolphinDB搭建轻量化实时数仓，有效破解高频数据写入、万亿级数据存储和秒级实时计算等核心难题。同时，该方案助力集团降本增效，提升运维效率，并实现对多个电站数据的统一管理与调度，加快数字化转型步伐。一、行业背景构建清洁低碳、安全高效的新型能源电力系统是实现“双碳”目标的一大关键任务。其中，抽水蓄能作为当前最成熟、最具规模化应用前景的物理储能技术，正
单表高效管理异构数据：点位管理引擎快速上手指南 DolphinDB智臾科技工业物联网物联网 DolphinDB 物联网点位点位管理数据处理
点位即设备上用于采集、监测和控制的各类传感器和执行器，是物联网应用场景中最重要的数据单位，通过对众多点位进行管理，企业可以实现设备监控预警、实时监测等方案。高效地存储和管理点位数据对于每一个企业和用户而言都是至关重要的。在本篇文章中，我们将详细介绍如何使用DolphinDB点位管理引擎（IOTDB引擎）来管理和存储复杂的点位数据，提升点位数据管理效率。本教程提供完整的测试代码和测试数据，初学者也可
AI+实时计算如何赋能金融系统？DolphinDB 在国泰君安期货年度中期策略会的演讲
6月25日，国泰君安期货2025年度中期策略会在上海顺利开幕。本次策略会以“观势明变，本固枝荣”为主题，特邀15位重量级行业嘉宾和52位明星分析师发表精彩观点，DolphinDB受邀出席会议并作主题演讲。实时计算如何赋能量化投研交易下午13:30分，AI投资主题分论坛正式启幕，DolphinDB创始人周小华博士在随后登台发言，带来了题为《AI+实时计算赋能量化金融》的精彩发言。演讲中，周小华博士首
时序库总结天一涯数据库
1、常见的时间序列数据库：TSDB项目官网influxDBhttps://influxdata.com/RRDtoolhttp://oss.oetiker.ch/rrdtool/Graphitehttp://graphiteapp.org/OpenTSDBhttp://opentsdb.net/Kdb+http://kx.com/Druidhttp://druid.io/KairosDBhttp:
时序库介绍古朗月行数据库大数据 java
时序库（Time-seriesDatabase，TSDB）是一种专门用于存储和处理时间序列数据的数据库。时间序列数据是一种按照时间先后顺序排列的数据，例如气象数据、生产数据、网络数据等等。常见的时序库有OpenTSDB、InfluxDB、Prometheus等，下面将从基本概念、使用场景、主要特点和使用API等方面进行介绍。基本概念时序数据时序数据是一种按照时间顺序排列的数据，在很多应用场景中都非
小白对时序数据库的理解 chunmiao3032 时序数据库数据库
一、什么是时序数据库？时序数据库（TimeSeriesDatabase，TSDB）是一种专门用于存储、处理和分析时间序列数据的数据库管理系统。时间序列数据是按时间顺序记录的数据，通常由各种设备和传感器生成，例如智慧城市、物联网、车联网、工业互联网等领域的设备，以及证券市场的行情数据等。这些数据通常具有以下特点：时间戳：每个数据点都带有时间戳，这对于数据的计算和分析至关重要。结构化：与非结构化数据不
一个模块实现期货分钟 K 线计算、主连行情合成 DolphinDB智臾科技量化金融 DolphinDB 期货期货交易期货行情行情行情数据量化金融
由于不同期货品种的交易时间存在差异，且不同期货合约的活跃度各不相同，因此基于期货快照行情数据合成分钟K线的计算方法在时间对齐上需要进行不同的处理。本教程旨在提升DolphinDB在具体业务场景中的应用效率，并降低其在实际业务中的开发难度。为此，我们开发了FuturesOLHC模块，通过调用该模块中定义的函数，用户可以轻松实现以下需求：基于期货历史快照行情数据合成分钟K线基于期货历史快照行情数据合成
时间序列数据库技术深度解析：核心原理与最佳实践大咖分享课数据库人工智能系统架构
关键词标签：时间序列数据库技术TSDB数据存储性能优化架构设计最佳实践文章目录第一章：引言与概述1.1时间序列数据的重要性1.2传统数据库的局限性1.3时间序列数据库的价值第二章：时间序列数据库核心概念2.1基本概念与术语2.2数据模型特点2.3查询模式分析第三章：核心技术原理3.1数据存储原理3.2压缩算法技术3.3索引机制设计第四章：架构设计深度解析4.1整体架构设计4.2分布式架构4.3存储
数据库领域新趋势：时序数据库崛起数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent 数据库时序数据库网络 ai
数据库领域新趋势：时序数据库崛起关键词：时序数据库、时间序列数据、物联网、金融科技、大数据分析、TSDB、InfluxDB摘要：随着物联网、金融科技等领域的快速发展，时间序列数据的处理需求急剧增长，传统关系型数据库在处理这类数据时面临性能瓶颈。本文深入探讨时序数据库(TimeSeriesDatabase,TSDB)的崛起背景、核心原理、关键技术、应用场景及未来发展趋势。我们将从架构设计、存储引擎、
高效时间序列分析的开源利器：QuestDB 臻源精品开源应用分享开源 github 时序数据库性能优化
QuestDB：探索数据的深度，加速决策的速度-精选真开源，释放新价值。概览时序数据库（TimeSeriesDatabase，简称TSDB）是一种专门设计和优化的数据库系统，用于高效地存储、管理和查询带有时间戳的数据序列，即时间序列数据。这类数据库的核心特点是处理那些随时间变化的数据，如传感器测量值、服务器性能指标、股票价格、天气数据等，其中每个数据点都关联了一个精确的时间戳。QuestDB是一个
CentOS7中Prometheus结合Grafana实现可视化监控 -Jay.L- Prometheus prometheus grafana
文章目录一、Prometheus部署1.创建/data/apps目录存放下载的软件2.在线下载3.解压到/usr/local/，再重命名4.查看Prometheus版本检查prometheus.yml格式的命令5.创建prometheus本地TSDB数据存储目录6.使用systemctl管理Prometheus7.启动Prometheus并设置开机启动8.查看prometheus服务状态9.访问P
DolphinDB 中高频回测解决方案：期货分钟频 CTA 策略回测实例 DolphinDB智臾科技量化金融 CTA 回测框架策略回测
CTA策略在现代金融市场中扮演着重要角色，通过技术分析和趋势跟踪，其能够帮助用户捕捉市场动向，实现风险对冲和利润最大化。在中高频交易中，CTA策略对交易效率、盈利能力的助益尤为明显。在投入实盘交易之前，利用市场的历史数据对量化中高频策略进行测试和评估是确保交易策略有效性和可行性的重要步骤。DolphinDB凭借其高性能计算引擎和强大的数据处理能力，成为中高频交易策略回测的理想选择。在本文中，我们将
时序数据库：数据库领域的未来之星数据库管理艺术数据库专家之路数据库时序数据库 ai
时序数据库：数据库领域的未来之星关键词：时序数据库、时间序列数据、物联网、大数据分析、实时监控、TSDB、数据库优化摘要：本文深入探讨了时序数据库(TimeSeriesDatabase,TSDB)这一新兴数据库技术。我们将从基本概念出发，分析时序数据的特性与挑战，详细讲解时序数据库的核心架构和关键技术，包括数据压缩、高效索引、分布式处理等。文章包含实际代码示例和性能优化策略，并探讨时序数据库在物联
时序数据库与实时数据库的核心区别及典型应用时序数据说数据库时序数据库非关系型数据库大数据 iotdb
在工业物联网（IIoT）、智能制造、能源监控等领域，‌时序数据库‌和‌实时数据库‌是两类关键的数据管理工具。尽管两者都服务于“实时性”场景，但其设计目标、技术架构和应用方向存在显著差异。本文将从核心特性、应用场景及典型案例出发，解析两者的区别。一、核心定义与设计目标1.‌时序数据库（TimeSeriesDatabase,TSDB）‌‌定义‌：专为‌时间序列数据‌优化的数据库，存储按时间戳排序的连续
【项目实战】TDengine入门介绍本本本添哥 003 -数据库 tdengine 大数据时序数据库
一、TDengine是什么？TDengine是一款开源的分布式时序数据库一款开源、高性能、云原生的时序数据库(TimeSeriesDatabase,TSDB)一款强大而易用的时序数据库一款创新性的大数据处理产品一款高性能、分布式的物联网、工业大数据平台一款高效的存储、查询、分析时序大数据的平台基于C语言开发。由涛思数据开发推出的二、TDengine的适用场景TDengine核心模块是高性能、集群开
时序数据库-03-opentsdb-分布式时序数据库老马啸西风 java
时序数据库系列时序数据库-01-时序数据库有哪些？为什么要使用时序数据库-02-聊一聊时序数据库时序数据库-03-opentsdb-分布式时序数据库时序数据库-04-InfluxData-分布式时序数据库时序数据库-05-TDengine是一款开源、高性能、云原生的时序数据库(Time-SeriesDatabase,TSDB)时序数据库-05-TDengineTime-SeriesDatabase
Prometheus 和 Grafana 之间的数据传输方式百里自来卷 prometheus grafana oracle
Prometheus和Grafana之间的数据传输方式主要有以下几种：1.Grafana通过PromQL从Prometheus拉取数据（默认方式✅）适用场景：大部分监控场景，Grafana从Prometheus直接查询数据并可视化原理Prometheus定期抓取（scrape）监控目标的数据，并存储在**时间序列数据库（TSDB）**中。Grafana通过Prometheus数据源使用PromQL
【golang】量化开发学习（一）幺零九零零量化开发语言 go
均值回归策略简介均值回归（MeanReversion）假设价格会围绕均值波动，当价格偏离均值一定程度后，会回归到均值。基本逻辑：计算一段时间内的移动均值（如20天均线）。当当前价格高于均值一定比例，做空；当低于均值一定比例，做多。持仓等待价格回归后平仓。官网下载DOLGPHINDB总结✅Docker运行DolphinDB✅创建模拟股票数据表✅Golang连接DolphinDB进行查询这样，Gola
【云平台监控】Prometheus 监控平台部署与应用 Karoku066 prometheus 容器 kubernetes docker 运维云原生
文章目录Prometheus监控系统概述TSDB存储引擎特点核心特点生态组件工作流程局限性部署Prometheus1.PrometheusServer部署2.部署Exporters3.部署Grafana4.服务发现Kubernetes集群部署Prometheus和Grafana全流程指南1.环境准备2.部署NodeExporter功能：采集节点资源指标（CPU、内存、磁盘等）步骤：3.部署Prom
Prometheus存储原理及数据备份还原 JohnnySongXY prometheus 网络运维 linux devops
prometheus将采集到的样本以时间序列的方式保存在内存（TSDB时序数据库）中，并定时保存到硬盘中。与zabbix不同，zabbix会保存所有的数据，而prometheus本地存储会保存15天，超过15天以上的数据将会被删除，若要永久存储数据，有两种方式：方式一：修改prometheus的配置参数“storage.tsdb.retention.time=10000d”；方式二：将数据引入存储
Nightingale滴滴夜莺监控系统入门（四）--聊聊夜莺的后端储存运维翁 Nightingale linux 运维服务器
Nightingale滴滴夜莺监控系统入门（四）—聊聊夜莺的后端储存1-默认版本默认是使用夜莺的两个组件来实现：TSDB+INDEXTSDB实际上使用的是老牌的图形数据库rrdtool，记录ts和value，有很多老牌的监控使用比如Cacti；INDEX是索引模块，夜莺把监控metric记录在这里，查询数据的时候是通过索引去查询；存储目录分别对应TSDB:/home/n9e/dataINDEX:/
TDengine和DolphinDB哪个更好，哈哈哈哈，闲来无聊分析了一下。(1) 2401_84023482 程序员 tdengine 大数据时序数据库
TDengine是专为时序数据设计的，针对的是物联网、工业互联网、IT运维场景。这些场景是不需要特殊的查询函数的，更关心的是写入速度、查询速度。而且这些场景下，也需要一些其他数据库不具备的功能，比如插值、时间聚合等等如果要问TDengine和DolphinDB最大的特色，存储引擎可能是TDengine最大的特色，性能也非常好；DolphinDB的最大特色毫无疑问是它的计算引擎。可以毫不夸张的说，D
大规模时序数据存储（三）| 核心功能设计 AIOPstack
作者简介运小尧百度高级研发工程师一、简介基本功能方面，我们的TSDB在数据的收集上提供了HTTP、Thrift等API；对查询，除了提供API之外还提供了命令行工具（CLITool），这些基本功能的设计在不同的TSDB中大同小异，因此本文不再赘述。由于数据规模庞大且出于业务数据隔离和定期清理的需要，我们设计了分库分表功能；为了提升历史数据存储和查询效率，同时节省存储成本，我们又设计了多级降采样功能
dolphinDB创建适合存放股票代码的分布式数据库呆萌的代Ma 数据库分布式数据库
这里我们使用基于哈希分区的数据库：my_db=database(db_path,HASH,[SYMBOL,10])这行代码指定基于哈希分区，同时哈希值使用10个长度，这样既可以存放一般的股票代码，也可以存放比如期权这种比较长的代码更多的分区表情况请参考：https://github.com/dolphindb/Tutorials_CN/blob/master/partitioned_in_memo
dolphinDB使用select筛选时间字段呆萌的代Ma 数据库 sql 数据库
在dolphinDB中，使用：timestamp(2020-01-01)得到的结果是：timestamp(1970.01.0100:00:02.018)，因为dolphinDB中日期格式是2020.01.01的写法，而2020-01-01会认为是2020-1-1=2018，因此在select中也是，比如：selecttop5*fromtablewheredt>timestamp(2020.01.0
prometheus监控系统 ʀᴇʟɪᴇʏ Go 1024程序员节云原生服务发现 golang prometheus
prometheus介绍Prometheus是一款时序（timeserier）数据库，但它的功能却并不止于TSDB，而是一款设计用于进行目标（Target）监控的关键组件；集合生态系统内的其他组件，例如pushGateway、Altermanager和Grafana等，可构成一个完整的IT监控系统。时序数据，是在一段时间内通过重复测量而获得的观察值的集合；将这些观测值绘制于图形之上，有一个数据轴和
Hbase 数据迁移运维那些事儿 hbase hbase hadoop 大数据
Hbase数据迁移可选方案对比l已验证方案操作说明：nExport&importu导出命令及示例hbaseorg.apache.hadoop.hbase.mapreduce.Export“表名”文件路径导出至本地文件系统：./bin/hbaseorg.apache.hadoop.hbase.mapreduce.Export‘default:tsdb-uid’file:///tmp/tsdb-uid
prometheus原理简介运维那些事儿 Prometheus 运维 java 开发语言
Prometheus一、Prometheus简介Prometheus是一款时序（timeseries）数据库，但它的功能却并非止步于TSDB，而是一款设计用于进行目标（Target）监控的关键组件；Prometheus是一个开源的系统监控和报警系统，现在已经加入到CNCF基金会，成为继k8s之后第二个在CNCF托管的项目，在kubernetes容器管理系统中，通常会搭配prometheus进行监控
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

DolphinDB基础概念理解：Orca与Pandas的差异

Orca

数据类型的差异

通用函数的差异

Input/Output的差异

Series、DataFrame的差异

Series和DataFrame的创建与修改

Series和DataFrame的四则运算

Series和DataFrame的属性与方法

loc与iloc（本质上属于indexing方面的事情）

Binary operator functions

Function application, GroupBy & window

Computations/descriptive stats的差异

Reindexing/selection/label manipulation的差异

Reshaping, sorting

Serialization / IO / conversion

Index Objects的差异

Index的属性

Modifying and computations

GroupBy的差异

Resampling的差异

Orca分区表的特殊差异

Orca的分区表

Orca分区表的特殊差异

References

你可能感兴趣的:(TSDB,DolphinDB,KDB+)