gongpulin

InfluxDB详解之TSM存储引擎解析（一）

InfluxDB 项目更新比较快，google 了一下网上的一些文档基本上都是简单介绍了一下，而且很多都已经过时了，比如其中使用的 TSM 存储引擎，甚至官方文档上的内容都不是最新的。在源码里的 README 中有最新的设计实现的一些概要说明。

我认为像这样的针对特殊场景进行优化的数据库会是今后数据库领域发展的主流，这里针对 InfluxDB 1.0.0 版本的源码深入研究一下 TSM 引擎的实现原理。TSM 存储引擎解决了 InfluxDB 之前使用的 LevelDB 和 BoltDB 时遇到的一些问题。

因为 TSM 是根据 LSM Tree 针对时间序列数据优化而来，所以总体架构设计上相差并不是很大，LSM Tree 的概念可以参考『LSM Tree 学习笔记』。

概念

首先需要简单了解 InfluxDB 的总体的架构以及一些关键概念，有一个总的思路，知道这个数据库是为了存储什么样的数据，解决哪些问题而诞生的，便于后面理解 TSM 存储引擎的详细的结构。可以简单看一下我之前的文章，『时间序列数据库调研之InfluxDB』。

数据格式

在 InfluxDB 中，我们可以粗略的将要存入的一条数据看作一个虚拟的 key 和其对应的 value(field value)，格式如下：

cpu_usage,host=server01,region=us-west value=0.64 1434055562000000000

虚拟的 key 包括以下几个部分： database, retention policy, measurement, tag sets, field name, timestamp。 database 和 retention policy 在上面的数据中并没有体现，通常在插入数据时在 http 请求的相应字段中指定。

database: 数据库名，在 InfluxDB 中可以创建多个数据库，不同数据库中的数据文件是隔离存放的，存放在磁盘上的不同目录。
retention policy: 存储策略，用于设置数据保留的时间，每个数据库刚开始会自动创建一个默认的存储策略 autogen，数据保留时间为永久，之后用户可以自己设置，例如保留最近2小时的数据。插入和查询数据时如果不指定存储策略，则使用默认存储策略，且默认存储策略可以修改。InfluxDB 会定期清除过期的数据。
measurement: 测量指标名，例如 cpu_usage 表示 cpu 的使用率。
tag sets: tags 在 InfluxDB 中会按照字典序排序，不管是 tagk 还是 tagv，只要不一致就分别属于两个 key，例如 host=server01,region=us-west 和 host=server02,region=us-west 就是两个不同的 tag set。
field name: 例如上面数据中的 value 就是 fieldName，InfluxDB 中支持一条数据中插入多个 fieldName，这其实是一个语法上的优化，在实际的底层存储中，是当作多条数据来存储。
timestamp: 每一条数据都需要指定一个时间戳，在 TSM 存储引擎中会特殊对待，以为了优化后续的查询操作。

Point

InfluxDB 中单条插入语句的数据结构，series + timestamp 可以用于区别一个 point，也就是说一个 point 可以有多个 field name 和 field value。

Series

series 相当于是 InfluxDB 中一些数据的集合，在同一个 database 中，retention policy、measurement、tag sets 完全相同的数据同属于一个 series，同一个 series 的数据在物理上会按照时间顺序排列存储在一起。

series 的 key 为 measurement + 所有 tags 的序列化字符串，这个 key 在之后会经常用到。

代码中的结构如下：

type Series struct {
    mu          sync.RWMutex
    Key         string              // series key
    Tags        map[string]string   // tags
    id          uint64              // id
    measurement *Measurement        // measurement
}

Shard

shard 在 InfluxDB 中是一个比较重要的概念，它和 retention policy 相关联。每一个存储策略下会存在许多 shard，每一个 shard 存储一个指定时间段内的数据，并且不重复，例如 7点-8点的数据落入 shard0 中，8点-9点的数据则落入 shard1 中。每一个 shard 都对应一个底层的 tsm 存储引擎，有独立的 cache、wal、tsm file。

创建数据库时会自动创建一个默认存储策略，永久保存数据，对应的在此存储策略下的 shard 所保存的数据的时间段为 7 天，计算的函数如下：

func shardGroupDuration(d time.Duration) time.Duration {
    if d >= 180*24*time.Hour || d == 0 { // 6 months or 0
        return 7 * 24 * time.Hour
    } else if d >= 2*24*time.Hour { // 2 days
        return 1 * 24 * time.Hour
    }
    return 1 * time.Hour
}

如果创建一个新的 retention policy 设置数据的保留时间为 1 天，则单个 shard 所存储数据的时间间隔为 1 小时，超过1个小时的数据会被存放到下一个 shard 中。

组件

TSM 存储引擎主要由几个部分组成： cache、wal、tsm file、compactor。

Shard

shard 并不能算是其中的一个组件，因为这是在 tsm 存储引擎之上的一个概念。在 InfluxDB 中按照数据的时间戳所在的范围，会去创建不同的 shard，每一个 shard 都有自己的 cache、wal、tsm file 以及 compactor，这样做的目的就是为了可以通过时间来快速定位到要查询数据的相关资源，加速查询的过程，并且也让之后的批量删除数据的操作变得非常简单且高效。

在 LSM Tree 中删除数据是通过给指定 key 插入一个删除标记的方式，数据并不立即删除，需要等之后对文件进行压缩合并时才会真正地将数据删除，所以删除大量数据在 LSM Tree 中是一个非常低效的操作。

而在 InfluxDB 中，通过 retention policy 设置数据的保留时间，当检测到一个 shard 中的数据过期后，只需要将这个 shard 的资源释放，相关文件删除即可，这样的做法使得删除过期数据变得非常高效。

Cache

cache 相当于是 LSM Tree 中的 memtable，在内存中是一个简单的 map 结构，这里的 key 为 seriesKey + 分隔符 + filedName，目前代码中的分隔符为 #!~#，entry 相当于是一个按照时间排序的存放实际值的数组，具体结构如下：

type Cache struct {
    commit  sync.Mutex
    mu      sync.RWMutex
    store   map[string]*entry
    size    uint64              // 当前使用内存的大小
    maxSize uint64              // 缓存最大值

    // snapshots are the cache objects that are currently being written to tsm files
    // they're kept in memory while flushing so they can be queried along with the cache.
    // they are read only and should never be modified
    // memtable 快照，用于写入 tsm 文件，只读
    snapshot     *Cache
    snapshotSize uint64
    snapshotting bool

    // This number is the number of pending or failed WriteSnaphot attempts since the last successful one.
    snapshotAttempts int

    stats        *CacheStatistics
    lastSnapshot time.Time
}

插入数据时，实际上是同时往 cache 与 wal 中写入数据，可以认为 cache 是 wal 文件中的数据在内存中的缓存。当 InfluxDB 启动时，会遍历所有的 wal 文件，重新构造 cache，这样即使系统出现故障，也不会导致数据的丢失。

cache 中的数据并不是无限增长的，有一个 maxSize 参数用于控制当 cache 中的数据占用多少内存后就会将数据写入 tsm 文件。如果不配置的话，默认上限为 25MB，每当 cache 中的数据达到阀值后，会将当前的 cache 进行一次快照，之后清空当前 cache 中的内容，再创建一个新的 wal 文件用于写入，剩下的 wal 文件最后会被删除，快照中的数据会经过排序写入一个新的 tsm 文件中。

目前的 cache 的设计有一个问题，当一个快照正在被写入一个新的 tsm 文件时，当前的 cache 由于大量数据写入，又达到了阀值，此时前一次快照还没有完全写入磁盘，InfluxDB 的做法是让后续的写入操作失败，用户需要自己处理，等待恢复后继续写入数据。

WAL

wal 文件的内容与内存中的 cache 相同，其作用就是为了持久化数据，当系统崩溃后可以通过 wal 文件恢复还没有写入到 tsm 文件中的数据。

由于数据是被顺序插入到 wal 文件中，所以写入效率非常高。但是如果写入的数据没有按照时间顺序排列，而是以杂乱无章的方式写入，数据将会根据时间路由到不同的 shard 中，每一个 shard 都有自己的 wal 文件，这样就不再是完全的顺序写入，对性能会有一定影响。看到官方社区有说后续会进行优化，只使用一个 wal 文件，而不是为每一个 shard 创建 wal 文件。

wal 单个文件达到一定大小后会进行分片，创建一个新的 wal 分片文件用于写入数据。

TSM file

单个 tsm file 大小最大为 2GB，用于存放数据。

TSM file 使用了自己设计的格式，对查询性能以及压缩方面进行了很多优化，在后面的章节会具体说明其文件结构。

Compactor

compactor 组件在后台持续运行，每隔 1 秒会检查一次是否有需要压缩合并的数据。

主要进行两种操作，一种是 cache 中的数据大小达到阀值后，进行快照，之后转存到一个新的 tsm 文件中。

另外一种就是合并当前的 tsm 文件，将多个小的 tsm 文件合并成一个，使每一个文件尽量达到单个文件的最大大小，减少文件的数量，并且一些数据的删除操作也是在这个时候完成。

目录与文件结构

InfluxDB 的数据存储主要有三个目录。

默认情况下是 meta, wal 以及 data 三个目录。

meta 用于存储数据库的一些元数据，meta 目录下有一个 meta.db 文件。

wal 目录存放预写日志文件，以 .wal 结尾。data 目录存放实际存储的数据文件，以 .tsm 结尾。这两个目录下的结构是相似的，其基本结构如下：

# wal 目录结构
-- wal
   -- mydb
      -- autogen
         -- 1
            -- _00001.wal
         -- 2
            -- _00035.wal
      -- 2hours
         -- 1
            -- _00001.wal

# data 目录结构
-- data
   -- mydb
      -- autogen
         -- 1
            -- 000000001-000000003.tsm
         -- 2
            -- 000000001-000000001.tsm
      -- 2hours
         -- 1
            -- 000000002-000000002.tsm

其中 mydb 是数据库名称，autogen 和 2hours 是存储策略名称，再下一层目录中的以数字命名的目录是 shard 的 ID 值，比如 autogen 存储策略下有两个 shard，ID 分别为 1 和 2，shard 存储了某一个时间段范围内的数据。再下一级的目录则为具体的文件，分别是 .wal 和 .tsm 结尾的文件。

WAL 文件

wal 文件中的一条数据，对应的是一个 key(measument + tags + fieldName) 下的所有 value 数据，按照时间排序。

Type (1 byte): 表示这个条目中 value 的类型。
Key Len (2 bytes): 指定下面一个字段 key 的长度。
Key (N bytes): 这里的 key 为 measument + tags + fieldName。
Count (4 bytes): 后面紧跟着的是同一个 key 下数据的个数。
Time (8 bytes): 单个 value 的时间戳。
Value (N bytes): value 的具体内容，其中 float64, int64, boolean 都是固定的字节数存储比较简单，通过 Type 字段知道这里 value 的字节数。string 类型比较特殊，对于 string 来说，N bytes 的 Value 部分，前面 4 字节用于存储 string 的长度，剩下的部分才是 string 的实际内容。

TSM 文件

单个 tsm 文件的主要格式如下：

主要分为四个部分： Header, Blocks, Index, Footer。

其中 Index 部分的内容会被缓存在内存中，下面详细说明一下每一个部分的数据结构。

Header

MagicNumber (4 bytes): 用于区分是哪一个存储引擎，目前使用的 tsm1 引擎，MagicNumber 为 0x16D116D1。
Version (1 byte): 目前是 tsm1 引擎，此值固定为 1。

Blocks

Blocks 内部是一些连续的 Block，block 是 InfluxDB 中的最小读取对象，每次读取操作都会读取一个 block。每一个 Block 分为 CRC32 值和 Data 两部分，CRC32 值用于校验 Data 的内容是否有问题。Data 的长度记录在之后的 Index 部分中。

Data 中的内容根据数据类型的不同，在 InfluxDB 中会采用不同的压缩方式，float 值采用了 Gorilla float compression，而 timestamp 因为是一个递增的序列，所以实际上压缩时只需要记录时间的偏移量信息。string 类型的 value 采用了 snappy 算法进行压缩。

Data 的数据解压后的格式为 8 字节的时间戳以及紧跟着的 value，value 根据类型的不同，会占用不同大小的空间，其中 string 为不定长，会在数据开始处存放长度，这一点和 WAL 文件中的格式相同。

Index

Index 存放的是前面 Blocks 里内容的索引。索引条目的顺序是先按照 key 的字典序排序，再按照 time 排序。InfluxDB 在做查询操作时，可以根据 Index 的信息快速定位到 tsm file 中要查询的 block 的位置。

这张图只展示了其中一部分，用结构体来表示的话类似下面的代码：

type BlockIndex struct {
    MinTime     int64
    MaxTime     int64
    Offset      int64
    Size        uint32
}

type KeyIndex struct {
    KeyLen      uint16
    Key         string
    Type        byte
    Count       uint32
    Blocks      []*BlockIndex
}

type Index []*KeyIndex

Key Len (2 bytes): 下面一个字段 key 的长度。
Key (N bytes): 这里的 key 指的是 seriesKey + 分隔符 + fieldName。
Type (1 bytes): fieldName 所对应的 fieldValue 的类型，也就是 Block 中 Data 内的数据的类型。
Count (2 bytes): 后面紧跟着的 Blocks 索引的个数。

后面四个部分是 block 的索引信息，根据 Count 中的个数会重复出现，每个 block 索引固定为 28 字节，按照时间排序。

Min Time (8 bytes): block 中 value 的最小时间戳。
Max Time (8 bytes): block 中 value 的最大时间戳。
Offset (8 bytes): block 在整个 tsm file 中的偏移量。
Size (4 bytes): block 的大小。根据 Offset + Size 字段就可以快速读取出一个 block 中的内容。

间接索引

间接索引只存在于内存中，是为了可以快速定位到一个 key 在详细索引信息中的位置而创建的，可以被用于二分查找来实现快速检索。

offsets 是一个数组，其中存储的值为每一个 key 在 Index 表中的位置，由于 key 的长度固定为 2字节，所以根据这个位置就可以找到该位置上对应的 key 的内容。

当指定一个要查询的 key 时，就可以通过二分查找，定位到其在 Index 表中的位置，再根据要查询的数据的时间进行定位，由于 KeyIndex 中的 BlockIndex 结构是定长的，所以也可以进行一次二分查找，找到要查询的数据所在的 BlockIndex 的内容，之后根据偏移量以及 block 长度就可以从 tsm 文件中快速读取出一个 block 的内容。

Footer

tsm file 的最后8字节的内容存放了 Index 部分的起始位置在 tsm file 中的偏移量，方便将索引信息加载到内存中。

由于内容较多，具体的写入与查询操作的流程，以及部分代码的详解会在下一篇文章中介绍。

作者：fatedier
本文出处：http://blog.fatedier.com/2016/08/05/detailed-in-influxdb-tsm-storage-engine-one/
文章版权归本人所有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文链接，否则保留追究法律责任的权利。

golang
influxdb
数据库

InfluxDB详解之TSM存储引擎解析（二） (2016年08月15日)
go 程序中获取虚拟块设备的读写速度 (2016年08月08日)
golang 中使用 statik 将静态资源编译进二进制文件中 (2016年08月01日)
使用gvm在不同go版本之间切换 (2016年07月25日)
InfluxDB 与 OpenTSDB 对比测试 (2016年07月06日)
时间序列数据库调研之InfluxDB (2016年07月05日)
时间序列数据库调研之OpenTSDB (2016年07月04日)
go程序中dns解析无法使用所有域名服务器 (2016年04月27日)

技术调研：时序数据库（一） myskybeyond 时序数据库时序数据库数据库
选择时序数据库时，选择当下主流的解决方案。目前主流的开源解决方案有InfluxDB、TDengine和TimescaleDB。下文从多个维度对比分析，最终根据需求做出选型决策。1.核心架构与设计理念数据库架构特点核心优势InfluxDB-专为时序数据设计的分布式数据库-基于时间线（TimeSeries）模型-开源版（OSS）与商业版（Cloud/Enterprise）功能差异大高写入吞吐量、原生支
时序数据库选型分析沉默的松饼时序数据库物联网
在当今数字化时代，大量的时间序列数据不断产生，从工业物联网设备的传感器数据，到金融领域的交易记录，再到互联网应用的用户行为日志等。为了高效地存储、管理和分析这些时序数据，选择一款合适的时序数据库至关重要。本文将对几款主流的时序数据库进行选型分析，帮助读者在众多选项中找到最符合自身需求的数据库解决方案。常见时序数据库概述InfluxDBInfluxDB是一款广泛使用的开源时序数据库。它专为处理时间序
Kylin Linux Advanced Server V10 离线安装 Prometheus + Grafana + node_exporter指南晴空06 操作系统管理工具性能测试 kylin linux prometheus
离线安装Prometheus+Grafana+InfluxDB指南(KylinLinuxAdvancedServerV10)最终结果展示准备工作在一台有互联网连接的机器上下载所有必要的安装包和依赖准备一个USB驱动器或内部网络共享位置来传输文件确保目标服务器有足够的资源运行这些服务下载离线安装包在有网络的机器上下载以下组件：Prometheuswgethttps://github.com/prom
时序库总结天一涯数据库
1、常见的时间序列数据库：TSDB项目官网influxDBhttps://influxdata.com/RRDtoolhttp://oss.oetiker.ch/rrdtool/Graphitehttp://graphiteapp.org/OpenTSDBhttp://opentsdb.net/Kdb+http://kx.com/Druidhttp://druid.io/KairosDBhttp:
时序库介绍古朗月行数据库大数据 java
时序库（Time-seriesDatabase，TSDB）是一种专门用于存储和处理时间序列数据的数据库。时间序列数据是一种按照时间先后顺序排列的数据，例如气象数据、生产数据、网络数据等等。常见的时序库有OpenTSDB、InfluxDB、Prometheus等，下面将从基本概念、使用场景、主要特点和使用API等方面进行介绍。基本概念时序数据时序数据是一种按照时间顺序排列的数据，在很多应用场景中都非
InfluxDB 时序数据的高效解决方案后端go
InfluxDB是什么？它是一种开源的数据库，主要针对时间序列数据进行优化，能够高效地存储、检索和分析大量的时间序列数据。InfluxDB使用Tag-Key-Value模型来组织数据，这种模型便于对时间序列数据进行分类和聚合。它支持类SQL的查询语言InfluxQL和Flux，适合复杂查询需求。InfluxDB的架构设计使其在处理高频率、连续的时间序列数据时表现出色，例如监控系统中的指标数据、物联
InfluxDB 3 Core 的安装与基本使用 influxdb数据库
1前言最近做交易回测，考虑到数据是时序型的，因此采用了influxdb，之前没有用过时序型数据库。初次尝试，感觉不错。恰好是influxdb3发布不久，相关文档并不多，因此做下笔记。第三方测试显示，在百万级设备以下场景，写入性能可能不及旧版本，但是这个性能对我来说足矣。2安装安装命令此命令仅适用于Linux和macOS，笔者是在Ubuntu系统安装的。安装完成后influxdb3会立即启动。cur
时序数据库IoTDB数据模型建模实例详解时序数据说时序数据库 iotdb 数据库大数据开源
一、引言本文旨在通过具体实例详细介绍IoTDB（InternetofThingsDatabase）的数据模型建模方法，以解决部分用户对实际系统建模的困惑。IoTDB作为一种时间序列数据库，其数据模型与实时库、InfluxDB、OpenTSDB等基于标签的模型有所不同。二、基于标签的模型概述在实时库、InfluxDB、OpenTSDB等数据库中，每个测点通常有一个由符号"."连接的多个属性值组成的名
QuestDB：开源SQL数据库，用于处理时间序列数据！开源项目精选数据库 sql
QuestDB是一个高性能且开源的SQL数据库，专为时间序列和事件数据而设计。适用于金融服务、物联网、机器学习、DevOps和可观察性应用程序。它包括PostgreSQL行协议的端点，使用InfluxDB行协议的模式无关的高吞吐数据获取方式，用于查询、批量导入导出的RESTAPI。整个代码库使用Java和C++构建，没有依赖项，并且100%没有垃圾收集。Stars数15,308Forks数1,25
数据库领域新趋势：时序数据库崛起数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent 数据库时序数据库网络 ai
数据库领域新趋势：时序数据库崛起关键词：时序数据库、时间序列数据、物联网、金融科技、大数据分析、TSDB、InfluxDB摘要：随着物联网、金融科技等领域的快速发展，时间序列数据的处理需求急剧增长，传统关系型数据库在处理这类数据时面临性能瓶颈。本文深入探讨时序数据库(TimeSeriesDatabase,TSDB)的崛起背景、核心原理、关键技术、应用场景及未来发展趋势。我们将从架构设计、存储引擎、
InfluxDB：一款强大高性能的时序数据库！开源项目精选时序数据库数据库
InfluxDB是一个开源的、高性能的时序型数据库，并且在时序型数据库DB-EnginesRanking上排名第一。专门用于收集、存储、处理和可视化时间序列数据的平台。时间序列数据是按时间顺序索引的数据点序列。数据点通常由同一来源的连续测量组成，用于跟踪随时间的变化。Stars数30,137Forks数3,613主要特点高性能数据存储：InfluxDB的TSM引擎提供了数据的高速读写和压缩功能，使
InfluxQL 详解：面向时间序列数据的查询语言 Leon@Lee 数据库 InfluxDB
一、InfluxQL概述InfluxQL（InfluxDBQueryLanguage）是时序数据库InfluxDB1.x的核心查询语言，专为高效处理时间序列数据设计。其语法类似传统SQL，但针对时序数据的特点（如时间戳、高频写入、聚合分析）做了深度优化，支持快速查询、聚合、过滤和实时分析。二、核心数据模型InfluxDB以时间序列数据模型存储数据，核心概念包括：Measurement（测量）类似传
增强版 InfluxDB Java 通用查询方法（支持跨年数据集）豆芽脚脚 java windows 开发语言
增强版InfluxDBJava通用查询方法（支持跨年数据集）使用influx已经五六年了，线上的数据库已经特别大了，尤其是在遇到资源回收时，磁盘空间占用，导致整个系统无法使用。为此为他进行按年存储，跨年查询，写入数据时需要考虑按年找库存储。为了处理跨年数据集查询，主要考虑以下几点：同时查询多个年份的数据库合并跨年查询结果保持分页准确性以下是增强后的实现方案：importorg.influxdb.I
InfluxDB 高级分析实战：预测、技术指标与异常检测全指南梦想画家数据分析工程 InfluxDB 数据分析
InfluxDB不仅是强大的时序数据存储引擎，更是企业构建智能分析系统的核心平台。本文全面解析如何利用InfluxDB内置函数与Python生态实现：✅预测分析：从简单季节性预测（HOLT_WINTERS）到复杂模型集成（Prophet/LSTM）✅技术指标计算：直接调用内置函数（EMA、KAMA、RSI）实现实时监控✅异常检测：基于统计规则（阈值监控）与机器学习模型（IsolationFores
优化 InfluxDB 写入性能：高效批处理策略实战指南梦想画家数据分析工程 InfluxDB 物联网
在处理高吞吐量时序数据时，合理运用批处理（Batching）策略是提升InfluxDB写入性能的关键。本文介绍时间驱动、大小驱动和混合批处理策略，并通过Python代码示例展示如何优化数据写入，平衡延迟与吞吐量。同时，提供最佳实践，如监控调优、客户端配置优化、错误处理等，帮助读者找到适合自身场景的批处理“甜点”，最大化InfluxDB的写入效率。1.背景：为何批处理对InfluxDB至关重要Inf
influxdb时序数据库太阳上的雨天时序数据库 golang
以下概念及操作均来自influxdb2官方文档InfluxDB2istheplatformpurpose-builttocollect,store,processandvisualizetimeseriesdata.Timeseriesdataisasequenceofdatapointsindexedintimeorder.Datapointstypicallyconsistofsuccessi
CentOS7下Telegraf+InfluxDB+Grafana 搭建服务器监控平台寰宇001 centos 监控/自动化工具
转载来源：作者：DevOps海洋的渔夫链接：https://www.jianshu.com/p/0a8192751dce来源：简书著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。环境：阿里云centos7.5需求近期需要搭建一套服务器性能数据监控平台，所以本次考虑基于Telegraf作为采集数据源的工具，集成使用influxdb存储数据，最后Grafana展示图表的方式，来建立
MySQL与时间序列数据库：InfluxDB对比墨瑾轩一起学学数据库【一】数据库 mysql
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣欢迎来到数据库的奇幻乐园！今天我们要一起探索的是MySQL和InfluxDB这两位数据库世界的明星。想象一下，MySQL就像是一位经验丰富的图书管理员，而InfluxDB则是一位对时间特别敏感的时间管理大师。引言：时间序列数据的挑战时间序列数据记录了随时间变化
Flask+Influxdb+grafna构建电脑性能实时监控系统 Eva215665 flask python 后端
Influx下载地址，这里下载了以下版本influxdb-1.8.5_windows_amd64.zip运行前需要先启动Influx数据库：管理员方式运行cmd->F:->cdF:\influxdb\influxdb-1.8.5-1->influxd-configinfluxdb.conf，以influxdb.conf配置文件启动数据库再以管理员方式重新打开一个cmd->F:->cdF:\infl
TDengine 与其他时序数据库对比：InfluxDB/TimescaleDB 选型指南（二）计算机毕设定制辅导-无忧学长 #TDengine 时序数据库 tdengine 大数据
四、应用场景分析（一）TDengine适用场景TDengine适用于对写入性能和存储效率要求极高的物联网设备数据采集场景。在一个拥有数百万个传感器的智能工厂中，每个传感器每秒都会产生多条数据，TDengine能够高效地处理这些高并发的写入请求，确保数据的实时存储。同时，其领先的压缩算法可以大大降低存储成本，使得长期存储海量的传感器数据成为可能。在工业互联网实时监测方面，TDengine能够实时处理
时序数据库InfluxDB（I）- 搭建与采集信息demo操作起昵称好麻烦
搭建环境：vmwareworkstationpro15.5.0,ubuntu18.04.3实践时间：2019.10.12-10.27（一）时序数据库InfluxDB准备（1）安装曾出现问题：解决方法为：（2）配置文件的位置：可进行InfluxDB缓存大小等参数的设置。（3)服务器端启动：以后台运行的方式启动了InfluxDB的服务端。（4）客户端启动：登入InfluxDB服务器将路径加入环境变量中
Spring Boot 3.4+TDengine 3.0：时序数据存储成本直降80%的架构方案 Bryan Ding spring boot tdengine 架构
某工业物联网平台的运维大屏深夜告警——单日新增37亿条设备日志，月度存储成本突破200万元。技术团队发现，基于InfluxDB的存储架构已逼近物理极限：•写入瓶颈：每秒12万条数据写入导致磁盘IO饱和•存储密度：原始数据与存储空间比仅为1:3，冷数据无法有效分层•查询性能：关键故障定位查询平均耗时8.2秒通过SpringBoot3.4+TDengine3.0的技术重构，该平台实现存储成本下降至38
influxDB基础 triticale influxdb 数据库
一、简单对比InfluxDB是一个由InfluxData开发的开源时序型数据库。使用GO语言开发，特别适合用于处理和分析资源监控数据这种时序相关数据。那么相比于关系型数据库有何优势？1、写入性能提升2、冷热数据分离3、时间不可倒流，数据只写不改二、基本概念Bucket（桶）：Bucket是InfluxDB中的基本存储单元，用于组织和存储时间序列数据。它是数据的逻辑容器，用于区分和隔离不同类型或来源
时序数据库 InfluxDB（六） IT枫斗者 JAVA基础工作中实际总结编程学习时序数据库数据库 oracle java 开发语言
CQ连续查询连续查询ContinuousQueries（CQ）是InfluxDB很重要的一项功能，它的作用是在InfluxDB数据库内部自动定期的执行查询，然后将查询结果存储到指定的measurement里。配置文件中的相关配置：[continuous_queries]enabled=truelog-enabled=truequery-stats-enabled=falserun-interval
解决Centos使用yum命令报错“Cannot find a valid baseurl for repo: base/7/x86_64”问题牛奶咖啡13 运维/测试 centos linux 解决Centos仓库源失效 InfluxDB作服务失败问题 [Errno 256]HTTPS Error 404
一、问题描述我们在使用Centos7.9使用【sudoyuminstallinfluxdb2】命令安装influxDB数据库的时候提示“LoadingmirrorspeedsfromcachedhostfileCouldnotretrievemirrorlisthttp://mirrorlist.centos.org/release=7&arch=x86_64&repo=os&infra=stoc
InfluxDB写入测试 PascalMing 编程 influxdb java 读写测试
早几年测试时序库时，采集数据到kafka，然后用不同数据进行存储验证。Influxdb是花时间比较多的，它的数据建模方法、读写方法都需要使用特殊的API。时间久了自己也经常忘记，把当时的测试关键代码记录下来，也方便日后查找。代码基于java编写。1、接口数据定义，clientid+tag组合必须唯一publicclassKafkaInfo{//客户端idpublicStringclientid;/
DevOps工具链 zhangpeng455547940 devops 运维
DevOps工具链的核心组成部分包括：代码编辑和版本控制工具svn、git自动化构建工具Jenkins、GitLabCI/CD、TravisCI持续集成和持续部署工具Jenkins、Ansible容器编排工具K8S、DockerSwarm持续监控工具Prometheus，Grafana，InfluxDB服务配置管理工具Ansible，Chef，PuppetGit：代码管理Maven：依赖管理、项目
Spring Boot + InfluxDB 批量写入（同步、异步、重试机制）火皇405 spring boot java 后端
1.项目介绍本项目使用SpringBoot+InfluxDB2.x，主要介绍批量写入数据的三种方式：同步写入（BlockingWrite）异步写入（Non-blockingWrite）带重试机制的写入（HandlingErrorswithRetry）适用于高并发数据写入、物联网（IoT）、实时监控等场景。2.InfluxDB连接配置✅application.yml#InfluxDB独立配置infl
使用docker-compose部署时序数据库InfluxDB1.8.4 Heartsuit Docker 云原生容器编排 docker 时序数据库 InfluxDB docker-compose
背景如今InfluxDB已经更新到了2.x，InfluxDB1.x和2.x版本之间有几个主要的区别：数据模型：1.x：使用数据库和保留策略来组织数据。2.x：引入了组织（organizations）和存储桶（buckets）的概念，存储桶同时包含了数据的时间范围和保留策略。查询语言：1.x：使用InfluxQL，这是一种类似于SQL的查询语言。2.x：引入了Flux，这是一种更强大的数据脚本和查询
Java集成InfluxDB 动亦定物联网数据库 java 数据库
1.添加InfluxDB依赖首先，在项目中添加InfluxDB的Java客户端依赖。如果使用Maven，可以在pom.xml中添加以下依赖：com.influxdbinfluxdb-client-java6.3.02.创建InfluxDB客户端接下来，创建InfluxDB客户端实例，用于连接InfluxDB服务器。importcom.influxdb.client.InfluxDBClient;i
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

InfluxDB详解之TSM存储引擎解析（一）

InfluxDB详解之TSM存储引擎解析（一）

概念

组件

目录与文件结构

你可能感兴趣的:(influxdb)