Lakehouse

StarRocks 主键（Primary Key）深度解析

作为新一代湖仓（Lakehouse）加速引擎，StarRocks融合了MPP架构和列式存储引擎的优势，能够支持亿级数据秒级查询响应。

·2025-03-21 03:21

【Docker compose】基于宿主机的Neo4j自动备份

文章目录1、开启自动备份2、恢复1、开启自动备份在宿主机执行：bash#{lakehouse_home}/neo4j_cron.sh自动备份开启如下日志：FriMar701:59:53UTC2025-Checkingifcronjobalreadyexists.FriMar701

roman_日积跬步-终至千里·2025-03-16 12:08

DeepSeek掘金——Deepseek + Lakehouse 架构赋能企业数字化转型

Deepseek+Lakehouse架构最近Deepseek这股风刮得太猛了，本周末的大事莫过于腾讯于2025年2月15日晚开始灰度测试在微信中接入DeepSeek-R1模型。

不二人生·2025-03-07 19:30

湖仓一体化及冷、热、实时三级存储

一、湖仓一体化（Lakehouse）湖仓一体化（Lakehouse）是数据湖（DataLake）与数据仓库（DataWarehouse）的结合，旨在解决传统数据架构中数据孤岛、存储冗余、计算性能不足等问题

麦当当MDD·2025-03-07 12:24

Apache Doris 2.1.6 版本正式发布

2.1.6版本在Lakehouse、异步物化视图、半结构化数据管理持续升级改进，同时在查询优化器、执行引擎、存储管理、数据导入与导出以及权限管理等方面完成了若干修复。欢迎大家下载使用。

SelectDB技术团队·2025-02-14 14:07

Paimon实战 -- paimon原理解析

一.简介ApachePaimon原名FlinkTableStore，2022年1月在ApacheFlink社区从零开始研发，Flink社区希望能够将Flink的Streaming实时计算能力和Lakehouse

阿华田512·2025-02-13 14:06

paimon实战 --核心原理和Flink应用进阶

简介Flink社区希望能够将Flink的Streaming实时计算能力和Lakehouse新架构优势进一步结合，推出新一代的StreamingLakehouse技术，促进数据在数据湖上真正实时流动起来，

阿华田512·2025-02-13 14:36

新型大数据架构之湖仓一体（Lakehouse）架构特性说明——Lakehouse 架构（一）

湖仓一体（Lakehouse）——新的大数据架构模式同时具备数仓与数据湖的优点湖仓一体架构存储层计算层湖仓一体特性单一存储拥有数据仓库的查询性能存算分离开放式架构支持各种数据源类型支持各种使用方式架构简单数据共享

m0_74825238·2025-02-13 05:24

湖仓进化，极速统一｜StarRocks 2024 社区年度报告

延伸阅读：Lakehouse白皮书|从理论到落地的现代数据架构升级指南StarRocks开源三周年：初心不忘，征程不止！

·2025-01-21 17:07

Apache Doris 2.1.6 版本正式发布

2.1.6版本在Lakehouse、异步物化视图、半结构化数据管理持续升级改进，同时在查询优化器、执行引擎、存储管理、数据导入与导出以及权限管理等方面完成了若干修复。欢迎大家下载使用。

·2025-01-21 12:15

StarRocks Awards 2024 年度贡献人物

在过去一年，StarRocks在Lakehouse与AI等关键领域取得了显著进步，其卓越的产品功能极大地简化和提升了数据分析的效率，使得"OneData，AllAnalytics"的愿景变得更加触手可及

·2025-01-21 03:33

StarRocks Lakehouse 快速入门——Apache Iceberg

导读：StarRocksLakehouse快速入门旨在帮助大家快速了解湖仓相关技术，内容涵盖关键特性介绍、独特的优势、使用场景和如何与StarRocks快速构建一套解决方案。最后大家也可以通过用户真实的使用场景来了解StarRocksLakehouse的最佳实践！ApacheIceberg介绍ApacheIceberg是一种为大规模、复杂数据集设计的开源表格式，这些数据集跨越了PB级别的数据。最初

·2025-01-20 22:13

新一代实时神器-Fluss初识及部署

Fluss简介Fluss是一种为实时分析而构建的流式存储，可以用作Lakehouse架构的实时数据层。Fluss支持亚秒级延迟的流式读取和写入，并以列格式存储数据，从而提高查询性能并降低存储成本。

本旺·2025-01-20 06:01

全面解读 Databricks：从架构、引擎到优化策略

导语：Databricks是一家由ApacheSpark创始团队成员创立的公司，同时也是一个统一分析平台，帮助企业构建数据湖与数据仓库一体化（Lakehouse）的架构。

克里斯蒂亚诺罗纳尔多阿维罗·2025-01-19 09:27

兼容 Trino Connector，扩展 Apache Doris 数据源接入能力｜Lakehouse 使用手册

ApacheDoris内置支持包括Hive、Iceberg、Hudi、Paimon、LakeSoul、JDBC在内的多种Catalog，并为其提供原生高性能且稳定的访问能力，以满足与数据湖的集成需求。而随着ApacheDoris用户的增加，新的数据源连接需求也随之增加。因此，从3.0版本开始，ApacheDoris引入了TrinoConnector兼容框架。Trino/Presto作为业界较早应用

vvvae1234·2024-09-11 19:17

StarRocks Lakehouse 快速入门——Apache Paimon

StarRocksLakehouse快速入门指南为您提供了湖仓技术概览，旨在帮助您迅速掌握其核心特性、独特优势和应用场景。本指南将指导您如何高效地利用StarRocks构建解决方案。文章末尾，我们集合了来自阿里云、饿了么、喜马拉雅和同程旅行等行业领导者在StarRocksxPaimonStreamingLakehouse活动中的实战经验分享。通过这些真实案例，您可以更直观地了解如何在实际应用中发挥

StarRocks_labs·2024-09-08 19:20

StarRocks 3.3 重磅发布，Lakehouse 架构发展进入快车道！

StarRocks3.3的发布标志着Lakehouse架构在数据分析领域迈向了一个新的高度。

StarRocks_labs·2024-09-08 19:48

Apache Doris + Iceberg 快速搭建指南｜Lakehouse 使用手册（三）

湖仓一体（DataLakehouse）融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势，能够更加便捷地满足各种数据处理分析的需求。ApacheDoris持续加深与数据湖的融合，已演进出一套成熟的湖仓一体解决方案。我们将通过一系列文章介绍ApacheDoris与各类主流数据湖格式及存储系统的湖仓一体架构搭建指南，包括Hudi、Paimon、Iceberg、OSS、DeltaLake、K

SelectDB技术团队·2024-08-24 10:25

数据湖技术之Paimon

一、简介Flink社区希望能够将Flink的Streaming实时计算能力和Lakehouse新架构优势进一步结合，推出新一代StreamingLakehouse技术，促进数据在数据湖上真正实时流动起来

小枫@码·2024-01-22 17:48

Flink背景

实时数仓近年来，面向分析的数据系统发展迅速，各种新型的OLAP系统开始显露锋芒，数据湖和Lakehouse的概念也变得炙手可热。然而，数据集成仍然是人们通往数据分析之路上的主要障

201001070·2024-01-22 08:31

实战营 | 阿里云 x StarRocks 邀你现场体验云上极速湖仓--深圳站

StarRocks自3.0大版本起，实现了从计算OLAP分析到统一Lakehouse的重大产品能力升级。

Apache Spark中国社区·2024-01-20 12:22

巴别时代基于 Apache Paimon 的 Streaming Lakehouse 的探索与实践

摘要：本文主要介绍巴别时代基于ApachePaimon(Incubating)构建StreamingLakehouse的生产实践经验。我们基于ApachePaimon(Incubating)构建StreamingLakehouse的落地实践主要分为三期：第一期是在调研验证的基础上进行数仓分层，并且上线一些简单的业务验证效果；第二期是实现流式数仓的基础设施建设，以便优先替换当前基于ApacheKaf

Apache Flink·2024-01-20 12:21

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

01背景信息数据湖与传统的数据仓库相比，可以更灵活地处理各种类型的数据，并支持高度可扩展的存储，通常被用于大数据分析。为了支持准实时乃至实时的数据处理，数据湖需要能够快速地接收和存储数据（数据入湖），同时提供低延迟的查询性能以满足分析需求。ApachePaimon和ApacheHudi作为数据湖存储格式，有着高吞吐的写入和低延迟的查询性能，是构建数据湖的常用组件。本文将在阿里云EMR[1]上，针对

Apache Spark中国社区·2024-01-20 12:51

实战营｜阿里云 x StarRocks 邀你现场体验云上极速湖仓--深圳站

StarRocks自3.0大版本起，实现了从计算OLAP分析到统一Lakehouse的重大产品能力升级。

StarRocks_labs·2024-01-13 13:25

实战营｜阿里云 x StarRocks 邀你现场体验云上极速湖仓--深圳站

StarRocks自3.0大版本起，实现了从计算OLAP分析到统一Lakehouse的重大产品能力升级。

阿里云大数据AI技术·2024-01-13 03:22

Apache Paimon:Streaming Lakehouse is Coming

摘要：本文整理自阿里云智能开源表存储负责人，FounderofPaimon，FlinkPMC成员李劲松（花名：之信）、同程旅行大数据专家，ApacheHudi&PaimonContributor吴祥平、汽车之家大数据计算平台负责人邸星星、联通数科大数据高级技术专家，ApachePaimonContributor王云朋在FlinkForwardAsia2023主会场的分享。内容主要分为以下三部分：数

Apache Flink·2024-01-06 08:15

MySQL HeatWave Lakehouse

在今年的OracleCloudWorld,Oracle宣布将发布一款数据库湖仓产品——MySQLHeatWaveLakehouse用以解决存储在数据库之外的文件数据等非结构化数据的查询和处理。MySQLHeatWave是一个完全管理的数据库服务,将事务处理、分析处理和机器学习服务合并到一个MySQL数据库的云服务,提供简单、实时、安全的分析,无需ETL,并且没有延迟。IDC预测,保存在数据库之外的

Running Sun丶·2024-01-02 15:36

Apache Paimon核心原理和Flink应用进阶

1.1简介Flink社区希望能够将Flink的Streaming实时计算能力和Lakehouse新架构优势进一步结合，推出新一代的StreamingLakehouse技术，促进数据在数据湖上真正实时流动起来

王知无(import_bigdata)·2023-12-22 11:57

基于 Flink SQL 和 Paimon 构建流式湖仓新方案

本篇内容主要分为四部分：数据分析架构演进介绍ApachePaimonFlink+Paimon流式湖仓流式湖仓Demo演示数据分析架构演进目前，数据分析架构正在从Hive到Lakehouse的演变。

阿里云大数据AI技术·2023-11-25 15:52

来云栖大会看 “ 云+StarRocks 3.0：极速统一的湖仓新范式 ”

本话题简介：StarRocks3.0开启了从OLAP到Lakehouse演进的新篇章。通过存算分离架构，帮助用户降低存储成本、提升计算

Apache Spark中国社区·2023-11-11 08:49

基于flink 的LakeHouse 2.0湖仓一体架构

基于flink的LakeHouse2.0湖仓一体架构简介Lakehouse是一种结合了数据湖和数据仓库优势的新范式，解决了数据湖的局限性。

活在风浪里~·2023-10-19 17:03

阿里云“玩转云上 StarRocks3.0 湖仓分析”，开启数据分析新范式

StarRocks3.0，实现了从计算OLAP分析到统一Lakehouse的重大产品能力升级。通过存算分离架构，帮助用户降低存储成本、提升计算弹性；通过数据湖

阿里云大数据AI技术·2023-10-16 12:27

系统架构设计：11 论湖仓一体架构及其应用

目录一湖仓一体（Lakehouse）1数据仓库2数据湖3数据仓库和数据湖4湖仓一体（Lakehouse）

Jackilina_Stone·2023-10-10 18:01

深度解析数据湖存储方案Lakehouse架构

简介：从数据仓库、数据湖的优劣势，湖仓一体架构的应用和优势等多方面深度解析Lakehouse架构。

阿里云云栖号·2023-10-09 08:33

Flink Batch SQL Improvements on Lakehouse

本文整理自阿里云研发工程师刘大龙（风离），在StreamingLakehouseMeetup的分享。内容主要分为三个部分：FlinkBatchonPaimon挑战FlinkBatch核心优化后续规划点击查看原文视频&演讲PPT一、FlinkBatchonPaimon挑战众所周知，Paimon在创立之初就是为了解决流式数仓场景的问题。从下面的架构图里我们可以看到，这里有FlinkCDC的高效入湖，F

Apache Flink·2023-09-28 12:55

Flink Batch SQL Improvements on Lakehouse

本文整理自阿里云研发工程师刘大龙（风离），在StreamingLakehouseMeetup的分享。内容主要分为三个部分：FlinkBatchonPaimon挑战FlinkBatch核心优化后续规划点击查看原文视频&演讲PPT一、FlinkBatchonPaimon挑战众所周知，Paimon在创立之初就是为了解决流式数仓场景的问题。从下面的架构图里我们可以看到，这里有FlinkCDC的高效入湖，F

·2023-09-22 12:29

【直播预约中】腾讯大数据 x StarRocks｜构建新一代实时湖仓

随着信息时代的兴起，数据已成为推动业务决策和创新的核心要素；结构化、半结构化等多种类型的数据呈现爆炸式增长，如何高效处理和分析海量数据已经成为关键挑战，结合传统数仓与数据湖优势的湖仓一体（Lakehouse

StarRocks_labs·2023-09-19 04:34

【直播预约中】腾讯大数据 x StarRocks｜构建新一代实时湖仓

随着信息时代的兴起，数据已成为推动业务决策和创新的核心要素；结构化、半结构化等多种类型的数据呈现爆炸式增长，如何高效处理和分析海量数据已经成为关键挑战，结合传统数仓与数据湖优势的湖仓一体（Lakehouse

·2023-09-18 21:54

长安汽车：基于云器Lakehouse一体化数据平台，建立智能互联时代的领先优势丨案例研究

长安汽车智能化研究院是中国长安汽车集团有限责任公司旗下专注于汽车智能化技术研究和创新的研发机构。其愿景是通过持续创新和技术突破，实现汽车智能驾驶、智能网联和智能交通的全面发展，提供更安全、更便捷、更智能的出行体验，并成为中国汽车智能化领域的领军企业。智能化是汽车工业发展近百年来对汽车功能的一次重新定义，它旨在利用大数据、人工智能、云计算、物联网等数字技术，对汽车设备和系统的运行状态进行全方位的感知

ifenxi爱分析·2023-09-17 20:23

Data Lakehouse的未来-开放

Cloudera客户运行着地球上一些最大的数据湖。这些数据湖为关键任务大规模数据分析、商业智能(BI)和机器学习用例（包括企业数据仓库）提供动力。近年来，创造了“数据湖仓（DataLakehouse）”一词来描述这种对数据湖中的数据进行表格分析的架构模式。在急于拥有这个术语的过程中，许多供应商忽略了这样一个事实，即数据架构的开放性是其持久性和寿命的保证。1.关于数据仓库和数据湖数据湖和数据仓库将大

大数据杂货铺·2023-09-16 09:22

流式数据湖平台—Paimon视频教程

ApachePaimon是一个流数据湖平台，是Streaming实时计算能力和Lakehouse新架构优势的结合，具有高速数据摄取、变更日志跟踪和高效的实时分析能力。

尚硅谷铁粉·2023-08-30 03:50

Apache Paimon 实时数据湖 Streaming Lakehouse 的存储底座

摘要：本文整理自阿里云开源大数据表存储团队负责人，阿里巴巴高级技术专家李劲松（之信），在StreamingLakehouseMeetup的分享。内容主要分为四个部分：流计算邂逅数据湖PaimonCDC实时入湖Paimon不止CDC入湖总结与生态点击查看原文视频&演讲PPT一、流计算邂逅数据湖流计算1.0实时预处理流计算1.0架构截止到现在也是非常主流的实时数仓中的一个实时预处理的功能，可以通过流计

Apache Flink·2023-08-23 07:58

Apache Paimon 实时数据湖 Streaming Lakehouse 的存储底座

摘要：本文整理自阿里云开源大数据表存储团队负责人，阿里巴巴高级技术专家李劲松（之信），在StreamingLakehouseMeetup的分享。内容主要分为四个部分：流计算邂逅数据湖PaimonCDC实时入湖Paimon不止CDC入湖总结与生态点击查看原文视频&演讲PPT一、流计算邂逅数据湖流计算1.0实时预处理流计算1.0架构截止到现在也是非常主流的实时数仓中的一个实时预处理的功能，可以通过流计

·2023-08-22 10:14

腾讯云对象存储联合DataBend云数仓打通数据湖和数据仓库

在Gartner发布的《HypeCycleforDataManagement2021》中，湖仓一体（Lakehouse）首次被纳入到技术成熟度曲线中。

·2023-08-21 15:18

巴别时代基于 Apache Paimon 的 Streaming Lakehouse 的探索与实践

摘要：本文主要介绍巴别时代基于ApachePaimon(Incubating)构建StreamingLakehouse的生产实践经验。我们基于ApachePaimon(Incubating)构建StreamingLakehouse的落地实践主要分为三期：第一期是在调研验证的基础上进行数仓分层，并且上线一些简单的业务验证效果；第二期是实现流式数仓的基础设施建设，以便优先替换当前基于ApacheKaf

·2023-08-15 18:41

Apache Paimon 学习笔记

1概述1.1简介Flink社区希望能够将Flink的Streaming实时计算能力和Lakehouse新架构优势进一步结合，推出新一代的StreamingLakehouse技术，促进数据在数据湖上真正实时流动起来

第一片心意·2023-08-10 10:55

回顾｜Streaming Lakehouse Meetup · 北京站（附问题解答 & PPT 下载）

Apache Flink·2023-08-10 07:30

Kyuubi的介绍优势（官网链接）

官网链接：https://kyuubi.apache.org/ApacheKyuubi™是一个分布式多租户网关，用于在数据仓库和Lakehouse上提供无服务器SQL。

墨卿风竹·2023-07-21 00:07

加速LakeHouse ACID Upsert的新写时复制方案

概述随着存储表格式ApacheHudi、ApacheIceberg和DeltaLake的发展，越来越多的公司正在这些格式的基础上构建其Lakehouse，以用于许多用例，例如增量摄取。

系统免驱动·2023-07-19 11:10

腾讯云对象存储联合DataBend云数仓打通数据湖和数据仓库

在Gartner发布的《HypeCycleforDataManagement2021》中，湖仓一体（Lakehouse）首次被纳入到技术成熟度曲线中。

云存储小天使·2023-07-17 15:54

推荐频道

Lakehouse

StarRocks 主键（Primary Key）深度解析

【Docker compose】基于宿主机的Neo4j自动备份

DeepSeek掘金——Deepseek + Lakehouse 架构 赋能企业数字化转型

湖仓一体化及冷、热、实时三级存储

Apache Doris 2.1.6 版本正式发布

Paimon实战 -- paimon原理解析

paimon实战 --核心原理和Flink应用进阶

新型大数据架构之湖仓一体（Lakehouse）架构特性说明——Lakehouse 架构（一）

湖仓进化，极速统一｜StarRocks 2024 社区年度报告

Apache Doris 2.1.6 版本正式发布

StarRocks Awards 2024 年度贡献人物

StarRocks Lakehouse 快速入门——Apache Iceberg

新一代实时神器-Fluss初识及部署

全面解读 Databricks：从架构、引擎到优化策略

兼容 Trino Connector，扩展 Apache Doris 数据源接入能力｜Lakehouse 使用手册

StarRocks Lakehouse 快速入门——Apache Paimon

StarRocks 3.3 重磅发布，Lakehouse 架构发展进入快车道！

Apache Doris + Iceberg 快速搭建指南｜Lakehouse 使用手册（三）

数据湖技术之Paimon

Flink背景

实战营 | 阿里云 x StarRocks 邀你现场体验云上极速湖仓--深圳站

巴别时代基于 Apache Paimon 的 Streaming Lakehouse 的探索与实践

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

实战营｜阿里云 x StarRocks 邀你现场体验云上极速湖仓--深圳站

实战营｜阿里云 x StarRocks 邀你现场体验云上极速湖仓--深圳站

Apache Paimon:Streaming Lakehouse is Coming

MySQL HeatWave Lakehouse

Apache Paimon核心原理和Flink应用进阶

基于 Flink SQL 和 Paimon 构建流式湖仓新方案

来云栖大会看 “ 云+StarRocks 3.0：极速统一的湖仓新范式 ”

基于flink 的LakeHouse 2.0湖仓一体架构

阿里云“玩转云上 StarRocks3.0 湖仓分析”，开启数据分析新范式

系统架构设计：11 论湖仓一体架构及其应用

深度解析数据湖存储方案Lakehouse架构

Flink Batch SQL Improvements on Lakehouse

Flink Batch SQL Improvements on Lakehouse

【直播预约中】 腾讯大数据 x StarRocks｜构建新一代实时湖仓

【直播预约中】 腾讯大数据 x StarRocks｜构建新一代实时湖仓

长安汽车：基于云器Lakehouse一体化数据平台，建立智能互联时代的领先优势丨案例研究

Data Lakehouse的未来-开放

流式数据湖平台—Paimon视频教程

Apache Paimon 实时数据湖 Streaming Lakehouse 的存储底座

Apache Paimon 实时数据湖 Streaming Lakehouse 的存储底座

腾讯云对象存储联合DataBend云数仓打通数据湖和数据仓库

巴别时代基于 Apache Paimon 的 Streaming Lakehouse 的探索与实践

Apache Paimon 学习笔记

回顾｜Streaming Lakehouse Meetup · 北京站（附问题解答 & PPT 下载）

Kyuubi的介绍优势（官网链接）

加速LakeHouse ACID Upsert的新写时复制方案

腾讯云对象存储联合DataBend云数仓打通数据湖和数据仓库

DeepSeek掘金——Deepseek + Lakehouse 架构赋能企业数字化转型

【直播预约中】腾讯大数据 x StarRocks｜构建新一代实时湖仓

【直播预约中】腾讯大数据 x StarRocks｜构建新一代实时湖仓