【技术预研】StarRocks官方文档浅析(1)

背景说明

基于starRocks官方文档,对其内容进行一定解析,方便大家理解和使用。
若无特殊标注,startRocks版本是3.2。
下面的章节和官方文档保持一致。

参考文档

产品简介 | StarRocks

StarRocks

StarRocks 是一款高性能分析型数据仓库,使用向量化、MPP 架构、CBO、智能物化视图、可实时更新的列式存储引擎等技术实现多维、实时、高并发的数据分析。StarRocks 既支持从各类实时和离线的数据源高效导入数据,也支持直接分析数据湖上各种格式的数据。StarRocks 兼容 MySQL 协议,可使用 MySQL 客户端和常用 BI 工具对接。同时 StarRocks 具备水平扩展,高可用、高可靠、易运维等特性。广泛应用于实时数仓、OLAP 报表、数据湖分析等场景。

内容 说明
高性能分析型数据仓库 相比于oltp,更适合olap
向量化 基于CPU层级的优化(clickhouse有相关优化)
MPP 架构 相比于hadoop架构更适合olap
CBO 优化多表join的执行时,starRocks内部的执行先后顺序
智能物化视图 用于实现单表的实时数据转换,类似clickhouse的物化视图
可实时更新的列式存储引擎 可支持实时update
兼容 MySQL 可使用mysql相关语法和client工具

产品介绍

什么是 StarRocks

新一代极速全场景 MPP (Massively Parallel Processing) 数据库
数据分析变得更加简单和敏捷
查询速度(尤其是多表关联查询)远超同类产品

上述是描述中的关键词,可以看出来starRocks的定位。功能比较完成的MPP数据库,在多表关联有优势,其他方面至少持平。
适用场景:olap多维分析、实时数据仓库、高并发查询、统一分析

系统架构

这里暂时不展开说,就是两种模式。正常就是存算一体,就是starRocks还是标准的数据库。3.0以后支持存算分离,就是starRocks只是作为计算框架,已经不是正常的数据库了。

产品特性

这里的内容和最开始的说明差不多。多出来的数据湖分析,相当于存算分离的应用的场景。

  • MPP 分布式执行框架
  • 全面向量化执行引擎
  • 存储计算分离
  • CBO 优化器
  • 可实时更新的列式存储引擎
  • 智能的物化视图
  • 数据湖分析

快速开始

使用 Docker 部署 StarRocks

不是一个标准安装,只是入门使用,用于尝试下面的创建表、导入和查询数据。
只安装了一个FE和BE,简单说不是集群模式。

创建表

从登录、创建数据库、创建表、修改表等常用功能都包含,可以用来熟悉。

导入和查询数据

提供5种导入方式,以及简单查询。

项目协助

社区聊天

指向starrocks.slack.com

部署StarRocks

前期准备

说明需要的CPU、内存、存储、网络、操作系统等信息,以及FE、BE、CN的配置说明。
环境检查的相关的命令,以及如何获取部署文件。

存算一体模式部署

三种安装模式。一是手动自己安装,二是基于starRocks的管理工具,三是基于k8s的管理工具。

存算分离模式部署

基于不同存储介质的部署,包含S3、GCS、Blob、MinIO、HDFS等。

后期管理

部署后的设置信息。
如何升级和回滚版本。

你可能感兴趣的:(大数据,starRocks,数据库,大数据,starRocks,数据库)