微服务 OLAP 大数据中台架构演进

架构

数据中台架构
有赞数据仓库实践之路
百亿大表任意维度查询,如何做到毫秒级返回?
数据仓库、数据湖、流批一体,终于有大神讲清楚了

存储层:

Hadoop hdfs
Elasticsearch
Redis
kafka

计算层:

Hive 离线批处理
Spark 实时计算

统一批计算和实时计算
Flink
基于 Apache Flink 和规则引擎的实时风控解决方案 ​
日均百亿级日志处理:微博基于Flink的实时计算平台建设
基于Flink的超大规模在线实时反欺诈系统的建设与实践

查询

亿级列式数据库:
Hbase
HBase 基础

亿级实时查询:
SparkSQL

亿级多数据源级联实时查询
Presto
Presto 在有赞的实践之路

百亿级实时查询:
ClickHouse
彪悍开源的分析数据库-ClickHouse
趣头条基于ClickHouse玩转每天1000亿数据量

Druid
Flink+Druid构建实时OLAP的探索

OLTP与OLAP结合的 HTAP DRDS

百万TPS高吞吐、秒级低延迟,阿里​搜索离线平台如何实现?

ETL接入层

DataX

算法平台

Alink

消息队列

Kafka

日志处理 ELK

Elasticsearch
logstash
kibana

调度层

Airflow
如何使用Airflow调度数据科学工作流
Airflow中文文档
AirFlow简介

你可能感兴趣的:(大数据)