从AliHbase到Lindorm,阿里大规模存储产品演进

此篇来自全球互联网架构大会(GIAC)的分享— — 栾小凡-从AliHbase到Lindorm,阿里大规模存储产品演进

简单介绍一下作者
栾小凡 花名:轶俗
专注于数据库存储领域,曾就职于Oracle,HEDVIG,研发过Cassandra,AliHBase等多款开源大数据数据库产品
目前负责阿里巴巴新一代大规模高吞吐NoSQL数据库Lindorm的研发工作

过去 10 年,随着互联网技术的快速发展,数据库呈现井喷式发展,出现了各式各样的产品,如文件存储数据库、列存储数据库、NewSQL 数据库。之所以如此,归结于数据量不断快速膨胀,传统数据库在大数据上的处理性能不能满足需求等。企业和开发者趋于去针对不同应用类型开发不同的数据库,来满足对特定数据处理的需求。

DT时代的背景下,催生了很多数据行业,同时也是对存储产品的一种挑战,起初阿里选择HBase,依托Hadoop社区,紧密结合实时计算,时序时空,图等场景,读写性能优秀,支持批量导入,无需分库分表,存储计算分离,成本低,弹性好的特点,在当时怎么看都是一款量身打造的好产品。

随着时代的发展HBase的缺点也体现出来了:
Row Key设计复杂,无数据类型缺乏约束。只能基于主键查询,不能很好支持复杂业务场景
读写毛刺影响业务使用体感
客户端逻辑过重,CPU承载高,客户端需要直连ZK,Meta表获取路由信息,出现BUG难以排查
主备集群切换无法保证一致性,备集群只接受复制流量,资源严重浪费

现在阿里选择了在线海量数据处理分布式数据库 —— Lindorm
Lindorm 是新一代面向在线海量数据处理的分布式数据库,阿里的技术专家通过分享这些多种场景下的数据存储技术实践,帮助企业更好地理解各种数据存储技术的特点,针对自己的业务发展对数据存储技术进行选择和组合。

Lindorm–DT时代大多数的选择
从AliHbase到Lindorm,阿里大规模存储产品演进_第1张图片从AliHbase到Lindorm,阿里大规模存储产品演进_第2张图片

Lindorm核心技术——多一致等级
从AliHbase到Lindorm,阿里大规模存储产品演进_第3张图片
从AliHbase到Lindorm,阿里大规模存储产品演进_第4张图片
Lindorm核心技术——Replica Consensus
从AliHbase到Lindorm,阿里大规模存储产品演进_第5张图片

Lindorm核心技术——多一致-设计思路

1.存储分离

成本低

弹性强

负载更加均衡

抗热点能力更强

2.极致解耦

日志与状态机解耦

备副本状态机的更新与主副本核心写链路解耦

多Zone间各副本Flush,Compact,Split/Merge,故障恢复解耦

Lindorm核心技术——多一致-技术挑战
从AliHbase到Lindorm,阿里大规模存储产品演进_第6张图片
Lindorm核心技术——多一致等级
从AliHbase到Lindorm,阿里大规模存储产品演进_第7张图片
Lindorm核心技术——全局一致二级索引

从AliHbase到Lindorm,阿里大规模存储产品演进_第8张图片

Lindorm核心技术——多存储引擎

从AliHbase到Lindorm,阿里大规模存储产品演进_第9张图片

Lindorm核心技术——性能优化
从AliHbase到Lindorm,阿里大规模存储产品演进_第10张图片
从AliHbase到Lindorm,阿里大规模存储产品演进_第11张图片
Lindorm核心技术——功能提升
从AliHbase到Lindorm,阿里大规模存储产品演进_第12张图片
从AliHbase到Lindorm,阿里大规模存储产品演进_第13张图片

中国HBase技术社区第九届meetup-HBase典型应用场景与实践(北京站)!

时间:2018年12月23日 14:00 - 18:00

地点:(北京朝阳)360公司 A座一层发布厅
从AliHbase到Lindorm,阿里大规模存储产品演进_第14张图片
关注示说网订阅号,了解更多技术信息,获取大数据技术交流群!
从AliHbase到Lindorm,阿里大规模存储产品演进_第15张图片

你可能感兴趣的:(大数据,示说网大数据分享专栏)