近年来,伴随着互联网、大数据、云计算、人工智能等新兴产业的兴起和快速发展,大量新的应用场景不断涌现,这对数据库及更广泛的数据存储计算平台提出了诸多挑战,许多新的数据库产品及技术也随之产生。
数据库领域涌现出NoSQL、NewSQL、结构化数据、半结构化数据、图数据库、MPP数据库、列存储等越来越多的专业新词。概念的日益复杂及越来越多样化的产品给用户的产品选型带来了不小困扰。
用户该如何进行数据库产品选型?搞懂了以下几个方面,相信大家就能作出客观、准确的选择。
一、应用系统对数据库存在哪些需求及变化?
应用系统直接服务于业务需求。数据库作为应用系统中数据存储计算的承载组件,主要负责业务涉及到的各类数据的存储及管理功能。
正如“程序=数据结构+算法”,业务及应用系统对数据库这一“程序”的核心功能需求可以概括为:需处理的数据模型(格式)、需处理的应用场景(即需执行的数据操作)。除功能需求以外,业务及应用系统对数据库最重要的需要是性能需求。
用公式表达即:
应用系统对数据库的核心需求=功能需求+性能需求
功能需求=数据模型需求+数据操作需求
1、功能需求
功能需求分为数据模型需求和数据操作需求,我们一一进行阐述。
1)数据模型需求
现实世界的数据千差万别,应用系统要对数据进行处理,首先需要将数据抽象成一些数据模型。我们通常说的结构化数据、半结构化数据、非结构化数据就是指的数据模型。
2)数据操作需求
数据操作需求是指需处理的应用场景。互联网、云计算、大数据、人工智能这些产业的发展带来了大量的应用创新,他们是要解决一些以前未被解决或未被很好解决的应用场景问题。下表为目前业界典型的一些应用场景:
2、性能需求
性能需求主要包括数据规模需求、并发吞吐量需求、响应时间需求三大部分。目前,业界新应用场景的性能需求呈现以下变化:
二、市面上存在哪些典型的数据库产品?
技术服务于应用需求。针对应用场景的上述功能及性能方面的需求(数据模型、数据操作、性能需求),业界产生了大量行之有效的数据库产品。所有数据库产品,根本上都是在解决客户的数据操作和数据模型两方面的问题。
下图概括了业界经验证有效的数据库产品与其解决的应用需求之间的匹配关系:
虽然各家技术路线有所差异,但基本上都是通过软优化和软硬结合优化两种方法提高产品的功能、性能和性价比。
1、软优化
从软件设计优化的角度看,这些产品主要涉及数据存储组织、数据计算两方面的技术。我们所说的行列存储、KV数据库、图数据都属于这个范畴。
2、软硬结合优化
从充分利用硬件优化整体能力的角度看,这些数据库产品重点通过多核、多CPU、服务器集群、内存、GPU等硬件提高系统处理能力。我们所说的内存数据库、分布式数据库、数据库集群、大规模并行处理(MPP)等都属于这个范畴。
篇幅所限,具体细节我们不在此展开,后续将逐步专题论述。
三、数据库产品应如何选型?
重点来了,面对市面上众多可供选择的数据库产品及方案,我们的选型首先要遵循两大原则:
1、世界上没有万能的数据库
目前,数据格式、应用场景纷繁复杂,已经不存在一种技术体系或某款产品能解决所有数据存储计算问题的情况了, One Size Does Not Fit All。所谓的万能数据库,很多时候只是“蹭热点”、“傍大款
”、“放大炮”的一种营销手段。
2、选数据库得看具体需求,而非求新求热
不同行业的信息化发展阶段需求不一,要根据本领域的具体需求选择最合适的产品,而不是求新求热。
前面第一部分应用系统对数据库的核心需求中提到的众多新需求并不适用于所有行业,相应的解决方案也不是对所有领域都有意义,需要根据具体情况具体选择。
具体该如何进行数据库选型,笔者认为可以分为三个步骤:
a、确定对支撑产品的需求
从业务涉及的数据模型(格式)、业务的数据操作特点、业务负载压力三方面确定提供支撑的数据库产品的需求;
b、遵循“什么数据模型就用什么库”的原则
在进行数据库产品和技术选择时,基本可以秉持 “什么数据模型,就用什么库”的原则。前文提到的“应用需求与数据库产品匹配一览表”可帮我们确定主要的候选数据库产品;
c、通过实测、调研确定产品功能性能效果,作出最终选择
前两步的筛选帮我们确定了一个大致方向。最后,我们要通过调研、实测确定候选产品的功能及性能效果,对这些产品进行能力及性价比的排名,以此作出最终选择。
综上所述,数据库选型是一项专业性很强的工作。作为中国领先的数据管理软件与服务提供商,人大金仓始终坚持“以客户为中心”原则,愿为您提供专业的技术咨询与产品服务,帮您作出最佳选择。