By Jackson@ML
在了解NoSQL之前,先简要介绍一下SQL。
SQL是 Structured Query Language(结构化查询语言)的缩写。
SQL在关系型数据中广泛使用,一些大型关系型数据库,例如:Oracle Database, MySQL, PostgreSQL, Microsoft SQL Server, IBM DB2, SQLite, MariaDB等,均使用SQL语言来创建、修改和删除表,同时,还可以使用SQL语言进行数据库开发,便于用户长期按照特定需求使用关系型数据库。
NoSQL既表示非关系型数据库,又表示不适用SQL(结构化查询语言)。
显而易见,这些数据库采用不同于关系表的格式来存储数据。但是,NOSQL数据库可以使用惯用语言API、声明性结构化查询语言以及按示例查询语言进行查询。
因此,从字面理解,也正是这类数据库被称为不仅仅是SQL数据库的原因所在。
NoSQL数据库的广泛应用,得益于高可用,以及高可扩展性。NoSQL数据库可作为开发人员的首选方案,它能适应不断变化的客户需求,也能够据此进行不断迭代,非常适合敏捷开发。
NoSQL数据库支持以更加直观和易于理解的方式进行数据存储,且在API存储或检索时所需的转换更少。
同时,NoSQL数据库也支持云计算,在云端部署NoSQL数据库可使得企业应用实现零停机。
关系型数据库由多个表组成,而表由列和行组成,是相关数据条目的集合。
表是典型的数据库对象,用来存储结构化数据。因此,关系型数据库需要预先定义好架构,也就是说,需要提前知道所有列以及相关联的数据类型,以便于应用程序将数据写出数据库。
同时,关系型数据库还通过键来链接多个表的信息,从而创建跨越多个表的关系。关系型数据库因而得名。
关系型数据库由Edgar F. Codd于1970年发明,通过为每行关联一个特定的键,将数据排列到不同的行和列中;几乎所有的关系型数据库管理系统(RDBMS)都是用结构化查询语言(SQL),并且非常复杂。
在NoSQL数据库中,则无须预先定义架构,即可存储数据。这意味着数据库可迅速移动和不断迭代,从而动态定义数据模型。
这样的特点,适应特定的业务需求并满足敏捷开发的需要。
NoSQL数据库能够以图形和面向列、面向文档,以及作为键值对进行存储。
在1990年代中期,互联网得到了极大的普及,关系型数据库根本无法跟上用户所需的信息流,以及这种演变产生的更多种类的数据类型。这就导致了非关系型数据库(Non-relational
Database,也成为NoSQL Database)的发展。
对于需要快速创新和迭代应用程序的企业而言,保持敏捷性至关重要,因为这关乎开发到运维的全过程。
NoSQL数据库提供灵活的架构,并且支持各种数据模型,非常适合构建大量数据和快速响应的应用程序,同时要求低延迟,例如:电子商务Web应用程序,或者在线游戏等。
此外,NoSQL数据库可以快速转换“奇怪“的数据(即形态各异的数据),并通过灵活地取代”有组织的“存储来避免SQL的僵化。
NoSQL作为缩略词,于1998年由Carlo Strozzi首次使用。当时,他将轻量级的开源“关系的“数据库命名为不使用SQL。
2009年,当Eric Evans和Johan Oskarsson用它来描述非关系型数据库时,这个名字NoSQL再次出现。
关系型数据库通常关联SQL;因此,新术语NoSQL很直观,就代表”No SQL Systems“(没有SQL系统);也有一种解释,是表示普遍可以接受的“Not only SQL”(不仅仅是SQL)的翻译,以强调某些系统可能支持类似SQL(结构化查询语言)这一既定事实。
NoSQL自诞生起,就是为了响应日益庞大的Web数据,处理非结构化数据的需求,以及应对更加快捷处理的需求而开发的。NoSQL使用分布式数据库系统来处理大量不同类型的数据。
经过二十多年的积累和发展,数字交互和使用已经达到了前所未有的高水平,这就要求企业采用更加现代化且更加流畅的方法来存储数据以及访问数据。全球范围内的用户都要求实现不间断的内容服务及数据流,这就要求数据库也需要具备快速适应的能力。
无论是用户,还是开发人员,选择NoSQL数据库,都基于它的几点明显优势:
SQL 数据库将数据存储在更加严格的预定义结构中。NoSQL 则以更加自由的方式来存储数据,而无需严格的模式。这种设计可支持创新和快速应用开发。开发人员可以专注于创建系统来改善客户服务,无需担心模式。NoSQL 数据库可以轻松处理任何数据格式,例如单一数据存储中的结构化、半结构化和非结构化数据。
NoSQL 数据库可以通过商用硬件来实现横向扩展,而不需要通过添加更多服务器来进行扩展。这可以支持流量增长,从而满足零停机需求。通过横向扩展,NoSQL 数据库可以扩充容量和处理能力,因此成为支持不断变化的数据集的首选方案。
当数据量或流量增长时,NoSQL 数据库的横向扩展架构的优势尤为明显。如下图所示,该架构可实现快速、可预测的个位数毫秒级响应能力。NoSQL 数据库还可以摄取数据并快速可靠地交付数据,因此 NoSQL 数据库可支持应用每天收集 TB 级数据,同时实现高度交互的用户体验。
NoSQL 数据库可自动跨多个服务器、数据中心或云资源复制数据。而这又可以大幅减少用户延迟,而不受其地理位置的限制。此特性还有助于减轻数据库管理的负担,从而腾出时间专注于其他优先事项。
NoSQL 数据库专为具有超高数据存储需求的分布式数据存储而设计。这使得 NoSQL 成为大数据、实时 Web 应用、360 度客户视图、在线购物、在线游戏、物联网、社交网络和在线广告应用的理想方案。
表中的几类NoSQL数据库简要介绍如下。
• 键值数据库(Key-Value Databases)
这是极为灵活的 NoSQL 数据库类型,因为应用可以完全控制 value 字段中存储的内容,没有任何限制。代表性的数据库有Redis,Aerospike, Riak, Project Voldemort。
• 文档数据库(Document-Based Databases)
也称为文档存储或面向文档的数据库,这些数据库用于存储、检索和管理半结构化数据。无需指定文档将包含哪些字段。代表性的数据库有MongoDB,Couchbase Server, CouchDB, Elasticsearch。
• 图形数据库(Graph-Based Databases)
此数据库将数据组织为节点和关系,这将显示节点之间的连接。这支持更加丰富和完整的数据表示。图形数据库应用于社交网络、预订系统和欺诈检测。代表性的数据库有Neo4J, OrientDB, RedisGraph,InfiniteGraph。
• 宽列数据库(Wide Column-Based Databases)
这些数据库以表、行和列的形式来存储和管理数据。它们广泛部署于需要用列格式来捕获无模式数据的应用中。代表性的数据库有Apache Cassandra, Azure Comos DB, HBase, Accumulo。
• 对象数据库(Object-Based Databases)
对象数据库的典型例子是ObjectDB, 它是一个Java对象数据库解决方案,通过内建的Java API支持来完成Java应用程序开发,在客户端-服务器或嵌入式模式下工作。 代表性的对象数据库有ObjectDB, Ninja Database Pro, NeoDB, Objectivity/DB。
• 云和网格数据库(Cloud and Grid Databases)
一种分布式缓存和内存数据网格,构成了云和网格数据库。它管理集群应用程序中的数据,因此每次需要管理数据时,都无需直接查询数据库。代表性的数据库有Oracle Coherence, Infinispan, Hazelcast。
• 多模型数据库(Multi-Model Databases)
有代表性的数据库多模型数据库是ArangoDB, 它是一个开源数据库管理器,既支持键值,文档,又支持图形的数据库模型。代表性的数据库有: MarkLogic, ArangoDB, OrientDB, Azure Cosmos DB, FoundationDB, Couchbase, Apache Ignite。
本文简要介绍了最流行的NoSQL数据库及其主要功能,同时对NoSQL的特点及优势作了阐述。为了适应快速发展的Web站点,尤其是电子商务类网站等,NoSQL数据库可谓是恰当的选择。它能提供敏捷开发、快速响应以及不断迭代的强大功能。
以上列出了主流的各类NoSQL数据库。后续有机会,也会针对MongoDB, Redis等展开讨论。感谢您的关注和点赞。
您的支持,我的动力!
参考文献: