数据库是什么?

数据库是存储、调用、分析数据的仓库,主要分为关系数据库和非关系数据库。在商业数据分析中使用的绝大部分数据都来自企业的数据库,数据库负责数据收集、数据整合、数据调用等工作,而且几乎所有数据分析类工具都支持调用数据库中的数据。

数据库也是表的集合,一个数据库里面可以储存多张表。

用于建立、使用和维护数据库的大型软件称为数据库管理系统(DBMS)。

数据库可以分成关系型数据库和非关系型数据库。

(1)关系型数据库

关系型数据库用来存放结构化数据的数据库。关系数据库以行和列的形式存储数据,这以系列的行和列被称为表,一组表组成了数据库。其数据来源是公司日常业务系统,以及网站、APP等各种客户端应用程序所产生的实时的数据。

关系数据库通过关系模型来组织表中的数据,本质就是该表的结构,比如订单表的关系模式可以描述为订单表(订单号、购买用户ID、购买金额、数量、下单时间、付款时间)。

结构化语言(SQL)是所有关系数据库的操作语言,分析人员使用SQL对关系数据库进行数据收集、数据整合、数据加工等工作。

当前市面上使用的主流的关系数据库有:

①DB2:非开源的付费数据库管理系统,有限制功能的免费版本,主要应用于大型应用系统,伸缩性较好,支持从大型机到单用户环境,提供高层级的数据利用性,速度快,可靠性好,处理海量数据急速高效,拥有很强的网络支持能力,适用于大中型企业。

②Oracle:非开源的付费数据库管理系统,有限制功能的免费版本,能在所有的主流平台运行,可扩展性强,具有完整的数据管理功能,运行稳定,安全性和性能都在数据库中名列前茅,适用于大型企业。

③MySQL:开放源代码的数据库管理系统,具有成本低、速度快等特性,同时它所提供的功能也可以满足大部分业务需求。

④SQL Server:非开源的付费数据库管理系统,有限制功能的免费版本,与同为微软旗下的产品和系统平台交互较好,适用于中小型企业。

(2)非关系数据库

非关系数据库是用来存放非结构化数据的数据库,采取开放式结构来存储数据,常用的存储标准由键值对,即键(Key)对应值(Value),且对应的值可以采取不同的长度和类型。

这些数据大部分来自企业系统之外,如我们通过聊天APP进行交流时,会产生语音、图片类的非结构化数据,当APP需要开发语音识别功能时,就会需要从非关系数据库中获取语音信息。

非结构化数据可以是视频格式,如短视频、直播录制等;也可以是图片格式,如手机和照相机拍摄的图片、患者的影像图片等;还可以是音频信息,如会议录音、医生的口述诊疗记录等。所以非关系数据库操作语言并不统一,且针对不同的应用场景有不同的数据库应用系统。

主流的非关系数据库有MongoDB、HBase等。

你可能感兴趣的:(数据库是什么?)