没错,这次是数据库相关三连,很类似所以也很容易混淆,一起来看看吧~
1.什么是RDS,什么是DynamoDB,什么又是Elasticache呢?
-
Amazon Relational Database Service (RDS)
-
所谓的RDS就是AWS提供给我们支持的一些关系型数据库啦:
SQL Server、Oracle、MySQL Server、PostgreSQL、Aurora、MariaDB
在关系型数据库中我们可以用列来定义一些预设参数,比如姓名,性别,地址,年龄等信息;并且每一行来代表不同的实体,比如张三的信息,李四的信息。行和列就构成了数据的集合。
AWS会为RDS提供高性能、高可用、安全和兼容性,我们不需要管理任何操作系统层面的东西,不需要为OS打补丁和更新,而是直接管理RDS程序和版本。
-
-
Amazon DynamoDB
DynamoDB 是一项快速灵活的 NoSQL 数据库服务,适合所有需要一致性且延迟低于 10 毫秒的任意规模的应用程序。
NoSQL指非关系型数据库,主要用于超大规模数据的存储,这些数据没有固定的模式。
NoSQL 无需事先为要存储的数据建立字段,随时可以存储自定义的数据格式。而在关系数据库里,增删字段是一件非常麻烦的事情。
在下面我们还会有一些简单的介绍
-
Elasticache
Elasticache是AWS提供的分布式对象缓存系统,可以有效地提升现有应用程序的性能。利用Elasticache,用户可以从高吞吐和低延迟的内存数据存储中检索数据,
一般来说我们会把相对来说更新频繁的“热数据”放在Elasticache中,把“冷数据”还是放在数据库中,以支持及时的更新。
目前Elasticache支持两种引擎: Memcached、Redis
虽然Redis不是仅可以用来进行缓存,但是在AWS这里,既然有DynamoDB,如果有用到NoSQL的场景,还是用DynamoDB吧
缓存与数据库的一致性一直是一个大问题,纵使我们有多种方法去解决,但是无疑会增加系统的复杂度,所以在用缓存前请考虑:系统真的非缓存不可吗?用了缓存之后数据的一致性怎么解决?如何解决缓存的击穿、穿透、雪崩?etc.
缓存和读写分离都是在读多写少情况下,解决数据库负载过高的解决方案,但是并不是说一有性能问题就上缓存、读写分离,而是应该先优化,例如优化慢查询,调整不合理的业务逻辑,只有确定系统没有优化空间后,先考虑缓存(因为缓存比读写分离更更容易实现),才考虑读写分离或者集群
2.AWS RDS的备份和还原的方法?
AWS提供了两种备份和还原数据库的方法——自动备份和手动快照
-
自动备份
就如同这个名字所说的,自动备份我们可以自己设置时间来进行备份,一般会选择业务比较少的时间段,因为会在备份的时候造成主数据库的I/O暂停几秒钟,但是如果开了多可用区部署,那么就没有这个问题,因为他会从备用可用区的实例来备份。
备份会保留7-35天,取决于设置,在这个时间段内我们还原任意的秒数。如下图所示
-
手动快照
不同于自动备份,我们可以在任何时候手动拍摄快照,我们仅能恢复到拍这个快照的时间段,不能选其他的时间。
快照会一直保留,直到手动将他删除。
3.RDS的Multiple-AZ和Read Replica的区别
由于备份在备用机上进行,因此对于多可用区数据库部署,不会出现 I/O 暂停。
-
Multiple-AZ(多可用区部署)
以此部署的RDS,数据库会将更新同步地更新到多个可用区的备用副本中,如果遇到正在读写的可用区故障,RDS会自动转移到备用副本,这种同步和自动转移完全是个黑盒,我们无需与备用的其他可用区副本交互,并且他们也不能用来服务读取流量。(对于上一节的问题,多可用区部署会在备用可用区的实例来备份,所以不会有I/O的问题)。
因为是同步复制的,相对于单一可用区的部署,延迟会有所上升。
再次强调,这里的备用副本不可读,他只作为高可用的备份存在。
-
Read Replica(只读实例)
只读实例需要在自动备份开启的状态下才能生效
只读实例是异步复制
创建只读实例后,如果需要将读请求转发到此数据库,则需要我们在代码里进行更改请求的终端。
4.DynamoDB超简单介绍
如果要使用DynamoDB,还是得参考官方文档,这里只是作一些简单的介绍:https://docs.aws.amazon.com/zh_cn/amazondynamodb/latest/developerguide/Introduction.html
DynamoDB 是一种适用于任何规模的非关系型数据库服务。使用 DynamoDB,客户可以将运行和扩展分布式数据库的管理工作负担交给 AWS,因而无需担心硬件预置、设置和配置、吞吐容量规划、复制、软件修补或集群扩展等问题。
DynamoDB 可自动扩展吞吐容量以满足工作负载需求,并随着表大小的增长对数据进行分区和再分区。DynamoDB 还可在一个 AWS 区域的三个数据中心之间同步复制数据,以此提供高可用性和数据持久性。
如下图所示,DynamoDB可以随意更改表结构。
4.1DynamoDB的一致性读取:
可以按需配置DynamoDB的读取方式
-
最终一致性读取(默认)
最终一致性选项可以最大程度地提高读取吞吐量。
写入后立即读取可能读不到最近的一次写入,所有数据副本通常在一秒内达到一致。
-
强一致性读取
- 在写入数据到DynamoDB之后马上读取该数据,会等所有写入操作以及数据同步全部完成后再回馈结果
5.再补个课,OLTP和OLAP的区别?
-
联机事务处理OLTP(Online Transaction Processing)
OLTP主要用来记录某类业务事件的发生,如购买行为,当行为产生后,系统会记录是谁在何时何地做了何事。
OLTP是传统的关系数据库的主要应用,是基本的日常事务处理,例如银行交易等。
-
联机分析处理OLAP(Online Analytics Processing)
OLAP是数据仓库(Data Warehousing)系统的主要应用,支持复杂的分析操作,侧重决策支持,并且能提供直观易懂的查询结果。OLAP是用来做商业智能(Business Intelligence)方面的分析的。
OLAP常用的流行工具是AWS Redshift, Greenplum, Hive等
当电商发展到一定的规模,运营者/管理层需要做更加精细的用户群体分析,比如“20-30岁的男性在过去一年内的购买行为与电商促销活动之间的关系”,那么就要用到数据仓库了。