RDS&DynamoDB&Elasticache

没错,这次是数据库相关三连,很类似所以也很容易混淆,一起来看看吧~

1.什么是RDS,什么是DynamoDB,什么又是Elasticache呢?

  • Amazon Relational Database Service (RDS)

    • 所谓的RDS就是AWS提供给我们支持的一些关系型数据库啦:

      SQL Server、Oracle、MySQL Server、PostgreSQL、Aurora、MariaDB

    • 关系型数据库中我们可以用来定义一些预设参数,比如姓名,性别,地址,年龄等信息;并且每一来代表不同的实体,比如张三的信息,李四的信息。行和列就构成了数据的集合。

    • AWS会为RDS提供高性能、高可用、安全和兼容性,我们不需要管理任何操作系统层面的东西,不需要为OS打补丁和更新,而是直接管理RDS程序和版本。

  • Amazon DynamoDB

    • DynamoDB 是一项快速灵活的 NoSQL 数据库服务,适合所有需要一致性且延迟低于 10 毫秒的任意规模的应用程序。

    • NoSQL指非关系型数据库,主要用于超大规模数据的存储,这些数据没有固定的模式。

    • NoSQL 无需事先为要存储的数据建立字段,随时可以存储自定义的数据格式。而在关系数据库里,增删字段是一件非常麻烦的事情。

    • 在下面我们还会有一些简单的介绍

  • Elasticache

    • Elasticache是AWS提供的分布式对象缓存系统,可以有效地提升现有应用程序的性能。利用Elasticache,用户可以从高吞吐和低延迟的内存数据存储中检索数据,

    • 一般来说我们会把相对来说更新频繁的“热数据”放在Elasticache中,把“冷数据”还是放在数据库中,以支持及时的更新。

    • 目前Elasticache支持两种引擎: Memcached、Redis

    • 虽然Redis不是仅可以用来进行缓存,但是在AWS这里,既然有DynamoDB,如果有用到NoSQL的场景,还是用DynamoDB吧

    • 缓存与数据库的一致性一直是一个大问题,纵使我们有多种方法去解决,但是无疑会增加系统的复杂度,所以在用缓存前请考虑:系统真的非缓存不可吗?用了缓存之后数据的一致性怎么解决?如何解决缓存的击穿、穿透、雪崩?etc.

    • 缓存和读写分离都是在读多写少情况下,解决数据库负载过高的解决方案,但是并不是说一有性能问题就上缓存、读写分离,而是应该先优化,例如优化慢查询,调整不合理的业务逻辑,只有确定系统没有优化空间后,先考虑缓存(因为缓存比读写分离更更容易实现),才考虑读写分离或者集群

2.AWS RDS的备份和还原的方法?

AWS提供了两种备份和还原数据库的方法——自动备份和手动快照

  • 自动备份

    • 就如同这个名字所说的,自动备份我们可以自己设置时间来进行备份,一般会选择业务比较少的时间段,因为会在备份的时候造成主数据库的I/O暂停几秒钟,但是如果开了多可用区部署,那么就没有这个问题,因为他会从备用可用区的实例来备份。

    • 备份会保留7-35天,取决于设置,在这个时间段内我们还原任意的秒数。如下图所示

    截屏2021-03-21 下午3.29.53
    截屏2021-03-21 下午3.29.53
  • 手动快照

    • 不同于自动备份,我们可以在任何时候手动拍摄快照,我们仅能恢复到拍这个快照的时间段,不能选其他的时间。

    • 快照会一直保留,直到手动将他删除。

截屏2021-03-21 下午3.37.28

3.RDS的Multiple-AZ和Read Replica的区别

由于备份在备用机上进行,因此对于多可用区数据库部署,不会出现 I/O 暂停。

  • Multiple-AZ(多可用区部署)

    • 以此部署的RDS,数据库会将更新同步地更新到多个可用区的备用副本中,如果遇到正在读写的可用区故障,RDS会自动转移到备用副本,这种同步和自动转移完全是个黑盒,我们无需与备用的其他可用区副本交互,并且他们也不能用来服务读取流量。(对于上一节的问题,多可用区部署会在备用可用区的实例来备份,所以不会有I/O的问题)。

    • 因为是同步复制的,相对于单一可用区的部署,延迟会有所上升。

    • 再次强调,这里的备用副本不可读,他只作为高可用的备份存在。

截屏2021-03-21 下午3.12.30
  • Read Replica(只读实例)

    • 只读实例需要在自动备份开启的状态下才能生效

    • 只读实例是异步复制

    • 创建只读实例后,如果需要将读请求转发到此数据库,则需要我们在代码里进行更改请求的终端。

    截屏2021-03-21 下午4.33.58
截屏2021-03-21 下午5.07.54

4.DynamoDB超简单介绍

如果要使用DynamoDB,还是得参考官方文档,这里只是作一些简单的介绍:https://docs.aws.amazon.com/zh_cn/amazondynamodb/latest/developerguide/Introduction.html

  • DynamoDB 是一种适用于任何规模的非关系型数据库服务。使用 DynamoDB,客户可以将运行和扩展分布式数据库的管理工作负担交给 AWS,因而无需担心硬件预置、设置和配置、吞吐容量规划、复制、软件修补或集群扩展等问题。

  • DynamoDB 可自动扩展吞吐容量以满足工作负载需求,并随着表大小的增长对数据进行分区和再分区。DynamoDB 还可在一个 AWS 区域的三个数据中心之间同步复制数据,以此提供高可用性和数据持久性。

  • 如下图所示,DynamoDB可以随意更改表结构。

截屏2021-03-21 下午5.40.49

4.1DynamoDB的一致性读取:

可以按需配置DynamoDB的读取方式

  • 最终一致性读取(默认)

    • 最终一致性选项可以最大程度地提高读取吞吐量。

    • 写入后立即读取可能读不到最近的一次写入,所有数据副本通常在一秒内达到一致。

  • 强一致性读取

    • 在写入数据到DynamoDB之后马上读取该数据,会等所有写入操作以及数据同步全部完成后再回馈结果

5.再补个课,OLTP和OLAP的区别?

  • 联机事务处理OLTP(Online Transaction Processing)

    • OLTP主要用来记录某类业务事件的发生,如购买行为,当行为产生后,系统会记录是谁在何时何地做了何事。

    • OLTP是传统的关系数据库的主要应用,是基本的日常事务处理,例如银行交易等。

  • 联机分析处理OLAP(Online Analytics Processing)

    • OLAP是数据仓库(Data Warehousing)系统的主要应用,支持复杂的分析操作,侧重决策支持,并且能提供直观易懂的查询结果。OLAP是用来做商业智能(Business Intelligence)方面的分析的。

    • OLAP常用的流行工具是AWS Redshift, Greenplum, Hive等

    • 当电商发展到一定的规模,运营者/管理层需要做更加精细的用户群体分析,比如“20-30岁的男性在过去一年内的购买行为与电商促销活动之间的关系”,那么就要用到数据仓库了。

你可能感兴趣的:(RDS&DynamoDB&Elasticache)