目录
1. 关于AWS Certified Data Analytics – Specialty
2. 考察的内容
2.1 考试包含的主要内容
2.2 涉及到的服务
3. AWS中如何收集数据
4. AWS中如何存储数据
5. AWS中如何处理数据
6. AWS中如何分析数据
7. AWS中如何可视化数据
8. AWS中如何保证数据安全
因为最近在备考DAS,期间看了相关的视频和博客,所以现在对这段时间的学习做一个总结。
AWS认证数据分析专业认证是为希望在AWS平台上展示其数据分析技能的软件开发人员和数据专业人员提供的。 这个考试将测试你构建、保护、维护和设计数据分析解决方案的能力。 这条路径涵盖了五个关键测试领域:数据收集、存储和数据管理、处理、分析和可视化以及安全。
通过学习相关的服务我们可以了解到:
在批处理、实时和近实时过程中收集数据;存储和数据管理;文件和数据库级别的数据处理(SQL和NoSQL);自动化所有上述任务的过程,同时保护信息的安全性,保持良好的实践,并确保系统的高可用性;信息分析与可视化;使用AWS工具实现机器和深度学习模型;根据每个用例的限制和优点为每个用例选择最佳的工具。
所以换句话说,必须具备理解和实践分析项目整个生命周期的能力。
AWS Kinesis;Simple Queue Service (SQS);AWS Internet of Things (IOT);
AWS Database Migration Service (DMS);Simple Storage Service (S3);DynamoDB;
AWS Lambda;AWS Glue;Elastic MapReduce, including Apache Spark, Hive, HBase, Presto, Zeppelin, Splunk, and Flume;
TensorFlow;Amazon SageMaker;
Kinesis Analytics;Amazon Elasticsearch Service;Amazon Athena;Redshift and Redshift Spectrum;
Relational Database Service (RDS) and Aurora;Quicksight;KMS, HSM;IAM;Cognito;STS。
1) 首先要探索如何通过专用网络或硬件设备在AWS中收集数据。
2) 接下来将了解如何使用数据库迁移服务(DMS)迁移数据库。
3) 最后将学习如何利用Amazon Kinesis服务系列,以及何时使用这些服务最合适。
1) 首先将探索如何以及何时利用Amazon DynamoDB实现低延迟、高可伸缩的数据存储和访问模式。
2) 接下来将了解如何将Amazon S3用于文件和数据存储。
3) 最后将了解如何分析这些服务以及可能在更大的数据存储中发挥作用的其他服务。
1) 首先将探索使用Lambda和Glue进行数据处理。
2) 接下来将了解Hadoop生态系统的基础知识,以及如何将其与AWS EMR一起使用。
3) 最后将学习如何使用AWS data Pipeline自动化数据处理。
1) 首先将学习如何使用Elasticsearch分析流日志文件或其他文本数据,以及如何使用Kibana可视化数据。
2) 接下来将发现如何使用Amazon Athena以及Glue data Catalog和Glue爬虫直接查询S3中的数据。使用Kinesis data Analytics研究实时流数据的SQL查询。
3) 最后将学习如何设计和使用Amazon的数据仓库redshift。
1) 首先将探索AWS QuickSight的基础知识。
2) 接下来将发现构成AWS QuickSight的核心组件。
3) 最后将学习如何使用不同的图表类型可视化您的数据。
1) 首先将探索AWS IAM中可用的不同身份验证和授权机制,了解用户、组、策略和保护AWS资源的最佳实践。
2) 接下来将了解如何加密和解密敏感数据,以防止在静止和传输过程中出现任何潜在风险。
3) 最后将了解如何使用各种AWS服务来理解针对行业标准(如HIPAA、PCI和可以监视和警报任何违反的设置控件)的遵从性和治理。