本人所整理的劳动成果,转载请务必注明出处,谢谢!
有问题欢迎评论区讨论交流,大家一起学习~
[Module 2 - Introducing Machine Learning]
1.机器学习是有关算法和统计模型的科学研究,依靠推理而不是指令来执行任务
2.强化学习通过与环境交互并学习采取能够获得最大奖励的行动
3.为呼叫中心创建机器学习解决方案,系统模板是将客户转接到适当部门(共有八个可能的部门)
此场景描述了多类别分类问题
4.需要系统响应环境变化以提高性能:强化学习
5.机器学习管道的数据准备阶段设计验证数据是否全部属于统一类型
6.多个国家或地区的数据按缩写字幕顺序列出,哪些阶段涉及到将这些缩写转换为数值:数据准备
7.如果一个模型在训练数据上表现很好,但在评估数据上表现不佳,则属于过拟合模型。正确
8.哪些资源是用于处理机器学习问题的python库:pandas,scikit-learn
9.可以使用哪项Amazon服务部署机器学习实例并运行Jupyter笔记本:Amazon SageMaker
10.选择机器学习作为开发方法有哪些要求:包含大量变量的大型数据集
[Module 3 - Implementing a Machine Learning pipeline with Amazon SageMaker]
1.哪些资源有助于定义机器学习问题:对已标记数据的访问权、可咨询的领域专家
2.准备用于监督分类学习的数据应当具备哪些属性:数据应当已标记、数据应该是生产数据的代表
3.通过检查数据统计信息可以获得什么发现:发现数据异常
4.对于一个可用于训练模型的预处理的数据集,应该如何拆分训练数据:80%用于训练,剩余拆分为测试数据(10%)和验证数据(10%)
5.可以通过Amazon SageMaker机械能单模型和多模型托管。正确
6.混淆矩阵的作用:显示真假阳性和真假阴性
7.相关性热图显示哪些内容:数据集特征之间的相关度(正相关/负相关)
8.pandas支持导入以下哪些文件格式的数据:JSON、CSV
9.使用哪项Amazon服务部署机器学习实例并运行Jupyter笔记本:Amazon SageMaker
10.Amazon SageMaker超参数调优作业的目标是什么:优化模型参数以生成最佳模型
[Module 4 - Implementing a Machine Learning pipeline with Amazon SageMaker]
1.时间序列数据中有哪些常见模式:趋势性、季节性
2.哪些使用案例适合预测:预测仓库中货品必需的库存量、预测办公室的能源消耗
3.哪些数据集可以用作时间序列数据集(core:包含时间):包含货品、购买日期和数量的销售数据;包含IP地址、页面和时间戳的Web日志
4.对于一个气象站温度读数的数据集(每5分钟记录一次),每天都缺失了几个值,可以采取哪种对策:向前/向后填充缺失值
5.哪些场景展示了适当的下采样示例:使用mean函数将每分钟温度读数转换为小时制;使用sum函数将当日销售订单信息转换为每日总计
6.在时间序列数据中可以观察到哪些季节性示例:每季度、每年、春夏秋冬
7.Amazon Forecast生成P10、P50和P90预测结果。如果使用Amazon Forecast预测鞋靴销量,则可通过P10、P50和P90了解哪些信息(core:P值表示true值将低于预测值的百分比):P10表示在10%的时间内订购量小于预测值
8.使用Amazon Forecast生成零售预测需要哪些数据集(core:时间序列):包含时间戳、货品和数量的时间序列数据
9.为了使用可用的数据生成最佳模型,需要执行哪些步骤:使用pandas将数据按时间拆分为训练数据集合测试数据集;通过指定回测窗口,在Amazon Forecast中使用训练数据集;使用测试数据集来比较预测值和实际值
[Module 5 - Introducing Computer Vision (CV)]
1.哪些是计算机视觉的常见使用案例:图像分析、面部识别、家庭安全
2.图像中的对象位置叫什么:边界框
3.Amazon Rekognition提供哪些功能:搜索图像和视频库、识别面部、对图像执行情绪分析
4.当Amazon Rekognition执行预测时,它还会提供一个表示预测置信度的分数。正确
5.Amazon Rekognition在完成视频分析后会对结果执行什么操作:将结果发布到Amazon SNS队列
6.Amazon Rekognition Custom Labels具有哪些功能:标记图像和定义边界框的UI;自动选择机器学习算法
7.要使用Amazon SageMaker Ground Truth自动标记数据功能,所需的最小图像数量为:1250
8.什么是混淆矩阵:确定模型在分类对象时的准确性
9.Amazon SageMaker Ground Truth 清单文件中包含哪些类型的数据:置信度值、创建日期、类名称
10.以下哪些步骤用于为对象检测准备自定义数据集:收集图像、训练模型
[Module 6 - Introducing Natural Language Processing]
1.以下哪个问题不是自然语言处理(NLP)的主要挑战:存储限制
2.NLP应用程序有哪些常见的预处理任务:消除噪声、规范化类似词语
3.NLP早于机器学习系统出现。正确
4.有哪些用于NLP应用程序的常见机器学习模型:词袋、词频和逆文档频率
5.以下哪项不属于文本分析类别:自动更正文本
6.Amazon Transcribe支持哪些功能:将流式传输音频转换为文本;构建多种语言字幕
7.可以如何更改Amazon Polly的单词发音方式:向文本添加语音合成标记语言(SSML)标记
8.哪些功能属于Amazon Comprehend:识别文档中使用的语言;确定文档中包含的情绪(正面、负面、中性或混合)
9.可以使用以下哪项AWS服务根据Amazon Lex聊天机器人的输入来启动工作流:Amazon Lambda
10.当供职于一家为全球受众构建应用程序的公司,可以借助哪些服务分析客户使用应用程序的方式:Amazon Comprehend、Amazon Translate