AWS Certified Machine Learning Engineer – Associate 认证验证在生产环境中实施机器学习工作负载并实现其运营化的技术能力。提升您的职业形象与信誉,为胜任热门机器学习岗位做好准备。

■AWS MLA-C01(CN) All

/114

AWS MLA-C01(CN) All

AWS Certified Machine Learning Engineer – Associate 认证验证在生产环境中实施机器学习工作负载并实现其运营化的技术能力。提升您的职业形象与信誉,为胜任热门机器学习岗位做好准备。

1 / 114

1.

No.1
一家公司正在使用 Amazon SageMaker 构建基于 Web 的 AI 应用程序。该应用程序将提供以下功能和特性:ML 实验、训练、中央模型注册表、模型部署和模型监控。
该应用程序必须确保在 ML 生命周期内安全且独立地使用训练数据。训练数据存储在 Amazon S3 中。
该公司需要使用中央模型注册表来管理应用程序中不同版本的模型。
哪种操作可以以最少的运营开销满足此要求?

2 / 114

2.

No.2
一家公司正在使用 Amazon SageMaker 构建基于 Web 的 AI 应用程序。该应用程序将提供以下功能和特性:ML 实验、训练、中央模型注册表、模型部署和模型监控。
该应用程序必须确保在 ML 生命周期内安全且独立地使用训练数据。训练数据存储在 Amazon S3 中。
该公司正在试验连续的训练作业。
公司如何最大限度地缩短这些作业的基础设施启动时间?

3 / 114

3.

No.3
一家公司正在使用 Amazon SageMaker 构建基于 Web 的 AI 应用程序。该应用程序将提供以下功能和特性:ML 实验、训练、中央模型注册表、模型部署和模型监控。
该应用程序必须确保在 ML 生命周期内安全且独立地使用训练数据。训练数据存储在 Amazon S3 中。
公司必须实施基于手动审批的工作流程,以确保只有批准的模型才能部署到生产端点。
哪种解决方案可以满足此要求?

4 / 114

4.

No.4
一家公司正在使用 Amazon SageMaker 构建基于 Web 的 AI 应用程序。该应用程序将提供以下功能和特性:ML 实验、训练、中央模型注册表、模型部署和模型监控。
该应用程序必须确保在 ML 生命周期内安全且独立地使用训练数据。训练数据存储在 Amazon S3 中。
该公司需要运行按需工作流来监控从应用程序部署到实时终端的模型的偏差漂移。
哪种操作可以满足此要求?

5 / 114

5.

No.5
一家公司将历史数据存储在 Amazon S3 中的 .csv 文件中。.csv 文件中只有部分行和列被填充。列未标记。 ML 工程师需要准备和存储数据,以便公司可以使用数据来训练 ML 模型。
从以下列表中选择并排序正确的步骤来执行此任务。每个步骤应选择一次或根本不选择。(选择并排序三个。)
• 创建 Amazon SageMaker 批量转换作业以进行数据清理和特征工程。
• 将结果数据存储回 Amazon S3。
• 使用 Amazon Athena 推断架构和可用列。
• 使用 AWS Glue 爬虫推断架构和可用列。
• 使用 AWS Glue DataBrew 进行数据清理和特征工程。

6 / 114

6.

No.6
ML 工程师需要使用 Amazon SageMaker Feature Store 创建和管理特征以训练模型。
从以下列表中选择并排序步骤以在 Feature Store 中创建和使用特征。每个步骤应选择一次。(选择并排序三个。)
• 访问商店以构建用于训练的数据集。
• 创建特征组。
• 提取记录。

7 / 114

7.

No.7
一家公司希望在 Amazon SageMaker 上托管 ML 模型。ML 工程师正在 AWS CodePipeline 中配置持续集成和持续交付 (CL/CD) 管道以部署模型。当模型的新训练数据上传到 Amazon S3 存储桶时,管道必须自动运行。
从以下列表中选择并排序管道的正确步骤。每个步骤应选择一次或根本不选择。(选择并排序三个。)
• 上传新数据时,S3 事件通知会调用管道。
• 上传新数据时,S3 生命周期规则会调用管道。
• SageMaker 使用 S3 存储桶中的数据重新训练模型。
• 管道将模型部署到 SageMaker 端点。
• 管道将模型部署到 SageMaker 模型注册表。

8 / 114

8.

No.8
一位 ML 工程师正在使用大型语言模型 (LLM) 在 Amazon Bedrock 上构建生成式 AI 应用程序。
从以下列表中为每个描述选择正确的生成式 AI 术语。每个术语应选择一次或根本不选择。 (选择三项。)
• 嵌入
• 检索增强生成 (RAG)
• 温度
• 标记

9 / 114

9.

No.9
一位 ML 工程师正在开发一个 ML 模型来预测类似大小的房屋的价格。该模型将根据几个特征进行预测。ML 工程师将使用以下特征工程技术来估算房屋的价格:
• 特征分割
• 对数变换
• 独热编码
• 标准化分布
为以下特征列表选择正确的特征工程技术。每种特征工程技术都应选择一次或根本不选择(选择三种)。

10 / 114

10.

No.10
ML 工程师正在 AWS 上开发欺诈检测模型。训练数据集包括来自本地 MySQL 数据库的交易日志、客户资料和表。交易日志和客户资料存储在 Amazon S3 中。
数据集具有类不平衡,这会影响模型算法的学习。此外,许多功能具有相互依赖性。该算法没有捕获数据中所有所需的底层模式。
哪个 AWS 服务或功能可以聚合来自各种数据源的数据?

11 / 114

11.

No.11
一位 ML 工程师正在 AWS 上开发欺诈检测模型。训练数据集包括来自本地 MySQL 数据库的交易日志、客户资料和表。交易日志和客户资料存储在 Amazon S3 中。
数据集的类别不平衡会影响模型算法的学习。此外,许多功能具有相互依赖性。算法没有捕获数据中所有所需的底层模式。
数据聚合后,ML 工程师必须实施解决方案来自动检测数据中的异常并可视化结果。
哪种解决方案可以满足这些要求?

12 / 114

12.

No.12
ML 工程师正在 AWS 上开发欺诈检测模型。训练数据集包括来自本地 MySQL 数据库的交易日志、客户配置文件和表。交易日志和客户配置文件存储在 Amazon S3 中。
数据集的类不平衡会影响模型算法的学习。此外,许多功能具有相互依赖性。该算法没有捕获数据中所有所需的底层模式。
训练数据集包括分类数据和数值数据。ML 工程师必须准备训练数据集以最大限度地提高模型的准确性。
哪种操作可以以最少的运营开销满足此要求?

13 / 114

13.

No.13
一位 ML 工程师正在 AWS 上开发欺诈检测模型。训练数据集包括来自本地 MySQL 数据库的交易日志、客户资料和表。交易日志和客户资料存储在 Amazon S3 中。
数据集存在类别不平衡问题,这会影响模型算法的学习。此外,许多功能具有相互依赖性。算法没有捕获数据中所有所需的底层模式。
在 ML 工程师训练模型之前,ML 工程师必须解决数据不平衡的问题。
哪种解决方案可以以最少的运营工作量满足此要求?

14 / 114

14.

No.14
一位 ML 工程师正在 AWS 上开发欺诈检测模型。训练数据集包括来自本地 MySQL 数据库的交易日志、客户资料和表。交易日志和客户资料存储在 Amazon S3 中。
数据集存在类不平衡,影响模型算法的学习。此外,许多特征具有相互依赖性。该算法并未捕获数据中所有所需的底层模式。
ML 工程师需要使用 Amazon SageMaker 内置算法来训练模型。
ML 工程师应使用哪种算法来满足此要求?

15 / 114

15.

No.15
一家公司在生产中部署了一个 XGBoost 预测模型,以预测客户是否有可能取消订阅。该公司使用 Amazon SageMaker Model Monitor 来检测 F1 分数的偏差。
在对模型质量进行基线分析时,该公司记录了 F1 分数的阈值。几个月没有变化后,模型的 F1 分数显着下降。
F1 分数降低的原因可能是什么?

16 / 114

16.

No.16
一家公司有一个数据科学家团队,他们使用 Amazon SageMaker 笔记本实例来测试 ML 模型。当数据科学家需要新的权限时,公司会将权限附加到在创建 SageMaker 笔记本实例期间创建的每个单独角色。
公司需要集中管理团队的权限。
哪种解决方案可以满足这一要求?

17 / 114

17.

No.17
ML 工程师需要使用 ML 模型来预测特定位置的公寓价格。
ML 工程师应该使用哪个指标来评估模型的性能?

18 / 114

18.

No.18
一位 ML 工程师使用随机梯度下降 (SGD) 训练了一个神经网络。神经网络在测试集上表现不佳。训练损失和验证损失的值仍然很高,并显示出振荡模式。这些值在几个时期内下降,然后在几个时期内增加,然后重复相同的循环。
ML 工程师应该做些什么来改进训练过程?

19 / 114

19.

No.19
ML 工程师需要处理数千个现有 CSV 对象和上传的新 CSV 对象。CSV 对象存储在中央 Amazon S3 存储桶中,并具有相同数量的列。其中一列是交易日期。ML 工程师必须根据交易日期查询数据。
哪种解决方案可以以最少的运营开销满足这些要求?

20 / 114

20.

No.20
一家公司拥有一个大型的非结构化数据集。该数据集包含多个关键属性的许多重复记录。
AWS 上的哪种解决方案将以最少的代码开发检测数据集中的重复项?

21 / 114

21.

No.21
一家公司需要在 Amazon EC2 实例上运行批量数据处理作业。该作业将在周末运行,需要 90 分钟才能完成运行。处理可以处理中断。该公司将在接下来的 6 个月内每个周末运行该作业。
哪种 EC2 实例购买选项将最经济高效地满足这些要求?

22 / 114

22.

No.22
一位 ML 工程师在 us-east-1 区域的账户 A 中有一个 Amazon Comprehend 自定义模型。ML 工程师需要将模型复制到同一区域的账户 B。
哪种解决方案可以以最少的开发工作量满足此要求?

23 / 114

23.

No.23
ML 工程师正在训练一个简单的神经网络模型。ML 工程师在验证数据集上跟踪模型随时间的性能。模型的性能最初会大幅提高,然后在特定数量的时期后下降。
哪些解决方案可以缓解此问题?(选择两个。)

24 / 114

24.

No.24
一家公司有一个检索增强生成 (RAG) 应用程序,该应用程序使用矢量数据库来存储文档的嵌入。该公司必须将应用程序迁移到 AWS,并且必须实施提供文本文件语义搜索的解决方案。该公司已将文本存储库迁移到 Amazon S3 存储桶。
哪种解决方案可以满足这些要求?

25 / 114

25.

★No.25
一家公司使用 Amazon Athena 查询 Amazon S3 中的数据集。该数据集具有公司想要预测的目标变量。
该公司需要在解决方案中使用该数据集来确定模型是否可以预测目标变量。
哪种解决方案将以最少的开发工作量提供此信息?

26 / 114

26.

No.26
一家公司希望通过考虑每个广告的配色方案来预测广告活动的成功。一位 ML 工程师正在为神经网络模型准备数据。数据集包含颜色信息作为分类数据。
ML 工程师应该为模型使用哪种特征工程技术?

27 / 114

27.

No.27
一家公司使用混合云环境。部署在本地的模型使用 Amazon 53 中的数据为客户提供实时对话引擎。
该模型正在使用敏感数据。ML 工程师需要实施解决方案来识别和删除敏感数据。
哪种解决方案可以以最少的运营开销满足这些要求?

28 / 114

28.

No.28
ML 工程师需要在 AWS 上创建数据提取管道和 ML 模型部署管道。所有原始数据都存储在 Amazon S3 存储桶中。
哪种解决方案可以满足这些要求?

29 / 114

29.

No.29
一家拥有数百名数据科学家的公司正在使用 Amazon SageMaker 创建 ML 模型。这些模型位于 SageMaker 模型注册表中的模型组中。
数据科学家分为三类:计算机视觉、自然语言处理 (NLP) 和语音识别。ML 工程师需要实施解决方案,将现有模型组织到这些组中,以提高模型的大规模可发现性。该解决方案不得影响模型工件及其现有分组的完整性。
哪种解决方案可以满足这些要求?

30 / 114

30.

No.30
一家公司在新建 VPC 的公共子网中运行 Amazon SageMaker 域。网络配置正确,ML 工程师可以访问 SageMaker 域。
最近,该公司发现来自特定 IP 地址的域的可疑流量。该公司需要阻止来自特定 IP 地址的流量。
哪个网络配置更新将满足此要求?

31 / 114

31.

No.31
一家公司正在收集各种语言的音频、视频和文本数据。该公司需要使用大型语言模型 (LLM) 来汇总收集到的西班牙语数据。
哪种解决方案可以在最短的时间内满足这些要求?

32 / 114

32.

No.32
一家金融公司从外部提供商处收到大量实时市场数据流。这些流每秒包含数千条 JSON 记录。
该公司需要在 AWS 上实施可扩展的解决方案来识别异常数据点。
哪种解决方案能够以最少的运营开销满足这些要求?

33 / 114

33.

No.33
一家公司在产品发布后收集了大量来自客户互动的聊天记录。ML 工程师需要创建一个 ML 模型来分析聊天数据。ML 工程师需要通过查看客户对产品的情绪来确定产品的成功。
ML 工程师应该采取哪些行动才能在最短的时间内完成评估?

34 / 114

34.

No.34
一家公司有一个对话式 AI 助手,它通过 Amazon Bedrock 向 Anthropic Claude 大型语言模型 (LLM) 发送请求。用户报告说,当他们多次提出类似的问题时,他们有时会收到不同的答案。ML 工程师需要改进响应,使其更加一致且随机性更低。
哪种解决方案可以满足这些要求?

35 / 114

35.

No.35
一家公司正在使用 ML 预测农民田地中是否存在特定杂草。该公司正在使用 Amazon SageMaker 线性学习器内置算法,其 predictorjype 超参数的值为 multiclass_dassifier。
公司应该怎么做才能最大限度地减少误报?

36 / 114

36.

No.36
一家公司已实施了一条数据提取管道,用于从其电子商务网站提取销售交易数据。该公司使用 Amazon Data Firehose 将数据提取到 Amazon OpenSearch Service 中。Firehose 流的缓冲间隔设置为 60 秒。OpenSearch 线性模型根据数据生成实时销售预测,并将数据显示在 OpenSearch 仪表板中。
该公司需要优化数据提取管道,以支持实时仪表板的亚秒级延迟。
架构的哪些更改将满足这些要求?

37 / 114

37.

No.37
一家公司已经在 Amazon SageMaker 中训练了一个 ML 模型。该公司需要托管该模型以在生产环境中提供推理。
该模型必须具有高可用性,并且必须以最小的延迟做出响应。每个请求的大小将在 1 KB 到 3 MB 之间。该模型将在白天收到不可预测的请求突发。推理必须根据需求的变化进行比例调整。
公司应如何将模型部署到生产中以满足这些要求?

38 / 114

38.

No.38
ML 工程师需要使用 Amazon EMR 集群批量处理大量数据。任何数据丢失都是不可接受的。
哪种实例购买选项最经济高效地满足这些要求?

39 / 114

39.

No.39
一家公司希望提高其 ML 运营的可持续性。
哪些行动将减少与公司培训工作相关的能源使用和计算资源?(选择两个。)

40 / 114

40.

No.40
一家公司计划创建多个 ML 预测模型。训练数据存储在 Amazon S3 中。整个数据集大小超过 5 TB,由 CSV、JSON、Apache Parquet 和简单文本文件组成。
必须分几个连续步骤处理数据。这些步骤包括复杂的操作,可能需要数小时才能完成运行。一些处理涉及自然语言处理 (NLP) 转换。整个过程必须自动化。
哪种解决方案可以满足这些要求?

41 / 114

41.

No.41
ML 工程师需要使用 AWS CloudFormation 创建 Amazon SageMaker 端点将托管的 ML 模型。
ML 工程师应在 CloudFormation 模板中声明哪种资源来满足此要求?

42 / 114

42.

No.42
一家广告公司使用 AWS Lake Formation 来管理数据湖。数据湖包含结构化数据和非结构化数据。该公司的 ML 工程师被分配到特定的广告活动。
ML 工程师必须通过 Amazon Athena 与数据交互,并直接在 Amazon S3 存储桶中浏览数据。 ML 工程师必须只能访问特定于其分配的广告活动的资源。
哪种解决方案能够以最高效的方式满足这些要求?

43 / 114

43.

No.43
ML 工程师需要使用 Amazon SageMaker Canvas 中的数据来训练 ML 模型。数据存储在 Amazon S3 中,结构复杂。ML 工程师必须使用一种可以最大程度缩短数据处理时间的文件格式。
哪种文件格式可以满足这些要求?

44 / 114

44.

No.44
一位 ML 工程师正在评估多个 ML 模型,必须选择一个模型用于生产。模型的假阴性预测成本远高于假阳性预测成本。
ML 工程师在选择模型时应该优先考虑哪个指标结果?

45 / 114

45.

No.45
一家公司已经使用 Amazon SageMaker 训练和部署了一个 ML 模型。该公司需要实施一个解决方案来记录和监控 SageMaker 端点的所有 API 调用事件。当 API 调用事件的数量超过阈值时,该解决方案还必须提供通知。
哪种解决方案可以满足这些要求?

46 / 114

46.

No.46
一家公司有由 AWS Glue 工作流编排的 AWS Glue 数据处理作业。 AWS Glue 作业可以按计划运行,也可以手动启动。
该公司正在 Amazon SageMaker Pipelines 中开发用于 ML 模型开发的管道。管道将在模型开发的数据处理阶段使用 AWS Glue 作业的输出。ML 工程师需要实施将 AWS Glue 作业与管道集成的解决方案。
哪种解决方案可以以最少的运营开销满足这些要求?

47 / 114

47.

No.47
一家公司正在使用 Amazon Redshift 数据库作为其单一数据源。部分数据是敏感数据。
数据科学家需要使用数据库中的部分敏感数据。ML 工程师必须授予数据科学家访问数据的权限,而无需转换源数据,也不必在数据库中存储匿名数据。
哪种解决方案能够以最少的实施工作量满足这些要求?

48 / 114

48.

No.48
一位 ML 工程师正在使用训练作业来微调 Amazon SageMaker Studio 中的深度学习模型。ML 工程师之前使用过相同的预训练模型和类似的数据集。ML 工程师预计会出现梯度消失、GPU 利用率不足和过度拟合问题。
ML 工程师需要实施解决方案来检测这些问题,并在问题发生时以预定义的方式做出反应。该解决方案还必须在训练期间提供全面的实时指标。
哪种解决方案能够以最少的运营开销满足这些要求?

49 / 114

49.

No.49
一家信用卡公司在 Amazon SageMaker 终端上生产欺诈检测模型。该公司开发了该模型的新版本。该公司需要使用实时数据来评估新模型的性能,而不会影响生产最终用户。
哪种解决方案可以满足这些要求?

50 / 114

50.

No.50
一家公司将有关用户点击的时间序列数据存储在 Amazon S3 存储桶中。原始数据每天包含数百万行用户活动。ML 工程师访问数据以开发他们的 ML 模型。
ML 工程师需要使用 Amazon Athena 生成每日报告并分析过去 3 天的点击趋势。公司必须在存档数据之前保留数据 30 天。
哪种解决方案将为数据检索提供最高的性能?

51 / 114

51.

No.51
一家公司部署了一个 ML 模型,该模型可在银行应用程序中实时检测欺诈性信用卡交易。该模型使用 Amazon SageMaker 异步推理。消费者报告称,在接收推理结果时出现延迟。
ML 工程师需要实施解决方案来提高推理性能。当模型质量出现偏差时,解决方案还必须提供通知。
哪种解决方案可以满足这些要求?

52 / 114

52.

No.52
ML 工程师需要实施解决方案来托管经过训练的 ML 模型。全天对模型的请求率将不一致。
ML 工程师需要一个可扩展的解决方案,以在模型未使用时最大限度地降低成本。该解决方案还必须保持模型在高峰使用期间响应请求的能力。
哪种解决方案可以满足这些要求?

53 / 114

53.

No.53
一家公司使用 Amazon SageMaker Studio 开发 ML 模型。该公司有一个 SageMaker Studio 域。ML 工程师需要实施一种解决方案,当 SageMaker 计算成本达到特定阈值时,该解决方案会提供自动警报。
哪种解决方案可以满足这些要求?

54 / 114

54.

No.54
一家公司使用 Amazon SageMaker 处理其 ML 工作负载。该公司的 ML 工程师收到一个 50 MB 的 Apache Parquet 数据文件来构建欺诈检测模型。该文件包含几个不需要的相关列。
ML 工程师应该怎么做才能以最少的努力删除文件中不必要的列?

55 / 114

55.

No.55
一家公司正在创建一个应用程序,该应用程序将向客户推荐产品。该应用程序将对 Amazon Q Business 进行 API 调用。该公司必须确保来自 Amazon Q Business 的响应不包含公司主要竞争对手的名称。
哪种解决方案可以满足此要求?

56 / 114

56.

No.56
ML 工程师需要使用 Amazon SageMaker 对大型语言模型 (LLM) 进行微调,以进行文本摘要。ML 工程师必须遵循低代码无代码 (LCNC) 方法。
哪种解决方案可以满足这些要求?

57 / 114

57.

No.57
一家公司有一个 ML 模型,需要每晚运行一次以预测股票价值。模型输入是当天收集的 3 MB 数据。该模型生成第二天的预测。预测过程需要不到 1 分钟即可完成运行。
公司应如何在 Amazon SageMaker 上部署模型以满足这些要求?

58 / 114

58.

No.58
一位 ML 工程师在 Amazon SageMaker 上训练了一个 ML 模型,以从闭路电视录像中检测汽车事故。ML 工程师使用 SageMaker Data Wrangler 创建了事故和非事故图像的训练数据集。
该模型在训练和验证期间表现良好。然而,由于来自不同摄像机的图像质量存在差异,该模型在生产中表现不佳。
哪种解决方案可以在最短的时间内提高模型的准确性?

59 / 114

59.

No.59
一家公司有一个应用程序,它使用不同的 API 为输入文本生成嵌入。该公司需要实施一个解决方案,每 3 个月自动轮换一次 API 令牌。
哪种解决方案可以满足此要求?

60 / 114

60.

No.60
ML 工程师收到包含缺失值、重复值和极端异常值的数据集。ML 工程师必须将这些数据集合并到单个数据框中,并且必须为 ML 准备数据。
哪种解决方案可以满足这些要求?

61 / 114

61.

No.61
一家公司拥有历史数据,显示客户是否需要公司员工的长期支持。该公司需要开发一个 ML 模型来预测新客户是否需要长期支持。
公司应该使用哪种建模方法来满足此要求?

62 / 114

62.

No.62
ML 工程师在 Amazon SageMaker 之外开发了一个二元分类模型。ML 工程师需要让 SageMaker Canvas 用户访问该模型以进行进一步调整。
模型工件存储在 Amazon S3 存储桶中。ML 工程师和 Canvas 用户属于同一个 SageMaker 域。
必须满足哪些要求组合,ML 工程师才能与 Canvas 用户共享模型?(选择两个。)

63 / 114

63.

No.63
一家公司正在 Amazon SageMaker 上构建深度学习模型。该公司使用大量数据作为训练数据集。该公司需要优化模型的超参数,以最小化验证数据集上的损失函数。
哪种超参数调整策略将以最少的计算时间实现此目标?

64 / 114

64.

No.64
一家公司计划在其主要 AWS 账户中使用 Amazon Redshift ML。源数据位于辅助账户中的 Amazon S3 存储桶中。
ML 工程师需要在主账户中设置 ML 管道以访问辅助账户中的 S3 存储桶。解决方案不得要求公共 IPv4 地址。
哪种解决方案可以满足这些要求?

65 / 114

65.

No.65
一家公司正在使用 AWS Lambda 函数来监控来自 ML 模型的指标。ML 工程师需要实施一种解决方案,以便在指标超出阈值时发送电子邮件消息。
哪种解决方案可以满足此要求?

66 / 114

66.

No.66
一家公司已使用 Amazon SageMaker 在生产中部署预测 ML 模型。该公司正在模型上使用 SageMaker Model Monitor。模型更新后,ML 工程师在 Model Monitor 检查中注意到数据质量问题。
ML 工程师应该做什么来缓解 Model Monitor 已识别的数据质量问题?

67 / 114

67.

No.67
一家公司有一个 ML 模型,该模型根据客户上传到公司网站的图像生成文本描述。图像总大小最多可达 50 MB。
ML 工程师决定将图像存储在 Amazon S3 存储桶中。 ML 工程师必须实施可扩展以适应需求变化的处理解决方案。
哪种解决方案能够以最少的运营开销满足这些要求?

68 / 114

68.

No.68
ML 工程师需要使用 AWS 服务从文档中识别和提取有意义的唯一关键字。
哪种解决方案能够以最少的运营开销满足这些要求?

69 / 114

69.

No.69
一家公司需要向其 ML 工程师提供适当的训练数据访问权限。ML 工程师必须仅从自己的业务组访问训练数据。ML 工程师不得被允许访问来自其他业务组的训练数据。
该公司使用单个 AWS 账户并将所有训练数据存储在 Amazon S3 存储桶中。所有 ML 模型训练都在 Amazon SageMaker 中进行。
哪种解决方案将为 ML 工程师提供适当的访问权限?

70 / 114

70.

No.70
一家公司需要托管自定义 ML 模型来执行预测分析。预测分析将在每天的同一 2 小时内以可预测和持续的负载进行。
分析期间的多次调用将需要快速响应。公司需要 AWS 来管理底层基础设施和任何自动扩展活动。
哪种解决方案可以满足这些要求?

71 / 114

71.

No.71
一家公司的 ML 工程师已将用于情绪分析的 ML 模型部署到 Amazon SageMaker 终端节点。ML 工程师需要向公司利益相关者说明该模型如何进行预测。
哪种解决方案将为模型的预测提供说明?

72 / 114

72.

No.72
一位 ML 工程师正在使用 Amazon SageMaker 训练需要分布式训练的深度学习模型。经过几次训练尝试后,ML 工程师发现实例的表现不如预期。ML 工程师确定了训练实例之间的通信开销。
ML 工程师应该怎么做才能最大限度地减少实例之间的通信开销?

73 / 114

73.

No.73
一家公司正在使用自定义 Python 脚本和专有数据集在本地运行 ML 模型。该公司正在使用 PyTorch。模型构建需要独特的领域知识。该公司需要将模型迁移到 AWS。
哪种解决方案可以以最少的努力满足这些要求?

74 / 114

74.

No.74
一家公司正在使用 Amazon SageMaker 和数百万个文件来训练 ML 模型。每个文件大小为几兆字节。这些文件存储在 Amazon S3 存储桶中。该公司需要提高训练性能。
哪种解决方案可以在最短的时间内满足这些要求?

75 / 114

75.

No.75
一家公司希望使用来自其客户的表格数据来开发 ML 模型。数据包含有意义的有序特征,其中包含不应丢弃的敏感信息。ML 工程师必须确保在另一个团队开始构建模型之前屏蔽敏感数据。
哪种解决方案可以满足这些要求?

76 / 114

76.

No.76
ML 工程师需要部署 ML 模型,以异步方式从大型数据集中获取推理。ML 工程师还需要实施对模型数据质量的定期监控。当数据质量发生变化时,ML 工程师必须收到警报。
哪种解决方案可以满足这些要求?

77 / 114

77.

No.77
ML 工程师使用 AWS Glue DataBrew 中的最小-最大规范化对训练数据进行了规范化。在将生产推理数据传递给模型进行预测之前,ML 工程师必须以与训练数据相同的方式对生产推理数据进行规范化。
哪种解决方案可以满足此要求?

78 / 114

78.

No.78
一家公司计划使用 Amazon SageMaker 进行基于图像的分类评级。该公司有 6 ТВ 的训练数据存储在 Amazon FSx for NetApp ONTAP 系统虚拟机 (SVM) 上。SVM 与 SageMaker 位于同一 VPC 中。
ML 工程师必须使 SageMaker 环境中的 ML 模型可以访问训练数据。
哪种解决方案可以满足这些要求?

79 / 114

79.

No.79
一家公司定期从 ML 模型的供应商处收到新的训练数据。供应商每 3-4 天将清理和准备好的数据发送到公司的 Amazon S3 存储桶。
该公司有一个 Amazon SageMaker 管道来重新训练模型。机器学习工程师需要实施一个解决方案,以便在将新数据上传到 S3 存储桶时运行管道。
哪种解决方案能够以最少的运营工作量满足这些要求?

80 / 114

80.

No.80
一位 ML 工程师正在使用 Amazon SageMaker XGBoost 算法开发欺诈检测模型。该模型将交易分为欺诈或合法。
在测试期间,该模型擅长识别训练数据集中的欺诈行为。但是,该模型在识别新交易和未见过的交易中的欺诈行为方面效率低下。
ML 工程师应该做些什么来提高新交易的欺诈检测能力?

81 / 114

81.

No.81
一家公司在生产中有一个二元分类模型。ML 工程师需要开发该模型的新版本。
新模型版本必须最大化正标签和负标签的正确预测。ML 工程师必须使用指标重新校准模型以满足这些要求。
ML 工程师应使用哪个指标进行模型重新校准?

82 / 114

82.

★No.82
一家公司正在使用 Amazon SageMaker 创建 ML 模型。公司的数据科学家需要对他们编排的 ML 工作流进行细粒度控制。数据科学家还需要能够将 SageMaker 作业和工作流可视化为有向无环图 (DAG)。数据科学家必须保留模型发现实验的运行历史记录,并且必须建立模型治理以进行审计和合规性验证。
哪种解决方案可以满足这些要求?

83 / 114

83.

No.83
一家公司希望降低其容器化 ML 应用程序的成本。这些应用程序使用在 Amazon EC2 实例、AWS Lambda 函数和 Amazon Elastic Container Service (Amazon ECS) 集群上运行的 ML 模型。EC2 工作负载和 ECS 工作负载使用 Amazon Elastic Block Store (Amazon EBS) 卷来保存预测和工件。
ML 工程师必须识别使用效率低下的资源。ML 工程师还必须生成建议以降低这些资源的成本。
哪种解决方案能够以最少的开发工作量满足这些要求?

84 / 114

84.

No.84
一家公司需要为公司的所有 ML 模型创建一个中央目录。这些模型位于公司最初开发模型的 AWS 账户中。这些模型托管在 Amazon Elastic Container Registry (Amazon ECR) 存储库中。
哪种解决方案可以满足这些要求?

85 / 114

85.

No.85
一家公司开发了一种新的 ML 模型。该公司要求在 10% 的流量上进行在线模型验证,然后才能在生产中完全发布该模型。该公司使用应用程序负载均衡器 (ALB) 后面的 Amazon SageMaker 终端节点来为该模型提供服务。
哪种解决方案将以最少的运营开销设置所需的在线验证?

86 / 114

86.

No.86
一家公司需要开发一个 ML 模型。该模型必须识别图像中的项目,并且必须提供该项目的位置。
哪种 Amazon SageMaker 算法可以满足这些要求?

87 / 114

87.

No.87
一家公司有一个 Amazon S3 存储桶,其中包含来自不同来源的 1TB 文件。S3 存储桶在同一个 S3 文件夹中包含以下文件类型:CSV、JSON、XLSX 和 Apache Parquet。
ML 工程师必须实施使用 AWS Glue DataBrew 来处理数据的解决方案。ML 工程师还必须将最终输出存储在 Amazon S3 中,以便 AWS Glue 将来可以使用该输出。
哪种解决方案可以满足这些要求?

88 / 114

88.

No.88
制造公司使用 ML 模型来确定产品是否符合质量标准。该模型会输出“通过”或“失败”。机器人使用该模型分析装配线上的照片,将产品分为两类。
公司应使用哪些指标来评估模型的性能?(选择两个。)

89 / 114

89.

No.89
ML 工程师需要在 ML 训练作业运行时加密所有传输中的数据。ML 工程师必须确保将传输中的加密应用于 Amazon SageMaker 在训练作业期间使用的流程。
哪种解决方案可以满足这些要求?

90 / 114

90.

No.90
ML 工程师需要使用指标来评估时间序列预测模型的质量。
哪些指标适用于此模型?(选择两个。)

91 / 114

91.

No.91
一家公司运行使用加速实例的 Amazon SageMaker ML 模型。这些模型需要实时响应。每个模型都有不同的扩展要求。公司不得允许模型冷启动。
哪种解决方案可以满足这些要求?

92 / 114

92.

No.92
一家公司使用 Amazon SageMaker 进行 ML 流程。合规性审计发现,用于训练数据的 Amazon S3 存储桶使用带有 S3 托管密钥 (SSE-S3) 的服务器端加密。
该公司需要客户管理密钥。ML 工程师将 S3 存储桶更改为使用带有 AWS KMS 密钥 (SSE-KMS) 的服务器端加密。ML 工程师未进行其他配置更改。
更改加密设置后,SageMaker 训练作业开始失败并出现 AccessDenied 错误。
ML 工程师应该怎么做才能解决这个问题?

93 / 114

93.

No.93
一家公司使用计算优化实例在 Amazon SageMaker 上运行训练作业。训练运行的需求将在接下来的 55 周内保持不变。该实例需要每周运行 35 小时。该公司需要降低其模型训练成本。
哪种解决方案可以满足这些要求?

94 / 114

94.

★No.94
热点
-
一家公司需要训练一个 ML 模型,该模型将使用历史交易数据来预测客户行为。
从以下列表中选择正确的 AWS 服务以对数据执行每个任务。每个服务应选择一次或根本不选择。 (选择三个。)

• Amazon Athena
• AWS Glue
• Amazon Kinesis 数据流
• Amazon S3

查询数据以进行探索和分析。选择...
选择...
Amazon Athena
AWS Glue
Amazon Kinesis 数据流
Amazon S3

存储数据。选择...
选择...
Amazon Athena
AWS Glue
Amazon Kinesis 数据流
Amazon S3

转换数据。选择...
选择...
Amazon Athena
AWS Glue
Amazon Kinesis 数据流
Amazon S3

95 / 114

95.

No.95
一家公司部署了一个使用 XGBoost 算法预测产品故障的 ML 模型。该模型托管在 Amazon SageMaker 终端节点上,并根据正常运行数据进行训练。AWS Lambda 函数为公司的应用程序提供预测。
ML 工程师必须实施一种解决方案,使用传入的实时数据来检测模型准确性随时间下降的情况。
哪种解决方案可以满足这些要求?

96 / 114

96.

No.96
一家公司有一个 ML 模型,该模型使用历史交易数据来预测客户行为。ML 工程师正在 Amazon SageMaker 中优化该模型,以提高模型的预测准确性。ML 工程师必须检查输入数据和由此产生的预测,以确定可能在不同人口统计数据中扭曲模型性能的趋势。
哪种解决方案可以提供这种级别的分析?

97 / 114

97.

No.97
一家公司使用 10 个加速实例类型的预留实例来为当前版本的 ML 模型提供服务。ML 工程师需要将新版本的模型部署到 Amazon SageMaker 实时推理终端节点。
该解决方案必须使用原始的 10 个实例来为模型的两个版本提供服务。该解决方案还必须包括一个额外的预留实例,可用于部署过程。版本之间的转换必须没有停机或服务中断。
哪种解决方案可以满足这些要求?

98 / 114

98.

No.98
一家 IoT 公司使用 Amazon SageMaker 训练和测试 XGBoost 模型以进行对象检测。机器学习工程师在使用超参数变体训练模型时需要监控性能指标。机器学习工程师还需要在训练完成后发送短信服务 (SMS) 文本消息。
哪种解决方案可以满足这些要求?

99 / 114

99.

No.99
一家公司正在开展一个 ML 项目,该项目将包括 Amazon SageMaker 笔记本实例。ML 工程师必须确保 SageMaker 笔记本实例不允许 root 访问。
哪种解决方案将阻止允许 root 访问的笔记本实例的部署?

100 / 114

100.

No.100
一家公司正在使用 Amazon SageMaker 开发 ML 模型。该公司将敏感的训练数据存储在 Amazon S3 存储桶中。模型训练必须与互联网进行网络隔离。
哪种解决方案可以满足此要求?

101 / 114

101.

No.101
一家公司需要一个 AWS 解决方案,该解决方案将在创建模型时自动创建 ML 模型的版本。
哪种解决方案可以满足此要求?

102 / 114

102.

No.102
一家公司需要使用检索增强生成 (RAG) 来补充在 Amazon Bedrock 上运行的开源大型语言模型 (LLM)。该公司的 RAG 数据是 Amazon S3 存储桶中的一组文档。这些文档由 .csv 文件和 .docx 文件组成。
哪种解决方案可以以最少的运营开销满足这些要求?

103 / 114

103.

No.103
一家公司计划在 Amazon SageMaker 终端节点上部署用于生产推理的 ML 模型。平均推理负载大小从 100 MB 到 300 MB 不等。推理请求必须在 60 分钟或更短的时间内处理。
哪种 SageMaker 推理选项可以满足这些要求?

104 / 114

104.

No.104
ML 工程师在图像分类训练作业中注意到类别不平衡。
ML 工程师应该怎么做才能解决这个问题?

105 / 114

105.

No.105
一家公司每天收到有关客户与其 ML 模型交互的 .csv 文件。该公司将文件存储在 Amazon S3 中,并使用这些文件重新训练模型。ML 工程师需要实施一种解决方案,在重新训练模型之前屏蔽文件中的信用卡号。
哪种解决方案可以以最少的开发工作量满足此要求?

106 / 114

106.

No.106
一家医疗公司正在使用 AWS 构建一种工具来为患者推荐治疗方法。该公司已从患者那里获得了健康记录和自我报告的英文文本信息。该公司需要使用这些信息来深入了解患者。
哪种解决方案可以以最少的开发工作量满足此要求?

107 / 114

107.

No.107
一家公司需要从 PDF 文档中提取实体以构建分类器模型。
哪种解决方案将在最短的时间内提取和存储实体?

108 / 114

108.

No.108
一家公司共享可通过 VPN 访问的 Amazon SageMaker Studio 笔记本。该公司必须实施访问控制,以防止恶意行为者利用预签名 URL 访问笔记本。
哪种解决方案可以满足这些要求?

109 / 114

109.

No.109
ML 工程师需要合并和转换来自两个来源的数据以重新训练现有的 ML 模型。一个数据源由存储在 Amazon S3 存储桶中的 .csv 文件组成。每个 .csv 文件包含数百万条记录。另一个数据源是 Amazon Aurora DB 集群。
合并过程的结果必须写入第二个 S3 存储桶。ML 工程师需要每周执行此合并和转换任务。
哪种解决方案可以以最少的运营开销满足这些要求?

110 / 114

110.

No.110
ML 工程师已将 Amazon SageMaker 模型部署到生产中的无服务器终端节点。该模型由 InvokeEndpoint API 操作调用。
生产中的模型延迟高于测试环境中的基线延迟。ML 工程师认为延迟增加是因为模型启动时间。
ML 工程师应该做什么来确认或否认这个假设?

111 / 114

111.

No.111
ML 工程师需要确保数据集符合个人身份信息 (PII) 的规定。ML 工程师将使用这些数据在 Amazon SageMaker 实例上训练 ML 模型。SageMaker 不得使用任何 PII。
哪种解决方案能够以最高效的方式满足这些要求?

112 / 114

112.

No.112
公司必须在任何新创建的 Amazon SageMaker 笔记本实例上安装自定义脚本。
哪种解决方案可以以最少的运营开销满足此要求?

113 / 114

113.

★No.113
一家公司正在为电子商务应用程序构建实时数据处理管道。该应用程序生成大量点击流数据,必须近乎实时地提取、处理和可视化这些数据。该公司需要一个支持 SQL 进行数据处理和 Jupyter 笔记本进行交互式分析的解决方案。
哪种解决方案可以满足这些要求?

114 / 114

114.

No.114
一家医疗公司需要存储临床数据。数据包括个人身份信息 (PII) 和受保护的健康信息 (PHI)。
ML 工程师需要实施解决方案以确保 PII 和 PHI 不用于训练 ML 模型。
哪种解决方案可以满足这些要求?

Your score is

0%

■AWS MLA-C01(CN) Q.1-100

/100

AWS MLA-C01(CN) 1-100

AWS Certified Machine Learning Engineer – Associate 认证验证在生产环境中实施机器学习工作负载并实现其运营化的技术能力。提升您的职业形象与信誉,为胜任热门机器学习岗位做好准备。

1 / 100

1.

No.100
一家公司正在使用 Amazon SageMaker 开发 ML 模型。该公司将敏感的训练数据存储在 Amazon S3 存储桶中。模型训练必须与互联网进行网络隔离。
哪种解决方案可以满足此要求?

2 / 100

2.

No.99
一家公司正在开展一个 ML 项目,该项目将包括 Amazon SageMaker 笔记本实例。ML 工程师必须确保 SageMaker 笔记本实例不允许 root 访问。
哪种解决方案将阻止允许 root 访问的笔记本实例的部署?

3 / 100

3.

No.98
一家 IoT 公司使用 Amazon SageMaker 训练和测试 XGBoost 模型以进行对象检测。机器学习工程师在使用超参数变体训练模型时需要监控性能指标。机器学习工程师还需要在训练完成后发送短信服务 (SMS) 文本消息。
哪种解决方案可以满足这些要求?

4 / 100

4.

No.97
一家公司使用 10 个加速实例类型的预留实例来为当前版本的 ML 模型提供服务。ML 工程师需要将新版本的模型部署到 Amazon SageMaker 实时推理终端节点。
该解决方案必须使用原始的 10 个实例来为模型的两个版本提供服务。该解决方案还必须包括一个额外的预留实例,可用于部署过程。版本之间的转换必须没有停机或服务中断。
哪种解决方案可以满足这些要求?

5 / 100

5.

No.96
一家公司有一个 ML 模型,该模型使用历史交易数据来预测客户行为。ML 工程师正在 Amazon SageMaker 中优化该模型,以提高模型的预测准确性。ML 工程师必须检查输入数据和由此产生的预测,以确定可能在不同人口统计数据中扭曲模型性能的趋势。
哪种解决方案可以提供这种级别的分析?

6 / 100

6.

No.95
一家公司部署了一个使用 XGBoost 算法预测产品故障的 ML 模型。该模型托管在 Amazon SageMaker 终端节点上,并根据正常运行数据进行训练。AWS Lambda 函数为公司的应用程序提供预测。
ML 工程师必须实施一种解决方案,使用传入的实时数据来检测模型准确性随时间下降的情况。
哪种解决方案可以满足这些要求?

7 / 100

7.

★No.94
热点
-
一家公司需要训练一个 ML 模型,该模型将使用历史交易数据来预测客户行为。
从以下列表中选择正确的 AWS 服务以对数据执行每个任务。每个服务应选择一次或根本不选择。 (选择三个。)

• Amazon Athena
• AWS Glue
• Amazon Kinesis 数据流
• Amazon S3

查询数据以进行探索和分析。选择...
选择...
Amazon Athena
AWS Glue
Amazon Kinesis 数据流
Amazon S3

存储数据。选择...
选择...
Amazon Athena
AWS Glue
Amazon Kinesis 数据流
Amazon S3

转换数据。选择...
选择...
Amazon Athena
AWS Glue
Amazon Kinesis 数据流
Amazon S3

8 / 100

8.

No.93
一家公司使用计算优化实例在 Amazon SageMaker 上运行训练作业。训练运行的需求将在接下来的 55 周内保持不变。该实例需要每周运行 35 小时。该公司需要降低其模型训练成本。
哪种解决方案可以满足这些要求?

9 / 100

9.

No.92
一家公司使用 Amazon SageMaker 进行 ML 流程。合规性审计发现,用于训练数据的 Amazon S3 存储桶使用带有 S3 托管密钥 (SSE-S3) 的服务器端加密。
该公司需要客户管理密钥。ML 工程师将 S3 存储桶更改为使用带有 AWS KMS 密钥 (SSE-KMS) 的服务器端加密。ML 工程师未进行其他配置更改。
更改加密设置后,SageMaker 训练作业开始失败并出现 AccessDenied 错误。
ML 工程师应该怎么做才能解决这个问题?

10 / 100

10.

No.91
一家公司运行使用加速实例的 Amazon SageMaker ML 模型。这些模型需要实时响应。每个模型都有不同的扩展要求。公司不得允许模型冷启动。
哪种解决方案可以满足这些要求?

11 / 100

11.

No.90
ML 工程师需要使用指标来评估时间序列预测模型的质量。
哪些指标适用于此模型?(选择两个。)

12 / 100

12.

No.89
ML 工程师需要在 ML 训练作业运行时加密所有传输中的数据。ML 工程师必须确保将传输中的加密应用于 Amazon SageMaker 在训练作业期间使用的流程。
哪种解决方案可以满足这些要求?

13 / 100

13.

No.88
制造公司使用 ML 模型来确定产品是否符合质量标准。该模型会输出“通过”或“失败”。机器人使用该模型分析装配线上的照片,将产品分为两类。
公司应使用哪些指标来评估模型的性能?(选择两个。)

14 / 100

14.

No.87
一家公司有一个 Amazon S3 存储桶,其中包含来自不同来源的 1TB 文件。S3 存储桶在同一个 S3 文件夹中包含以下文件类型:CSV、JSON、XLSX 和 Apache Parquet。
ML 工程师必须实施使用 AWS Glue DataBrew 来处理数据的解决方案。ML 工程师还必须将最终输出存储在 Amazon S3 中,以便 AWS Glue 将来可以使用该输出。
哪种解决方案可以满足这些要求?

15 / 100

15.

No.86
一家公司需要开发一个 ML 模型。该模型必须识别图像中的项目,并且必须提供该项目的位置。
哪种 Amazon SageMaker 算法可以满足这些要求?

16 / 100

16.

No.85
一家公司开发了一种新的 ML 模型。该公司要求在 10% 的流量上进行在线模型验证,然后才能在生产中完全发布该模型。该公司使用应用程序负载均衡器 (ALB) 后面的 Amazon SageMaker 终端节点来为该模型提供服务。
哪种解决方案将以最少的运营开销设置所需的在线验证?

17 / 100

17.

No.84
一家公司需要为公司的所有 ML 模型创建一个中央目录。这些模型位于公司最初开发模型的 AWS 账户中。这些模型托管在 Amazon Elastic Container Registry (Amazon ECR) 存储库中。
哪种解决方案可以满足这些要求?

18 / 100

18.

No.83
一家公司希望降低其容器化 ML 应用程序的成本。这些应用程序使用在 Amazon EC2 实例、AWS Lambda 函数和 Amazon Elastic Container Service (Amazon ECS) 集群上运行的 ML 模型。EC2 工作负载和 ECS 工作负载使用 Amazon Elastic Block Store (Amazon EBS) 卷来保存预测和工件。
ML 工程师必须识别使用效率低下的资源。ML 工程师还必须生成建议以降低这些资源的成本。
哪种解决方案能够以最少的开发工作量满足这些要求?

19 / 100

19.

★No.82
一家公司正在使用 Amazon SageMaker 创建 ML 模型。公司的数据科学家需要对他们编排的 ML 工作流进行细粒度控制。数据科学家还需要能够将 SageMaker 作业和工作流可视化为有向无环图 (DAG)。数据科学家必须保留模型发现实验的运行历史记录,并且必须建立模型治理以进行审计和合规性验证。
哪种解决方案可以满足这些要求?

20 / 100

20.

No.81
一家公司在生产中有一个二元分类模型。ML 工程师需要开发该模型的新版本。
新模型版本必须最大化正标签和负标签的正确预测。ML 工程师必须使用指标重新校准模型以满足这些要求。
ML 工程师应使用哪个指标进行模型重新校准?

21 / 100

21.

No.80
一位 ML 工程师正在使用 Amazon SageMaker XGBoost 算法开发欺诈检测模型。该模型将交易分为欺诈或合法。
在测试期间,该模型擅长识别训练数据集中的欺诈行为。但是,该模型在识别新交易和未见过的交易中的欺诈行为方面效率低下。
ML 工程师应该做些什么来提高新交易的欺诈检测能力?

22 / 100

22.

No.79
一家公司定期从 ML 模型的供应商处收到新的训练数据。供应商每 3-4 天将清理和准备好的数据发送到公司的 Amazon S3 存储桶。
该公司有一个 Amazon SageMaker 管道来重新训练模型。机器学习工程师需要实施一个解决方案,以便在将新数据上传到 S3 存储桶时运行管道。
哪种解决方案能够以最少的运营工作量满足这些要求?

23 / 100

23.

No.78
一家公司计划使用 Amazon SageMaker 进行基于图像的分类评级。该公司有 6 ТВ 的训练数据存储在 Amazon FSx for NetApp ONTAP 系统虚拟机 (SVM) 上。SVM 与 SageMaker 位于同一 VPC 中。
ML 工程师必须使 SageMaker 环境中的 ML 模型可以访问训练数据。
哪种解决方案可以满足这些要求?

24 / 100

24.

No.77
ML 工程师使用 AWS Glue DataBrew 中的最小-最大规范化对训练数据进行了规范化。在将生产推理数据传递给模型进行预测之前,ML 工程师必须以与训练数据相同的方式对生产推理数据进行规范化。
哪种解决方案可以满足此要求?

25 / 100

25.

No.76
ML 工程师需要部署 ML 模型,以异步方式从大型数据集中获取推理。ML 工程师还需要实施对模型数据质量的定期监控。当数据质量发生变化时,ML 工程师必须收到警报。
哪种解决方案可以满足这些要求?

26 / 100

26.

No.75
一家公司希望使用来自其客户的表格数据来开发 ML 模型。数据包含有意义的有序特征,其中包含不应丢弃的敏感信息。ML 工程师必须确保在另一个团队开始构建模型之前屏蔽敏感数据。
哪种解决方案可以满足这些要求?

27 / 100

27.

No.74
一家公司正在使用 Amazon SageMaker 和数百万个文件来训练 ML 模型。每个文件大小为几兆字节。这些文件存储在 Amazon S3 存储桶中。该公司需要提高训练性能。
哪种解决方案可以在最短的时间内满足这些要求?

28 / 100

28.

No.73
一家公司正在使用自定义 Python 脚本和专有数据集在本地运行 ML 模型。该公司正在使用 PyTorch。模型构建需要独特的领域知识。该公司需要将模型迁移到 AWS。
哪种解决方案可以以最少的努力满足这些要求?

29 / 100

29.

No.72
一位 ML 工程师正在使用 Amazon SageMaker 训练需要分布式训练的深度学习模型。经过几次训练尝试后,ML 工程师发现实例的表现不如预期。ML 工程师确定了训练实例之间的通信开销。
ML 工程师应该怎么做才能最大限度地减少实例之间的通信开销?

30 / 100

30.

No.71
一家公司的 ML 工程师已将用于情绪分析的 ML 模型部署到 Amazon SageMaker 终端节点。ML 工程师需要向公司利益相关者说明该模型如何进行预测。
哪种解决方案将为模型的预测提供说明?

31 / 100

31.

No.70
一家公司需要托管自定义 ML 模型来执行预测分析。预测分析将在每天的同一 2 小时内以可预测和持续的负载进行。
分析期间的多次调用将需要快速响应。公司需要 AWS 来管理底层基础设施和任何自动扩展活动。
哪种解决方案可以满足这些要求?

32 / 100

32.

No.69
一家公司需要向其 ML 工程师提供适当的训练数据访问权限。ML 工程师必须仅从自己的业务组访问训练数据。ML 工程师不得被允许访问来自其他业务组的训练数据。
该公司使用单个 AWS 账户并将所有训练数据存储在 Amazon S3 存储桶中。所有 ML 模型训练都在 Amazon SageMaker 中进行。
哪种解决方案将为 ML 工程师提供适当的访问权限?

33 / 100

33.

No.68
ML 工程师需要使用 AWS 服务从文档中识别和提取有意义的唯一关键字。
哪种解决方案能够以最少的运营开销满足这些要求?

34 / 100

34.

No.67
一家公司有一个 ML 模型,该模型根据客户上传到公司网站的图像生成文本描述。图像总大小最多可达 50 MB。
ML 工程师决定将图像存储在 Amazon S3 存储桶中。 ML 工程师必须实施可扩展以适应需求变化的处理解决方案。
哪种解决方案能够以最少的运营开销满足这些要求?

35 / 100

35.

No.66
一家公司已使用 Amazon SageMaker 在生产中部署预测 ML 模型。该公司正在模型上使用 SageMaker Model Monitor。模型更新后,ML 工程师在 Model Monitor 检查中注意到数据质量问题。
ML 工程师应该做什么来缓解 Model Monitor 已识别的数据质量问题?

36 / 100

36.

No.65
一家公司正在使用 AWS Lambda 函数来监控来自 ML 模型的指标。ML 工程师需要实施一种解决方案,以便在指标超出阈值时发送电子邮件消息。
哪种解决方案可以满足此要求?

37 / 100

37.

No.64
一家公司计划在其主要 AWS 账户中使用 Amazon Redshift ML。源数据位于辅助账户中的 Amazon S3 存储桶中。
ML 工程师需要在主账户中设置 ML 管道以访问辅助账户中的 S3 存储桶。解决方案不得要求公共 IPv4 地址。
哪种解决方案可以满足这些要求?

38 / 100

38.

No.63
一家公司正在 Amazon SageMaker 上构建深度学习模型。该公司使用大量数据作为训练数据集。该公司需要优化模型的超参数,以最小化验证数据集上的损失函数。
哪种超参数调整策略将以最少的计算时间实现此目标?

39 / 100

39.

No.62
ML 工程师在 Amazon SageMaker 之外开发了一个二元分类模型。ML 工程师需要让 SageMaker Canvas 用户访问该模型以进行进一步调整。
模型工件存储在 Amazon S3 存储桶中。ML 工程师和 Canvas 用户属于同一个 SageMaker 域。
必须满足哪些要求组合,ML 工程师才能与 Canvas 用户共享模型?(选择两个。)

40 / 100

40.

No.61
一家公司拥有历史数据,显示客户是否需要公司员工的长期支持。该公司需要开发一个 ML 模型来预测新客户是否需要长期支持。
公司应该使用哪种建模方法来满足此要求?

41 / 100

41.

No.60
ML 工程师收到包含缺失值、重复值和极端异常值的数据集。ML 工程师必须将这些数据集合并到单个数据框中,并且必须为 ML 准备数据。
哪种解决方案可以满足这些要求?

42 / 100

42.

No.59
一家公司有一个应用程序,它使用不同的 API 为输入文本生成嵌入。该公司需要实施一个解决方案,每 3 个月自动轮换一次 API 令牌。
哪种解决方案可以满足此要求?

43 / 100

43.

No.58
一位 ML 工程师在 Amazon SageMaker 上训练了一个 ML 模型,以从闭路电视录像中检测汽车事故。ML 工程师使用 SageMaker Data Wrangler 创建了事故和非事故图像的训练数据集。
该模型在训练和验证期间表现良好。然而,由于来自不同摄像机的图像质量存在差异,该模型在生产中表现不佳。
哪种解决方案可以在最短的时间内提高模型的准确性?

44 / 100

44.

No.57
一家公司有一个 ML 模型,需要每晚运行一次以预测股票价值。模型输入是当天收集的 3 MB 数据。该模型生成第二天的预测。预测过程需要不到 1 分钟即可完成运行。
公司应如何在 Amazon SageMaker 上部署模型以满足这些要求?

45 / 100

45.

No.56
ML 工程师需要使用 Amazon SageMaker 对大型语言模型 (LLM) 进行微调,以进行文本摘要。ML 工程师必须遵循低代码无代码 (LCNC) 方法。
哪种解决方案可以满足这些要求?

46 / 100

46.

No.55
一家公司正在创建一个应用程序,该应用程序将向客户推荐产品。该应用程序将对 Amazon Q Business 进行 API 调用。该公司必须确保来自 Amazon Q Business 的响应不包含公司主要竞争对手的名称。
哪种解决方案可以满足此要求?

47 / 100

47.

No.54
一家公司使用 Amazon SageMaker 处理其 ML 工作负载。该公司的 ML 工程师收到一个 50 MB 的 Apache Parquet 数据文件来构建欺诈检测模型。该文件包含几个不需要的相关列。
ML 工程师应该怎么做才能以最少的努力删除文件中不必要的列?

48 / 100

48.

No.53
一家公司使用 Amazon SageMaker Studio 开发 ML 模型。该公司有一个 SageMaker Studio 域。ML 工程师需要实施一种解决方案,当 SageMaker 计算成本达到特定阈值时,该解决方案会提供自动警报。
哪种解决方案可以满足这些要求?

49 / 100

49.

No.52
ML 工程师需要实施解决方案来托管经过训练的 ML 模型。全天对模型的请求率将不一致。
ML 工程师需要一个可扩展的解决方案,以在模型未使用时最大限度地降低成本。该解决方案还必须保持模型在高峰使用期间响应请求的能力。
哪种解决方案可以满足这些要求?

50 / 100

50.

No.51
一家公司部署了一个 ML 模型,该模型可在银行应用程序中实时检测欺诈性信用卡交易。该模型使用 Amazon SageMaker 异步推理。消费者报告称,在接收推理结果时出现延迟。
ML 工程师需要实施解决方案来提高推理性能。当模型质量出现偏差时,解决方案还必须提供通知。
哪种解决方案可以满足这些要求?

51 / 100

51.

No.50
一家公司将有关用户点击的时间序列数据存储在 Amazon S3 存储桶中。原始数据每天包含数百万行用户活动。ML 工程师访问数据以开发他们的 ML 模型。
ML 工程师需要使用 Amazon Athena 生成每日报告并分析过去 3 天的点击趋势。公司必须在存档数据之前保留数据 30 天。
哪种解决方案将为数据检索提供最高的性能?

52 / 100

52.

No.49
一家信用卡公司在 Amazon SageMaker 终端上生产欺诈检测模型。该公司开发了该模型的新版本。该公司需要使用实时数据来评估新模型的性能,而不会影响生产最终用户。
哪种解决方案可以满足这些要求?

53 / 100

53.

No.48
一位 ML 工程师正在使用训练作业来微调 Amazon SageMaker Studio 中的深度学习模型。ML 工程师之前使用过相同的预训练模型和类似的数据集。ML 工程师预计会出现梯度消失、GPU 利用率不足和过度拟合问题。
ML 工程师需要实施解决方案来检测这些问题,并在问题发生时以预定义的方式做出反应。该解决方案还必须在训练期间提供全面的实时指标。
哪种解决方案能够以最少的运营开销满足这些要求?

54 / 100

54.

No.47
一家公司正在使用 Amazon Redshift 数据库作为其单一数据源。部分数据是敏感数据。
数据科学家需要使用数据库中的部分敏感数据。ML 工程师必须授予数据科学家访问数据的权限,而无需转换源数据,也不必在数据库中存储匿名数据。
哪种解决方案能够以最少的实施工作量满足这些要求?

55 / 100

55.

No.46
一家公司有由 AWS Glue 工作流编排的 AWS Glue 数据处理作业。 AWS Glue 作业可以按计划运行,也可以手动启动。
该公司正在 Amazon SageMaker Pipelines 中开发用于 ML 模型开发的管道。管道将在模型开发的数据处理阶段使用 AWS Glue 作业的输出。ML 工程师需要实施将 AWS Glue 作业与管道集成的解决方案。
哪种解决方案可以以最少的运营开销满足这些要求?

56 / 100

56.

No.45
一家公司已经使用 Amazon SageMaker 训练和部署了一个 ML 模型。该公司需要实施一个解决方案来记录和监控 SageMaker 端点的所有 API 调用事件。当 API 调用事件的数量超过阈值时,该解决方案还必须提供通知。
哪种解决方案可以满足这些要求?

57 / 100

57.

No.44
一位 ML 工程师正在评估多个 ML 模型,必须选择一个模型用于生产。模型的假阴性预测成本远高于假阳性预测成本。
ML 工程师在选择模型时应该优先考虑哪个指标结果?

58 / 100

58.

No.43
ML 工程师需要使用 Amazon SageMaker Canvas 中的数据来训练 ML 模型。数据存储在 Amazon S3 中,结构复杂。ML 工程师必须使用一种可以最大程度缩短数据处理时间的文件格式。
哪种文件格式可以满足这些要求?

59 / 100

59.

No.42
一家广告公司使用 AWS Lake Formation 来管理数据湖。数据湖包含结构化数据和非结构化数据。该公司的 ML 工程师被分配到特定的广告活动。
ML 工程师必须通过 Amazon Athena 与数据交互,并直接在 Amazon S3 存储桶中浏览数据。 ML 工程师必须只能访问特定于其分配的广告活动的资源。
哪种解决方案能够以最高效的方式满足这些要求?

60 / 100

60.

No.41
ML 工程师需要使用 AWS CloudFormation 创建 Amazon SageMaker 端点将托管的 ML 模型。
ML 工程师应在 CloudFormation 模板中声明哪种资源来满足此要求?

61 / 100

61.

No.40
一家公司计划创建多个 ML 预测模型。训练数据存储在 Amazon S3 中。整个数据集大小超过 5 TB,由 CSV、JSON、Apache Parquet 和简单文本文件组成。
必须分几个连续步骤处理数据。这些步骤包括复杂的操作,可能需要数小时才能完成运行。一些处理涉及自然语言处理 (NLP) 转换。整个过程必须自动化。
哪种解决方案可以满足这些要求?

62 / 100

62.

No.39
一家公司希望提高其 ML 运营的可持续性。
哪些行动将减少与公司培训工作相关的能源使用和计算资源?(选择两个。)

63 / 100

63.

No.38
ML 工程师需要使用 Amazon EMR 集群批量处理大量数据。任何数据丢失都是不可接受的。
哪种实例购买选项最经济高效地满足这些要求?

64 / 100

64.

No.37
一家公司已经在 Amazon SageMaker 中训练了一个 ML 模型。该公司需要托管该模型以在生产环境中提供推理。
该模型必须具有高可用性,并且必须以最小的延迟做出响应。每个请求的大小将在 1 KB 到 3 MB 之间。该模型将在白天收到不可预测的请求突发。推理必须根据需求的变化进行比例调整。
公司应如何将模型部署到生产中以满足这些要求?

65 / 100

65.

No.36
一家公司已实施了一条数据提取管道,用于从其电子商务网站提取销售交易数据。该公司使用 Amazon Data Firehose 将数据提取到 Amazon OpenSearch Service 中。Firehose 流的缓冲间隔设置为 60 秒。OpenSearch 线性模型根据数据生成实时销售预测,并将数据显示在 OpenSearch 仪表板中。
该公司需要优化数据提取管道,以支持实时仪表板的亚秒级延迟。
架构的哪些更改将满足这些要求?

66 / 100

66.

No.35
一家公司正在使用 ML 预测农民田地中是否存在特定杂草。该公司正在使用 Amazon SageMaker 线性学习器内置算法,其 predictorjype 超参数的值为 multiclass_dassifier。
公司应该怎么做才能最大限度地减少误报?

67 / 100

67.

No.34
一家公司有一个对话式 AI 助手,它通过 Amazon Bedrock 向 Anthropic Claude 大型语言模型 (LLM) 发送请求。用户报告说,当他们多次提出类似的问题时,他们有时会收到不同的答案。ML 工程师需要改进响应,使其更加一致且随机性更低。
哪种解决方案可以满足这些要求?

68 / 100

68.

No.33
一家公司在产品发布后收集了大量来自客户互动的聊天记录。ML 工程师需要创建一个 ML 模型来分析聊天数据。ML 工程师需要通过查看客户对产品的情绪来确定产品的成功。
ML 工程师应该采取哪些行动才能在最短的时间内完成评估?

69 / 100

69.

No.32
一家金融公司从外部提供商处收到大量实时市场数据流。这些流每秒包含数千条 JSON 记录。
该公司需要在 AWS 上实施可扩展的解决方案来识别异常数据点。
哪种解决方案能够以最少的运营开销满足这些要求?

70 / 100

70.

No.31
一家公司正在收集各种语言的音频、视频和文本数据。该公司需要使用大型语言模型 (LLM) 来汇总收集到的西班牙语数据。
哪种解决方案可以在最短的时间内满足这些要求?

71 / 100

71.

No.30
一家公司在新建 VPC 的公共子网中运行 Amazon SageMaker 域。网络配置正确,ML 工程师可以访问 SageMaker 域。
最近,该公司发现来自特定 IP 地址的域的可疑流量。该公司需要阻止来自特定 IP 地址的流量。
哪个网络配置更新将满足此要求?

72 / 100

72.

No.29
一家拥有数百名数据科学家的公司正在使用 Amazon SageMaker 创建 ML 模型。这些模型位于 SageMaker 模型注册表中的模型组中。
数据科学家分为三类:计算机视觉、自然语言处理 (NLP) 和语音识别。ML 工程师需要实施解决方案,将现有模型组织到这些组中,以提高模型的大规模可发现性。该解决方案不得影响模型工件及其现有分组的完整性。
哪种解决方案可以满足这些要求?

73 / 100

73.

No.28
ML 工程师需要在 AWS 上创建数据提取管道和 ML 模型部署管道。所有原始数据都存储在 Amazon S3 存储桶中。
哪种解决方案可以满足这些要求?

74 / 100

74.

No.27
一家公司使用混合云环境。部署在本地的模型使用 Amazon 53 中的数据为客户提供实时对话引擎。
该模型正在使用敏感数据。ML 工程师需要实施解决方案来识别和删除敏感数据。
哪种解决方案可以以最少的运营开销满足这些要求?

75 / 100

75.

No.26
一家公司希望通过考虑每个广告的配色方案来预测广告活动的成功。一位 ML 工程师正在为神经网络模型准备数据。数据集包含颜色信息作为分类数据。
ML 工程师应该为模型使用哪种特征工程技术?

76 / 100

76.

★No.25
一家公司使用 Amazon Athena 查询 Amazon S3 中的数据集。该数据集具有公司想要预测的目标变量。
该公司需要在解决方案中使用该数据集来确定模型是否可以预测目标变量。
哪种解决方案将以最少的开发工作量提供此信息?

77 / 100

77.

No.24
一家公司有一个检索增强生成 (RAG) 应用程序,该应用程序使用矢量数据库来存储文档的嵌入。该公司必须将应用程序迁移到 AWS,并且必须实施提供文本文件语义搜索的解决方案。该公司已将文本存储库迁移到 Amazon S3 存储桶。
哪种解决方案可以满足这些要求?

78 / 100

78.

No.23
ML 工程师正在训练一个简单的神经网络模型。ML 工程师在验证数据集上跟踪模型随时间的性能。模型的性能最初会大幅提高,然后在特定数量的时期后下降。
哪些解决方案可以缓解此问题?(选择两个。)

79 / 100

79.

No.22
一位 ML 工程师在 us-east-1 区域的账户 A 中有一个 Amazon Comprehend 自定义模型。ML 工程师需要将模型复制到同一区域的账户 B。
哪种解决方案可以以最少的开发工作量满足此要求?

80 / 100

80.

No.21
一家公司需要在 Amazon EC2 实例上运行批量数据处理作业。该作业将在周末运行,需要 90 分钟才能完成运行。处理可以处理中断。该公司将在接下来的 6 个月内每个周末运行该作业。
哪种 EC2 实例购买选项将最经济高效地满足这些要求?

81 / 100

81.

No.20
一家公司拥有一个大型的非结构化数据集。该数据集包含多个关键属性的许多重复记录。
AWS 上的哪种解决方案将以最少的代码开发检测数据集中的重复项?

82 / 100

82.

No.19
ML 工程师需要处理数千个现有 CSV 对象和上传的新 CSV 对象。CSV 对象存储在中央 Amazon S3 存储桶中,并具有相同数量的列。其中一列是交易日期。ML 工程师必须根据交易日期查询数据。
哪种解决方案可以以最少的运营开销满足这些要求?

83 / 100

83.

No.18
一位 ML 工程师使用随机梯度下降 (SGD) 训练了一个神经网络。神经网络在测试集上表现不佳。训练损失和验证损失的值仍然很高,并显示出振荡模式。这些值在几个时期内下降,然后在几个时期内增加,然后重复相同的循环。
ML 工程师应该做些什么来改进训练过程?

84 / 100

84.

No.17
ML 工程师需要使用 ML 模型来预测特定位置的公寓价格。
ML 工程师应该使用哪个指标来评估模型的性能?

85 / 100

85.

No.16
一家公司有一个数据科学家团队,他们使用 Amazon SageMaker 笔记本实例来测试 ML 模型。当数据科学家需要新的权限时,公司会将权限附加到在创建 SageMaker 笔记本实例期间创建的每个单独角色。
公司需要集中管理团队的权限。
哪种解决方案可以满足这一要求?

86 / 100

86.

No.15
一家公司在生产中部署了一个 XGBoost 预测模型,以预测客户是否有可能取消订阅。该公司使用 Amazon SageMaker Model Monitor 来检测 F1 分数的偏差。
在对模型质量进行基线分析时,该公司记录了 F1 分数的阈值。几个月没有变化后,模型的 F1 分数显着下降。
F1 分数降低的原因可能是什么?

87 / 100

87.

No.14
一位 ML 工程师正在 AWS 上开发欺诈检测模型。训练数据集包括来自本地 MySQL 数据库的交易日志、客户资料和表。交易日志和客户资料存储在 Amazon S3 中。
数据集存在类不平衡,影响模型算法的学习。此外,许多特征具有相互依赖性。该算法并未捕获数据中所有所需的底层模式。
ML 工程师需要使用 Amazon SageMaker 内置算法来训练模型。
ML 工程师应使用哪种算法来满足此要求?

88 / 100

88.

No.13
一位 ML 工程师正在 AWS 上开发欺诈检测模型。训练数据集包括来自本地 MySQL 数据库的交易日志、客户资料和表。交易日志和客户资料存储在 Amazon S3 中。
数据集存在类别不平衡问题,这会影响模型算法的学习。此外,许多功能具有相互依赖性。算法没有捕获数据中所有所需的底层模式。
在 ML 工程师训练模型之前,ML 工程师必须解决数据不平衡的问题。
哪种解决方案可以以最少的运营工作量满足此要求?

89 / 100

89.

No.12
ML 工程师正在 AWS 上开发欺诈检测模型。训练数据集包括来自本地 MySQL 数据库的交易日志、客户配置文件和表。交易日志和客户配置文件存储在 Amazon S3 中。
数据集的类不平衡会影响模型算法的学习。此外,许多功能具有相互依赖性。该算法没有捕获数据中所有所需的底层模式。
训练数据集包括分类数据和数值数据。ML 工程师必须准备训练数据集以最大限度地提高模型的准确性。
哪种操作可以以最少的运营开销满足此要求?

90 / 100

90.

No.11
一位 ML 工程师正在 AWS 上开发欺诈检测模型。训练数据集包括来自本地 MySQL 数据库的交易日志、客户资料和表。交易日志和客户资料存储在 Amazon S3 中。
数据集的类别不平衡会影响模型算法的学习。此外,许多功能具有相互依赖性。算法没有捕获数据中所有所需的底层模式。
数据聚合后,ML 工程师必须实施解决方案来自动检测数据中的异常并可视化结果。
哪种解决方案可以满足这些要求?

91 / 100

91.

No.10
ML 工程师正在 AWS 上开发欺诈检测模型。训练数据集包括来自本地 MySQL 数据库的交易日志、客户资料和表。交易日志和客户资料存储在 Amazon S3 中。
数据集具有类不平衡,这会影响模型算法的学习。此外,许多功能具有相互依赖性。该算法没有捕获数据中所有所需的底层模式。
哪个 AWS 服务或功能可以聚合来自各种数据源的数据?

92 / 100

92.

No.9
一位 ML 工程师正在开发一个 ML 模型来预测类似大小的房屋的价格。该模型将根据几个特征进行预测。ML 工程师将使用以下特征工程技术来估算房屋的价格:
• 特征分割
• 对数变换
• 独热编码
• 标准化分布
为以下特征列表选择正确的特征工程技术。每种特征工程技术都应选择一次或根本不选择(选择三种)。

93 / 100

93.

No.8
一位 ML 工程师正在使用大型语言模型 (LLM) 在 Amazon Bedrock 上构建生成式 AI 应用程序。
从以下列表中为每个描述选择正确的生成式 AI 术语。每个术语应选择一次或根本不选择。 (选择三项。)
• 嵌入
• 检索增强生成 (RAG)
• 温度
• 标记

94 / 100

94.

No.7
一家公司希望在 Amazon SageMaker 上托管 ML 模型。ML 工程师正在 AWS CodePipeline 中配置持续集成和持续交付 (CL/CD) 管道以部署模型。当模型的新训练数据上传到 Amazon S3 存储桶时,管道必须自动运行。
从以下列表中选择并排序管道的正确步骤。每个步骤应选择一次或根本不选择。(选择并排序三个。)
• 上传新数据时,S3 事件通知会调用管道。
• 上传新数据时,S3 生命周期规则会调用管道。
• SageMaker 使用 S3 存储桶中的数据重新训练模型。
• 管道将模型部署到 SageMaker 端点。
• 管道将模型部署到 SageMaker 模型注册表。

95 / 100

95.

No.6
ML 工程师需要使用 Amazon SageMaker Feature Store 创建和管理特征以训练模型。
从以下列表中选择并排序步骤以在 Feature Store 中创建和使用特征。每个步骤应选择一次。(选择并排序三个。)
• 访问商店以构建用于训练的数据集。
• 创建特征组。
• 提取记录。

96 / 100

96.

No.5
一家公司将历史数据存储在 Amazon S3 中的 .csv 文件中。.csv 文件中只有部分行和列被填充。列未标记。 ML 工程师需要准备和存储数据,以便公司可以使用数据来训练 ML 模型。
从以下列表中选择并排序正确的步骤来执行此任务。每个步骤应选择一次或根本不选择。(选择并排序三个。)
• 创建 Amazon SageMaker 批量转换作业以进行数据清理和特征工程。
• 将结果数据存储回 Amazon S3。
• 使用 Amazon Athena 推断架构和可用列。
• 使用 AWS Glue 爬虫推断架构和可用列。
• 使用 AWS Glue DataBrew 进行数据清理和特征工程。

97 / 100

97.

No.4
一家公司正在使用 Amazon SageMaker 构建基于 Web 的 AI 应用程序。该应用程序将提供以下功能和特性:ML 实验、训练、中央模型注册表、模型部署和模型监控。
该应用程序必须确保在 ML 生命周期内安全且独立地使用训练数据。训练数据存储在 Amazon S3 中。
该公司需要运行按需工作流来监控从应用程序部署到实时终端的模型的偏差漂移。
哪种操作可以满足此要求?

98 / 100

98.

No.3
一家公司正在使用 Amazon SageMaker 构建基于 Web 的 AI 应用程序。该应用程序将提供以下功能和特性:ML 实验、训练、中央模型注册表、模型部署和模型监控。
该应用程序必须确保在 ML 生命周期内安全且独立地使用训练数据。训练数据存储在 Amazon S3 中。
公司必须实施基于手动审批的工作流程,以确保只有批准的模型才能部署到生产端点。
哪种解决方案可以满足此要求?

99 / 100

99.

No.2
一家公司正在使用 Amazon SageMaker 构建基于 Web 的 AI 应用程序。该应用程序将提供以下功能和特性:ML 实验、训练、中央模型注册表、模型部署和模型监控。
该应用程序必须确保在 ML 生命周期内安全且独立地使用训练数据。训练数据存储在 Amazon S3 中。
该公司正在试验连续的训练作业。
公司如何最大限度地缩短这些作业的基础设施启动时间?

100 / 100

100.

No.1
一家公司正在使用 Amazon SageMaker 构建基于 Web 的 AI 应用程序。该应用程序将提供以下功能和特性:ML 实验、训练、中央模型注册表、模型部署和模型监控。
该应用程序必须确保在 ML 生命周期内安全且独立地使用训练数据。训练数据存储在 Amazon S3 中。
该公司需要使用中央模型注册表来管理应用程序中不同版本的模型。
哪种操作可以以最少的运营开销满足此要求?

Your score is

0%

■AWS MLA-C01(CN) Q.101-114

/14

AWS MLA-C01(CN) 101-114

AWS Certified Machine Learning Engineer – Associate 认证验证在生产环境中实施机器学习工作负载并实现其运营化的技术能力。提升您的职业形象与信誉,为胜任热门机器学习岗位做好准备。

1 / 14

1.

No.101
一家公司需要一个 AWS 解决方案,该解决方案将在创建模型时自动创建 ML 模型的版本。
哪种解决方案可以满足此要求?

2 / 14

2.

No.102
一家公司需要使用检索增强生成 (RAG) 来补充在 Amazon Bedrock 上运行的开源大型语言模型 (LLM)。该公司的 RAG 数据是 Amazon S3 存储桶中的一组文档。这些文档由 .csv 文件和 .docx 文件组成。
哪种解决方案可以以最少的运营开销满足这些要求?

3 / 14

3.

No.103
一家公司计划在 Amazon SageMaker 终端节点上部署用于生产推理的 ML 模型。平均推理负载大小从 100 MB 到 300 MB 不等。推理请求必须在 60 分钟或更短的时间内处理。
哪种 SageMaker 推理选项可以满足这些要求?

4 / 14

4.

No.104
ML 工程师在图像分类训练作业中注意到类别不平衡。
ML 工程师应该怎么做才能解决这个问题?

5 / 14

5.

No.105
一家公司每天收到有关客户与其 ML 模型交互的 .csv 文件。该公司将文件存储在 Amazon S3 中,并使用这些文件重新训练模型。ML 工程师需要实施一种解决方案,在重新训练模型之前屏蔽文件中的信用卡号。
哪种解决方案可以以最少的开发工作量满足此要求?

6 / 14

6.

No.106
一家医疗公司正在使用 AWS 构建一种工具来为患者推荐治疗方法。该公司已从患者那里获得了健康记录和自我报告的英文文本信息。该公司需要使用这些信息来深入了解患者。
哪种解决方案可以以最少的开发工作量满足此要求?

7 / 14

7.

No.107
一家公司需要从 PDF 文档中提取实体以构建分类器模型。
哪种解决方案将在最短的时间内提取和存储实体?

8 / 14

8.

No.108
一家公司共享可通过 VPN 访问的 Amazon SageMaker Studio 笔记本。该公司必须实施访问控制,以防止恶意行为者利用预签名 URL 访问笔记本。
哪种解决方案可以满足这些要求?

9 / 14

9.

No.109
ML 工程师需要合并和转换来自两个来源的数据以重新训练现有的 ML 模型。一个数据源由存储在 Amazon S3 存储桶中的 .csv 文件组成。每个 .csv 文件包含数百万条记录。另一个数据源是 Amazon Aurora DB 集群。
合并过程的结果必须写入第二个 S3 存储桶。ML 工程师需要每周执行此合并和转换任务。
哪种解决方案可以以最少的运营开销满足这些要求?

10 / 14

10.

No.110
ML 工程师已将 Amazon SageMaker 模型部署到生产中的无服务器终端节点。该模型由 InvokeEndpoint API 操作调用。
生产中的模型延迟高于测试环境中的基线延迟。ML 工程师认为延迟增加是因为模型启动时间。
ML 工程师应该做什么来确认或否认这个假设?

11 / 14

11.

No.111
ML 工程师需要确保数据集符合个人身份信息 (PII) 的规定。ML 工程师将使用这些数据在 Amazon SageMaker 实例上训练 ML 模型。SageMaker 不得使用任何 PII。
哪种解决方案能够以最高效的方式满足这些要求?

12 / 14

12.

No.112
公司必须在任何新创建的 Amazon SageMaker 笔记本实例上安装自定义脚本。
哪种解决方案可以以最少的运营开销满足此要求?

13 / 14

13.

★No.113
一家公司正在为电子商务应用程序构建实时数据处理管道。该应用程序生成大量点击流数据,必须近乎实时地提取、处理和可视化这些数据。该公司需要一个支持 SQL 进行数据处理和 Jupyter 笔记本进行交互式分析的解决方案。
哪种解决方案可以满足这些要求?

14 / 14

14.

No.114
一家医疗公司需要存储临床数据。数据包括个人身份信息 (PII) 和受保护的健康信息 (PHI)。
ML 工程师需要实施解决方案以确保 PII 和 PHI 不用于训练 ML 模型。
哪种解决方案可以满足这些要求?

Your score is

0%

最終更新: 3月 25, 2025