AWS Certified Machine Learning Engineer – Associate は、本番環境に ML を実装して運用可能にする技術的能力を実証するものです。キャリアプロファイルと信頼性を向上させて、需要の高い機械学習に関連する職務に備えましょう。

■AWS MLA-C01(jp) All

/114

AWS MLA-C01(JP) All

AWS Certified Machine Learning Engineer - Associate は、本番環境に ML を実装して運用可能にする技術的能力を実証するものです。キャリアプロファイルと信頼性を向上させて、需要の高い機械学習に関連する職務に備えましょう。

1 / 114

1.

No.1
ある企業が Amazon SageMaker を使用して Web ベースの AI アプリケーションを構築しています。このアプリケーションは、ML 実験、トレーニング、中央モデル レジストリ、モデルのデプロイ、およびモデル モニタリングの機能を提供します。
アプリケーションは、ML ライフサイクル中にトレーニング データを安全かつ分離して使用する必要があります。トレーニング データは Amazon S3 に保存されます。
この企業は、中央モデル レジストリを使用して、アプリケーション内のさまざまなバージョンのモデルを管理する必要があります。
どのアクションが、運用オーバーヘッドを最小限に抑えながらこの要件を満たしますか?

2 / 114

2.

No.2
ある会社が、Amazon SageMaker を使用して Web ベースの AI アプリケーションを構築しています。このアプリケーションは、ML 実験、トレーニング、中央モデル レジストリ、モデルのデプロイ、およびモデルのモニタリングという機能を提供します。
アプリケーションは、ML ライフサイクル中にトレーニング データを安全かつ分離して使用する必要があります。トレーニング データは Amazon S3 に保存されます。
会社は連続したトレーニング ジョブを実験しています。
会社は、これらのジョブのインフラストラクチャの起動時間を最小限に抑えるにはどうすればよいですか?

3 / 114

3.

No.3
ある企業が Amazon SageMaker を使用して Web ベースの AI アプリケーションを構築しています。このアプリケーションは、ML 実験、トレーニング、中央モデルレジストリ、モデルのデプロイ、およびモデルのモニタリングという機能を提供します。
アプリケーションは、ML ライフサイクル中にトレーニングデータを安全かつ分離して使用する必要があります。トレーニングデータは Amazon S3 に保存されます。
承認されたモデルのみが本番エンドポイントにデプロイされるように、会社は手動承認ベースのワークフローを実装する必要があります。
この要件を満たすソリューションはどれですか?

4 / 114

4.

No.4
ある企業が Amazon SageMaker を使用して Web ベースの AI アプリケーションを構築しています。このアプリケーションは、ML 実験、トレーニング、中央モデルレジストリ、モデルのデプロイ、およびモデルのモニタリングという機能を提供します。
アプリケーションは、ML ライフサイクル中にトレーニング データを安全かつ分離して使用する必要があります。トレーニング データは Amazon S3 に保存されます。
企業は、アプリケーションからリアルタイム エンドポイントにデプロイされるモデルのバイアス ドリフトを監視するために、オンデマンド ワークフローを実行する必要があります。
この要件を満たすアクションはどれですか?

5 / 114

5.

No.5
ある会社が Amazon S3 の .csv ファイルに履歴データを保存しています。.csv ファイルの一部の行と列のみが入力されています。列にはラベルが付いていません。 ML エンジニアは、企業がデータを使用して ML モデルをトレーニングできるように、データを準備して保存する必要があります。

このタスクを実行するには、次のリストから適切な手順を選択して順序付けします。各手順は 1 回選択するか、まったく選択しないでください。(3 つ選択して順序付けします。)
• データのクリーニングと機能エンジニアリングのために Amazon SageMaker バッチ変換ジョブを作成します。
• 結果のデータを Amazon S3 に戻して保存します。
• Amazon Athena を使用して、スキーマと使用可能な列を推測します。
• AWS Glue クローラーを使用して、スキーマと使用可能な列を推測します。
• データのクリーニングと機能エンジニアリングに AWS Glue DataBrew を使用します。

6 / 114

6.

No.6
ML エンジニアは、Amazon SageMaker Feature Store を使用して、モデルをトレーニングするための機能を作成および管理する必要があります。
Feature Store で機能を作成して使用するには、次のリストから手順を選択して順序付けします。各手順は 1 回選択する必要があります (3 つ選択して順序付けします)。
• ストアにアクセスして、トレーニング用のデータセットを構築します。
• 機能グループを作成します。
• レコードを取り込みます。

7 / 114

7.

No.7
ある会社が Amazon SageMaker で ML モデルをホストしたいと考えています。ML エンジニアは、モデルをデプロイするために AWS CodePipeline で継続的インテグレーションと継続的デリバリー (Cl/CD) パイプラインを構成しています。モデルの新しいトレーニングデータが Amazon S3 バケットにアップロードされると、パイプラインが自動的に実行される必要があります。
次のリストからパイプラインの正しい手順を選択して順序付けします。各ステップは 1 回選択するか、まったく選択しないでください (3 つ選択して順序付けしてください)。
• 新しいデータがアップロードされると、S3 イベント通知によってパイプラインが呼び出されます。
• 新しいデータがアップロードされると、S3 ライフサイクル ルールによってパイプラインが呼び出されます。
• SageMaker は、S3 バケット内のデータを使用してモデルを再トレーニングします。
• パイプラインは、モデルを SageMaker エンドポイントにデプロイします。
• パイプラインは、モデルを SageMaker モデル レジストリにデプロイします。

8 / 114

8.

No.8
ML エンジニアが、大規模言語モデル (LLM) を使用して Amazon Bedrock 上に生成 AI アプリケーションを構築しています。
各説明について、次のリストから正しい生成 AI 用語を選択してください。各用語は 1 回選択するか、まったく選択しないでください。 (3 つ選択してください。)
• 埋め込み
• 検索拡張生成 (RAG)
• 温度
• トークン

9 / 114

9. No.9

ML エンジニアは、同様のサイズの住宅の価格を予測する ML モデルに取り組んでいます。モデルは、いくつかの特徴に基づいて予測を行います。ML エンジニアは、次の特徴エンジニアリング手法を使用して住宅の価格を推定します。
• 特徴の分割
• 対数変換
• ワンホット エンコーディング
• 標準化された分布
次の特徴のリストに対して正しい特徴エンジニアリング手法を選択してください。各特徴エンジニアリング手法は、1 回だけ選択するか、まったく選択しないでください (3 つ選択してください)。

10 / 114

10.

No.10
ML エンジニアが AWS で不正検出モデルを開発しています。トレーニング データセットには、オンプレミスの MySQL データベースからのトランザクション ログ、顧客プロファイル、およびテーブルが含まれています。トランザクション ログと顧客プロファイルは Amazon S3 に保存されています。
データセットには、モデルのアルゴリズムの学習に影響を与えるクラスの不均衡があります。さらに、多くの機能には相互依存性があります。アルゴリズムは、データ内の必要な基礎パターンをすべてキャプチャしていません。
さまざまなデータ ソースからデータを集約できる AWS のサービスまたは機能はどれですか。

11 / 114

11.

No.11
ML エンジニアが AWS で不正検出モデルを開発しています。トレーニング データセットには、トランザクション ログ、顧客プロファイル、オンプレミスの MySQL データベースのテーブルが含まれています。トランザクション ログと顧客プロファイルは Amazon S3 に保存されます。
データセットには、モデルのアルゴリズムの学習に影響を与えるクラスの不均衡があります。さらに、多くの機能には相互依存性があります。アルゴリズムは、データ内の必要な基礎パターンをすべてキャプチャしていません。
データが集約された後、ML エンジニアは、データ内の異常を自動的に検出し、結果を視覚化するソリューションを実装する必要があります。
これらの要件を満たすソリューションはどれですか?

12 / 114

12.

No.12
ML エンジニアが AWS で不正検出モデルを開発しています。トレーニング データセットには、オンプレミスの MySQL データベースからのトランザクション ログ、顧客プロファイル、テーブルが含まれています。トランザクション ログと顧客プロファイルは Amazon S3 に保存されています。
データセットには、モデルのアルゴリズムの学習に影響を与えるクラスの不均衡があります。さらに、多くの機能には相互依存性があります。アルゴリズムは、データ内の必要な基礎パターンをすべてキャプチャしていません。
トレーニング データセットには、カテゴリ データと数値データが含まれています。ML エンジニアは、モデルの精度を最大化するためにトレーニング データセットを準備する必要があります。
次のアクションでこの要件を満たすのはどれですか。最も運用上のオーバーヘッドが少ないのはどれですか?

13 / 114

13.

No.13
ML エンジニアが AWS で不正検出モデルを開発しています。トレーニング データセットには、オンプレミスの MySQL データベースからのトランザクション ログ、顧客プロファイル、テーブルが含まれています。トランザクション ログと顧客プロファイルは Amazon S3 に保存されています。
データセットには、モデルのアルゴリズムの学習に影響するクラスの不均衡があります。さらに、多くの機能に相互依存性があります。アルゴリズムは、データ内の必要な基礎パターンをすべてキャプチャしていません。
ML エンジニアがモデルをトレーニングする前に、ML エンジニアは不均衡なデータの問題を解決する必要があります。
どのソリューションが、最も少ない運用労力でこの要件を満たしますか?

14 / 114

14.

No.14
ML エンジニアが AWS で不正検出モデルを開発しています。トレーニング データセットには、オンプレミスの MySQL データベースからのトランザクション ログ、顧客プロファイル、テーブルが含まれます。トランザクション ログと顧客プロファイルは Amazon S3 に保存されます。
データセットには、モデルのアルゴリズムの学習に影響するクラスの不均衡があります。さらに、多くの機能には相互依存性があります。アルゴリズムは、データ内の必要な基礎パターンをすべてキャプチャしていません。
ML エンジニアは、Amazon SageMaker 組み込みアルゴリズムを使用してモデルをトレーニングする必要があります。
この要件を満たすために、ML エンジニアはどのアルゴリズムを使用する必要がありますか?

15 / 114

15.

No.15
ある企業は、顧客がサブスクリプションをキャンセルする可能性があるかどうかを予測するために、XGBoost 予測モデルを本番環境に導入しました。同社は、F1 スコアの偏差を検出するために Amazon SageMaker Model Monitor を使用しています。
モデル品質のベースライン分析中に、同社は F1 スコアのしきい値を記録しました。数か月間変化がなかった後、モデルの F1 スコアが大幅に低下しました。
F1 スコアが低下した理由は何でしょうか?

16 / 114

16.

No.16
ある会社には、Amazon SageMaker ノートブックインスタンスを使用して ML モデルをテストするデータサイエンティストのチームがあります。データサイエンティストが新しい権限を必要とする場合、会社は SageMaker ノートブックインスタンスの作成中に作成された個々のロールに権限をアタッチします。
会社はチームの権限を一元管理する必要があります。
この要件を満たすソリューションはどれですか?

17 / 114

17.

No.17
ML エンジニアは、ML モデルを使用して特定の場所のアパートの価格を予測する必要があります。
ML エンジニアは、モデルのパフォーマンスを評価するためにどのメトリックを使用する必要がありますか?

18 / 114

18.

No.18
ML エンジニアが確率的勾配降下法 (SGD) を使用してニューラル ネットワークをトレーニングしました。ニューラル ネットワークはテスト セットでパフォーマンスが低下しています。トレーニング損失と検証損失の値は高いままで、振動パターンを示しています。値は数エポック減少し、その後数エポック増加してから同じサイクルを繰り返します。
ML エンジニアはトレーニング プロセスを改善するために何をすべきでしょうか?

19 / 114

19.

No.19
ML エンジニアは、何千もの既存の CSV オブジェクトとアップロードされた新しい CSV オブジェクトを処理する必要があります。CSV オブジェクトは中央の Amazon S3 バケットに保存され、列の数も同じです。列の 1 つはトランザクションの日付です。ML エンジニアは、トランザクションの日付に基づいてデータをクエリする必要があります。
どのソリューションが、運用オーバーヘッドを最小限に抑えながらこれらの要件を満たしますか?

20 / 114

20.

No.20
ある企業には、大規模で構造化されていないデータセットがあります。データセットには、いくつかの主要な属性にわたって多くの重複レコードが含まれています。
AWS のどのソリューションが、コード開発を最小限に抑えてデータセット内の重複を検出しますか?

21 / 114

21.

No.21
ある企業は、Amazon EC2 インスタンスでバッチ データ処理ジョブを実行する必要があります。ジョブは週末に実行され、完了までに 90 分かかります。処理は中断を処理できます。会社は今後 6 か月間、毎週末にジョブを実行します。
これらの要件を最もコスト効率よく満たす EC2 インスタンス購入オプションはどれですか?

22 / 114

22.

No.22
ML エンジニアは、us-east-1 リージョンのアカウント A に Amazon Comprehend カスタムモデルを持っています。ML エンジニアは、モデルを同じリージョンのアカウント B にコピーする必要があります。
開発の労力を最小限に抑えてこの要件を満たすソリューションはどれですか?

23 / 114

23.

No.23
ML エンジニアが単純なニューラル ネットワーク モデルをトレーニングしています。ML エンジニアは、検証データセットでモデルのパフォーマンスを時間の経過とともに追跡します。モデルのパフォーマンスは最初は大幅に向上しますが、特定のエポック数を超えると低下します。
どのソリューションがこの問題を軽減しますか? (2 つ選択してください)。

24 / 114

24.

No.24
ある会社には、ドキュメントの埋め込みを保存するためにベクトル データベースを使用する Retrieval Augmented Generation (RAG) アプリケーションがあります。会社はアプリケーションを AWS に移行し、テキストファイルのセマンティック検索を提供するソリューションを実装する必要があります。 会社はすでにテキストリポジトリを Amazon S3 バケットに移行しています。
これらの要件を満たすソリューションはどれですか?

25 / 114

25.

★No.25
ある会社が Amazon Athena を使用して Amazon S3 のデータセットをクエリします。データセットには、会社が予測したいターゲット変数があります。
会社は、モデルがターゲット変数を予測できるかどうかを判断するために、ソリューションでデータセットを使用する必要があります。
どのソリューションが、この情報を最も少ない開発労力で提供しますか?

26 / 114

26.

No.26
ある企業は、各広告の配色を考慮して広告キャンペーンの成功を予測したいと考えています。ML エンジニアはニューラル ネットワーク モデル用のデータを準備しています。データセットには、カテゴリ データとして色情報が含まれています。
ML エンジニアは、モデルにどの機能エンジニアリング手法を使用する必要がありますか?

27 / 114

27.

No.27
ある会社ではハイブリッドクラウド環境を使用しています。オンプレミスでデプロイされたモデルは、Amazon 53 のデータを使用して、顧客にライブ会話エンジンを提供します。
モデルは機密データを使用しています。ML エンジニアは、機密データを識別して削除するためのソリューションを実装する必要があります。
どのソリューションが、運用オーバーヘッドを最小限に抑えながらこれらの要件を満たしますか?

28 / 114

28.

No.28
ML エンジニアは、AWS でデータ取り込みパイプラインと ML モデル展開パイプラインを作成する必要があります。すべての生データは Amazon S3 バケットに保存されます。
これらの要件を満たすソリューションはどれですか?

29 / 114

29.

No.29
何百人ものデータ サイエンティストを抱える企業が、Amazon SageMaker を使用して ML モデルを作成しています。モデルは、SageMaker モデル レジストリのモデル グループにあります。
データ サイエンティストは、コンピューター ビジョン、自然言語処理 (NLP)、音声認識の 3 つのカテゴリにグループ化されています。ML エンジニアは、既存のモデルをこれらのグループに整理して、大規模なモデルの検出可能性を向上させるソリューションを実装する必要があります。ソリューションは、モデル成果物の整合性と既存のグループ化に影響を与えてはなりません。
これらの要件を満たすソリューションはどれですか?

30 / 114

30.

No.30
ある会社が、新しく作成された VPC のパブリック サブネットで Amazon SageMaker ドメインを実行しています。ネットワークは適切に構成されており、ML エンジニアは SageMaker ドメインにアクセスできます。
最近、会社は特定の IP アドレスからドメインへの疑わしいトラフィックを発見しました。会社は特定の IP アドレスからのトラフィックをブロックする必要があります。
この要件を満たすネットワーク構成の更新はどれですか?

31 / 114

31.

No.31
ある会社がさまざまな言語で音声、動画、テキストデータを収集しています。この会社は、スペイン語で収集されたデータを要約するために、大規模言語モデル (LLM) を使用する必要があります。
これらの要件を最短時間で満たすソリューションはどれですか?

32 / 114

32.

No.32
金融会社が外部プロバイダーから大量のリアルタイム市場データストリームを受信します。ストリームは、毎秒数千の JSON レコードで構成されています。
会社は、異常なデータポイントを識別するために、AWS でスケーラブルなソリューションを実装する必要があります。
どのソリューションが、最小の運用オーバーヘッドでこれらの要件を満たしますか?

33 / 114

33.

No.33
ある企業には、製品リリース後の顧客とのやり取りからのチャット録音の大規模なコレクションがあります。ML エンジニアは、チャットデータを分析するための ML モデルを作成する必要があります。 ML エンジニアは、製品に関する顧客の感情をレビューして、製品の成功を判断する必要があります。
最短時間で評価を完了するために、ML エンジニアが実行すべきアクションはどれですか?

34 / 114

34.

No.34
ある企業には、Amazon Bedrock を介して Anthropic Claude 大規模言語モデル (LLM) にリクエストを送信する会話型 AI アシスタントがあります。ユーザーから、同様の質問を複数回行うと、異なる回答が返されることがあるという報告があります。 ML エンジニアは、応答をより一貫性のあるランダム性のないものに改善する必要があります。これらの要件を満たすソリューションはどれですか?

35 / 114

35.

No.35
ある会社が ML を使用して、農家の畑に特定の雑草が存在するかどうかを予測しています。この会社は、predictorjype ハイパーパラメータに multiclass_dassifier の値を使用して、Amazon SageMaker 線形学習器の組み込みアルゴリズムを使用しています。
偽陽性を最小限に抑えるには、会社はどうすればよいですか?

36 / 114

36.

No.36
ある会社が、自社の e コマース Web サイトからの販売取引用のデータ取り込みパイプラインを実装しました。この会社は、Amazon Data Firehose を使用して Amazon OpenSearch Service にデータを取り込みます。Firehose ストリームのバッファ間隔は 60 秒に設定されています。OpenSearch 線形モデルは、データに基づいてリアルタイムの販売予測を生成し、そのデータを OpenSearch ダッシュボードに表示します。
この会社は、リアルタイム ダッシュボードの 1 秒未満のレイテンシーをサポートするために、データ取り込みパイプラインを最適化する必要があります。
アーキテクチャのどの変更がこれらの要件を満たすでしょうか。

37 / 114

37.

No.37
ある企業が Amazon SageMaker で ML モデルをトレーニングしました。この企業は、本番環境で推論を提供するためにモデルをホストする必要があります。
モデルは可用性が高く、レイテンシーが最小限で応答する必要があります。各リクエストのサイズは 1 KB から 3 MB の間になります。モデルは、日中に予測できないリクエストの急増を受け取ります。推論は、需要の変化に比例して適応する必要があります。
これらの要件を満たすために、企業はモデルを本番環境に導入するにはどうすればよいでしょうか?

38 / 114

38.

No.38
ML エンジニアは、Amazon EMR クラスターを使用して大量のデータをバッチで処理する必要があります。データ損失は許容されません。
これらの要件を最もコスト効率よく満たすインスタンス購入オプションはどれですか?

39 / 114

39.

No.39
ある企業は、ML 運用の持続可能性を改善したいと考えています。
どのアクションが、企業のトレーニング ジョブに関連するエネルギー使用量と計算リソースを削減しますか? (2 つ選択してください)。

40 / 114

40.

No.40
ある会社が複数の ML 予測モデルを作成する予定です。トレーニング データは Amazon S3 に保存されます。データセット全体のサイズは 5 TB 以上で、CSV、JSON、Apache Parquet、および単純なテキスト ファイルで構成されています。
データは、複数の連続したステップで処理する必要があります。ステップには、完了するまでに数時間かかる複雑な操作が含まれます。処理の一部には、自然言語処理 (NLP) 変換が含まれます。プロセス全体を自動化する必要があります。
これらの要件を満たすソリューションはどれですか?

41 / 114

41.

No.41
ML エンジニアは、AWS CloudFormation を使用して、Amazon SageMaker エンドポイントがホストする ML モデルを作成する必要があります。
この要件を満たすために、ML エンジニアは CloudFormation テンプレートでどのリソースを宣言する必要がありますか?

42 / 114

42.

No.42
広告会社では、AWS Lake Formation を使用してデータレイクを管理しています。データレイクには、構造化データと非構造化データが含まれています。同社の ML エンジニアは、特定の広告キャンペーンに割り当てられています。
ML エンジニアは、Amazon Athena を介して、または Amazon S3 バケットで直接データを参照することによって、データとやり取りする必要があります。ML エンジニアは、割り当てられた広告キャンペーンに固有のリソースにのみアクセスできる必要があります。
どのソリューションが、これらの要件を最も効率的に運用できるでしょうか。

43 / 114

43.

No.43
ML エンジニアは、Amazon SageMaker Canvas でデータを使用して ML モデルをトレーニングする必要があります。データは Amazon S3 に保存され、構造が複雑です。ML エンジニアは、データの処理時間を最小限に抑えるファイル形式を使用する必要があります。
これらの要件を満たすファイル形式はどれですか?

44 / 114

44.

No.44
ML エンジニアは複数の ML モデルを評価しており、本番で使用するモデルを 1 つ選択する必要があります。モデルによる偽陰性の予測のコストは、偽陽性の予測のコストよりもはるかに高くなります。
ML エンジニアがモデルを選択する際に最も優先すべきメトリックの検出結果はどれですか?

45 / 114

45.

No.45
ある会社が Amazon SageMaker を使用して ML モデルをトレーニングし、デプロイしました。この会社は、SageMaker エンドポイントのすべての API 呼び出しイベントを記録および監視するソリューションを実装する必要があります。また、ソリューションでは、API 呼び出しイベントの数がしきい値を超えた場合に通知を提供する必要があります。
これらの要件を満たすソリューションはどれですか?

46 / 114

46.

No.46
ある会社には、AWS Glue ワークフローによってオーケストレーションされる AWS Glue データ処理ジョブがあります。AWS Glue ジョブはスケジュールに従って実行することも、手動で起動することもできます。
この会社は、ML モデル開発用に Amazon SageMaker Pipelines でパイプラインを開発しています。パイプラインは、モデル開発のデータ処理フェーズで AWS Glue ジョブの出力を使用します。ML エンジニアは、AWS Glue ジョブをパイプラインと統合するソリューションを実装する必要があります。
どのソリューションが、運用オーバーヘッドを最小限に抑えながらこれらの要件を満たしますか?

47 / 114

47.

No.47
ある会社では、Amazon Redshift データベースを単一のデータソースとして使用しています。データの一部は機密です。
データサイエンティストは、データベースから機密データの一部を使用する必要があります。ML エンジニアは、ソースデータを変換したり、匿名化されたデータをデータベースに保存したりすることなく、データサイエンティストにデータへのアクセスを許可する必要があります。
どのソリューションが、実装の労力を最小限に抑えてこれらの要件を満たしますか?

48 / 114

48.

No.48
ML エンジニアは、Amazon SageMaker Studio でディープラーニング モデルを微調整するためにトレーニング ジョブを使用しています。ML エンジニアは以前、同様のデータセットで同じ事前トレーニング済みモデルを使用していました。ML エンジニアは、勾配消失、GPU の活用不足、および過剰適合の問題を予想しています。
ML エンジニアは、これらの問題を検出し、問題が発生したときに定義済みの方法で対処するためのソリューションを実装する必要があります。また、ソリューションは、トレーニング中に包括的なリアルタイム メトリックを提供する必要があります。
どのソリューションが、運用オーバーヘッドを最小限に抑えながらこれらの要件を満たしますか?

49 / 114

49.

No.49
クレジットカード会社には、Amazon SageMaker エンドポイントで運用中の不正検出モデルがあります。この会社は、モデルの新しいバージョンを開発します。会社は、ライブ データを使用して、運用エンド ユーザーに影響を与えずに、新しいモデルのパフォーマンスを評価する必要があります。
これらの要件を満たすソリューションはどれですか?

50 / 114

50.

No.50
ある企業は、ユーザーのクリックに関する時系列データを Amazon S3 バケットに保存しています。生データは、毎日のユーザー アクティビティの何百万行にもなります。ML エンジニアは、データにアクセスして ML モデルを開発します。
ML エンジニアは、Amazon Athena を使用して毎日レポートを生成し、過去 3 日間のクリック傾向を分析する必要があります。企業は、データをアーカイブする前に 30 日間データを保持する必要があります。どのソリューションがデータ取得に最高のパフォーマンスを提供しますか?

51 / 114

51.

No.51
ある企業が、銀行アプリケーションで不正なクレジットカード取引をリアルタイムで検出する ML モデルを導入しました。このモデルは Amazon SageMaker 非同期推論を使用しています。消費者は推論結果の受信が遅れていると報告しています。
ML エンジニアは、推論パフォーマンスを向上させるソリューションを実装する必要があります。また、モデル品質の逸脱が発生したときに通知を提供するソリューションも必要です。
これらの要件を満たすソリューションはどれですか?

52 / 114

52.

No.52
ML エンジニアは、トレーニング済みの ML モデルをホストするためのソリューションを実装する必要があります。モデルへのリクエストのレートは、1 日を通して一定ではありません。
ML エンジニアは、モデルが使用されていないときにコストを最小限に抑えるスケーラブルなソリューションを必要としています。また、ソリューションは、ピーク使用時にリクエストに応答するモデルの容量を維持する必要があります。
これらの要件を満たすソリューションはどれですか?

53 / 114

53.

No.53
ある会社が Amazon SageMaker Studio を使用して ML モデルを開発しています。この会社には 1 つの SageMaker Studio ドメインがあります。ML エンジニアは、SageMaker のコンピューティング コストが特定のしきい値に達したときに自動アラートを提供するソリューションを実装する必要があります。
どのソリューションがこれらの要件を満たしますか?

54 / 114

54.

No.54
ある会社では、ML ワークロードに Amazon SageMaker を使用しています。同社の ML エンジニアは、不正検出モデルを構築するために 50 MB の Apache Parquet データ ファイルを受け取ります。ファイルには、不要な相関列がいくつか含まれています。
ML エンジニアは、最小限の労力でファイル内の不要な列を削除するにはどうすればよいでしょうか?

55 / 114

55.

No.55
ある会社が、顧客に購入を勧める製品を推奨するアプリケーションを作成しています。このアプリケーションは、Amazon Q Business への API 呼び出しを行います。会社は、Amazon Q Business からの応答に会社の主な競合他社の名前が含まれないようにする必要があります。
この要件を満たすソリューションはどれですか?

56 / 114

56.

No.56
ML エンジニアは、Amazon SageMaker を使用して、テキスト要約用の大規模言語モデル (LLM) を微調整する必要があります。 ML エンジニアは、ローコード ノーコード (LCNC) アプローチに従う必要があります。
これらの要件を満たすソリューションはどれですか?

57 / 114

57.

No.57
ある企業には、株価を予測するために毎晩 1 回実行する必要がある ML モデルがあります。モデル入力は、当日に収集された 3 MB のデータです。モデルは翌日の予測を生成します。予測プロセスの実行が完了するまでに 1 分もかかりません。
これらの要件を満たすために、Amazon SageMaker にモデルをデプロイするにはどうすればよいでしょうか?

58 / 114

58.

No.58
ML エンジニアが Amazon SageMaker で ML モデルをトレーニングし、ドサーキット TV 映像から自動車事故を検出しました。ML エンジニアは SageMaker Data Wrangler を使用して、事故の画像と非事故の画像のトレーニング データセットを作成しました。
モデルはトレーニングと検証中に良好なパフォーマンスを示しました。しかし、さまざまなカメラからの画像の品質にばらつきがあるため、本番環境ではモデルのパフォーマンスが低下しています。
どのソリューションが最も短時間でモデルの精度を向上させるでしょうか。

59 / 114

59.

No.59
ある会社には、さまざまな API を使用して入力テキストの埋め込みを生成するアプリケーションがあります。会社は、3 か月ごとに API トークンを自動的にローテーションするソリューションを実装する必要があります。
この要件を満たすソリューションはどれですか?

60 / 114

60.

No.60
ML エンジニアは、欠損値、重複、および極端な外れ値を含むデータセットを受け取ります。ML エンジニアは、これらのデータセットを 1 つのデータ フレームに統合し、ML 用にデータを準備する必要があります。
これらの要件を満たすソリューションはどれですか?

61 / 114

61.

No.61
ある企業には、顧客が会社のスタッフからの長期的なサポートを必要としたかどうかを示す履歴データがあります。この企業は、新規顧客が長期的なサポートを必要とするかどうかを予測するための ML モデルを開発する必要があります。
この要件を満たすために、企業はどのモデリングアプローチを使用すべきですか?

62 / 114

62.

No.62
ML エンジニアが Amazon SageMaker の外部でバイナリ分類モデルを開発しました。ML エンジニアは、追加のチューニングのために、SageMaker Canvas ユーザーがモデルにアクセスできるようにする必要があります。
モデル成果物は Amazon S3 バケットに保存されます。ML エンジニアと Canvas ユーザーは同じ SageMaker ドメインに属しています。
ML エンジニアが Canvas ユーザーとモデルを共有できるようにするには、どの要件の組み合わせを満たす必要がありますか? (2 つ選択してください)。

63 / 114

63.

No.63
ある企業が Amazon SageMaker でディープラーニング モデルを構築しています。この企業は、トレーニング データセットとして大量のデータを使用しています。会社は、モデルのハイパーパラメータを最適化して、検証データセットの損失関数を最小化する必要があります。
どのハイパーパラメータ調整戦略が、最小の計算時間でこの目標を達成しますか?

64 / 114

64.

No.64
ある会社が、プライマリ AWS アカウントで Amazon Redshift ML を使用する予定です。ソースデータは、セカンダリ アカウントの Amazon S3 バケットにあります。
ML エンジニアは、セカンダリ アカウントの S3 バケットにアクセスするために、プライマリ アカウントに ML パイプラインを設定する必要があります。ソリューションでは、パブリック IPv4 アドレスを必要としません。
これらの要件を満たすソリューションはどれですか?

65 / 114

65.

No.65
ある会社では、AWS Lambda 関数を使用して ML モデルからのメトリクスを監視しています。ML エンジニアは、メトリクスがしきい値を超えたときに電子メールメッセージを送信するソリューションを実装する必要があります。
この要件を満たすソリューションはどれですか?

66 / 114

66.

No.66
ある会社が Amazon SageMaker を使用して、予測 ML モデルを本番環境にデプロイしました。この会社は、モデルで SageMaker Model Monitor を使用しています。モデルの更新後、ML エンジニアは Model Monitor チェックでデータ品質の問題に気付きました。
ML エンジニアは、Model Monitor が特定したデータ品質の問題を軽減するために何をすべきですか?

67 / 114

67.

No.67
ある企業には、顧客が企業の Web サイトにアップロードした画像に基づいてテキストの説明を生成する ML モデルがあります。画像の合計サイズは最大 50 MB です。
ML エンジニアは、画像を A​​mazon S3 バケットに保存することにしました。 ML エンジニアは、需要の変化に合わせて拡張できる処理ソリューションを実装する必要があります。
どのソリューションが、運用オーバーヘッドが最も少なく、これらの要件を満たしますか?

68 / 114

68.

No.68
ML エンジニアは、ドキュメントから意味のある一意のキーワードを識別して抽出するために AWS サービスを使用する必要があります。
これらの要件を満たすソリューションのうち、運用オーバーヘッドが最も少ないのはどれですか?

69 / 114

69.

No.69
ある企業は、ML エンジニアにトレーニング データへの適切なアクセス権を与える必要があります。ML エンジニアは、自分のビジネス グループのトレーニング データにのみアクセスする必要があります。ML エンジニアは、他のビジネス グループのトレーニング データにアクセスすることはできません。
この企業は単一の AWS アカウントを使用し、すべてのトレーニング データを Amazon S3 バケットに保存します。すべての ML モデルのトレーニングは Amazon SageMaker で行われます。
ML エンジニアに適切なアクセス権を提供するソリューションはどれですか?

70 / 114

70.

No.70
ある企業は、予測分析を実行するためにカスタム ML モデルをホストする必要があります。予測分析は、毎日同じ 2 時間の間に予測可能で持続的な負荷で実行されます。
分析期間中の複数の呼び出しには、迅速な応答が必要です。企業は、基盤となるインフラストラクチャと自動スケーリング アクティビティを管理するために AWS を必要としています。
これらの要件を満たすソリューションはどれですか?

71 / 114

71.

No.71
ある会社の ML エンジニアが、感情分析用の ML モデルを Amazon SageMaker エンドポイントにデプロイしました。ML エンジニアは、モデルがどのように予測を行うかを会社の関係者に説明する必要があります。
どのソリューションがモデルの予測を説明するでしょうか?

72 / 114

72.

No.72
ML エンジニアは、Amazon SageMaker を使用して、分散トレーニングを必要とするディープラーニング モデルをトレーニングしています。トレーニングを何度か試した後、ML エンジニアはインスタンスが期待どおりに動作していないことに気付きました。ML エンジニアは、トレーニング インスタンス間の通信オーバーヘッドを特定します。
インスタンス間の通信オーバーヘッドを最小限に抑えるために、ML エンジニアは何をすべきでしょうか?

73 / 114

73.

No.73
ある会社では、カスタム Python スクリプトと独自のデータセットを使用して、オンプレミスで ML モデルを実行しています。この会社は PyTorch を使用しています。モデルの構築には、固有のドメイン知識が必要です。この会社は、モデルを AWS に移行する必要があります。
最も少ない労力でこれらの要件を満たすソリューションはどれですか?

74 / 114

74.

No.74
ある会社では、Amazon SageMaker と数百万のファイルを使用して ML モデルをトレーニングしています。各ファイルのサイズは数メガバイトです。ファイルは Amazon S3 バケットに保存されています。この会社はトレーニングのパフォーマンスを改善する必要があります。
どのソリューションが、最短時間でこれらの要件を満たしますか?

75 / 114

No.75
ある企業は、顧客からの表形式のデータを使用して ML モデルを開発したいと考えています。データには、破棄すべきではない機密情報を含む意味のある順序付けられた機能が含まれています。ML エンジニアは、別のチームがモデルの構築を開始する前に、機密データがマスクされていることを確認する必要があります。

75. これらの要件を満たすソリューションはどれですか?

76 / 114

76.

No.76
ML エンジニアは、大規模なデータセットから非同期的に推論を得るために ML モデルをデプロイする必要があります。また、ML エンジニアは、モデルのデータ品質のスケジュールされたモニタリングを実装する必要があります。ML エンジニアは、データ品質の変化が発生したときにアラートを受信する必要があります。
これらの要件を満たすソリューションはどれですか?

77 / 114

77.

No.77
ML エンジニアは、AWS Glue DataBrew の最小最大正規化を使用してトレーニングデータを正規化しました。ML エンジニアは、実稼働推論データを予測のためにモデルに渡す前に、トレーニングデータと同じ方法で実稼働推論データを正規化する必要があります。
この要件を満たすソリューションはどれですか?

78 / 114

78.

No.78
ある会社が Amazon SageMaker を使用して、画像に基づく分類評価を行う予定です。この会社には、Amazon FSx for NetApp ONTAP システム仮想マシン (SVM) に保存されている 6 TB のトレーニングデータがあります。SVM は SageMaker と同じ VPC にあります。
ML エンジニアは、SageMaker 環境にある ML モデルがトレーニングデータにアクセスできるようにする必要があります。
これらの要件を満たすソリューションはどれですか?

79 / 114

79.

No.79
ある企業は、ML モデルのベンダーから定期的に新しいトレーニングデータを受け取ります。ベンダーは、3~4 日ごとに、クリーンアップされ準備されたデータを会社の Amazon S3 バケットに配信します。
会社には、モデルを再トレーニングするための Amazon SageMaker パイプラインがあります。 ML エンジニアは、新しいデータが S3 バケットにアップロードされたときにパイプラインを実行するソリューションを実装する必要があります。
どのソリューションが、最小限の運用労力でこれらの要件を満たしますか?

80 / 114

80.

No.80
ML エンジニアは、Amazon SageMaker XGBoost アルゴリズムを使用して不正検出モデルを開発しています。このモデルは、取引を不正か正当かに分類します。
テスト中、このモデルはトレーニング データセット内の不正の識別に優れています。ただし、このモデルは、新しい取引や見たことのない取引での不正の識別には非効率的です。
ML エンジニアは、新しい取引の不正検出を改善するために何をすべきでしょうか?

81 / 114

81.

No.81
ある会社では、バイナリ分類モデルを本番環境で使用しています。 ML エンジニアは、モデルの新しいバージョンを開発する必要があります。
新しいモデル バージョンでは、正のラベルと負のラベルの正しい予測を最大化する必要があります。ML エンジニアは、これらの要件を満たすために、メトリックを使用してモデルを再調整する必要があります。
ML エンジニアは、モデルの再調整にどのメトリックを使用する必要がありますか?

82 / 114

82.

★No.82
ある会社では、Amazon SageMaker を使用して ML モデルを作成しています。同社のデータ サイエンティストは、オーケストレーションする ML ワークフローをきめ細かく制御する必要があります。また、データ サイエンティストは、SageMaker ジョブとワークフローを有向非巡回グラフ (DAG) として視覚化する機能も必要としています。データ サイエンティストは、モデル検出実験の実行履歴を保持し、監査とコンプライアンス検証のためのモデル ガバナンスを確立する必要があります。
これらの要件を満たすソリューションはどれですか?

83 / 114

83.

No.83
ある企業は、コンテナ化された ML アプリケーションのコストを削減したいと考えています。アプリケーションは、Amazon EC2 インスタンス、AWS Lambda 関数、および Amazon Elastic Container Service (Amazon ECS) クラスターで実行される ML モデルを使用します。EC2 ワークロードと ECS ワークロードは、予測とアーティファクトを保存するために Amazon Elastic Block Store (Amazon EBS) ボリュームを使用します。
ML エンジニアは、非効率的に使用されているリソースを特定する必要があります。また、ML エンジニアは、これらのリソースのコストを削減するための推奨事項を生成する必要もあります。
最も少ない開発労力でこれらの要件を満たすソリューションはどれですか?

84 / 114

84.

No.84
ある企業は、自社のすべての ML モデルの中央カタログを作成する必要があります。モデルは、企業が最初にモデルを開発した AWS アカウントにあります。モデルは、Amazon Elastic Container Registry (Amazon ECR) リポジトリでホストされています。
これらの要件を満たすソリューションはどれですか?

85 / 114

85.

No.85
ある会社が新しい ML モデルを開発しました。会社では、モデルを本番環境に完全にリリースする前に、トラフィックの 10% でオンラインモデル検証を行う必要があります。会社は、モデルを提供するために、アプリケーションロードバランサー (ALB) の背後にある Amazon SageMaker エンドポイントを使用しています。
どのソリューションが、必要なオンライン検証を最小の運用オーバーヘッドで設定しますか?

86 / 114

86.

No.86
ある会社では、ML モデルを開発する必要があります。モデルは、画像内のアイテムを識別し、アイテムの場所を提供する必要があります。
これらの要件を満たす Amazon SageMaker アルゴリズムはどれですか?

87 / 114

87.

No.87
ある会社には、さまざまなソースからの 1 TB のファイルを含む Amazon S3 バケットがあります。S3 バケットには、同じ S3 フォルダに CSV、JSON、XLSX、Apache Parquet のファイル タイプが含まれています。
ML エンジニアは、AWS Glue DataBrew を使用してデータを処理するソリューションを実装する必要があります。ML エンジニアは、AWS Glue が将来出力を使用できるように、最終出力を Amazon S3 に保存する必要もあります。
これらの要件を満たすソリューションはどれですか?

88 / 114

88.

No.88
製造会社では、ML モデルを使用して、製品が品質基準を満たしているかどうかを判断します。モデルは「合格」または「不合格」の出力を生成します。ロボットは、モデルを使用して組み立てラインの写真を分析し、製品を 2 つのカテゴリに分類します。
モデルのパフォーマンスを評価するために、会社はどの指標を使用すべきですか? (2 つ選択してください。)

89 / 114

89.

No.89
ML エンジニアは、ML トレーニング ジョブの実行時に転送中のすべてのデータを暗号化する必要があります。ML エンジニアは、転送中の暗号化がトレーニング ジョブ中に使用される Amazon SageMaker プロセスに適用されていることを確認する必要があります。
これらの要件を満たすソリューションはどれですか?

90 / 114

90.

No.90
ML エンジニアは、時系列予測モデルの品質を評価するためにメトリクスを使用する必要があります。
このモデルに適用されるメトリクスはどれですか? (2 つ選択してください)

91 / 114

91.

No.91
ある会社では、高速インスタンスを使用する Amazon SageMaker ML モデルを実行しています。モデルにはリアルタイム応答が必要です。モデルごとにスケーリング要件が異なります。会社は、モデルのコールド スタートを許可してはなりません。
これらの要件を満たすソリューションはどれですか?

92 / 114

92.

No.92
ある会社では、ML プロセスに Amazon SageMaker を使用しています。コンプライアンス監査により、トレーニング データ用の Amazon S3 バケットが S3 管理キー (SSE-S3) を使用したサーバー側暗号化を使用していることが判明しました。
会社では、顧客管理キーが必要です。ML エンジニアは、AWS KMS キー (SSE-KMS) を使用したサーバー側暗号化を使用するように S3 バケットを変更します。ML エンジニアは、その他の構成変更は行いません。
暗号化設定を変更した後、SageMaker トレーニング ジョブが AccessDenied エラーで失敗し始めます。
この問題を解決するために、ML エンジニアは何をすべきでしょうか?

93 / 114

93.

No.93
ある会社が、コンピューティング最適化インスタンスを使用して Amazon SageMaker でトレーニング ジョブを実行します。トレーニング実行の需要は、今後 55 週間一定のままです。インスタンスは毎週 35 時間実行する必要があります。会社は、モデル トレーニングのコストを削減する必要があります。
これらの要件を満たすソリューションはどれですか?

94 / 114

94.

★No.94
HOTSPOT
-
ある企業は、過去の取引データを使用して顧客の行動を予測する ML モデルをトレーニングする必要があります。
次のリストから適切な AWS サービスを選択し、データに対して各タスクを実行します。各サービスは 1 回だけ選択するか、まったく選択しないでください。 (3 つ選択してください)

• Amazon Athena
• AWS Glue
• Amazon Kinesis Data Streams
• Amazon S3

探索と分析のためにデータをクエリします。選択...
選択...
Amazon Athena
AWS Glue
Amazon Kinesis Data Streams
Amazon S3

データを保存します。選択...
選択...
Amazon Athena
AWS Glue
Amazon Kinesis Data Streams
Amazon S3

データを変換します。選択...
選択...
Amazon Athena
AWS Glue
Amazon Kinesis Data Streams
Amazon S3

95 / 114

95.

No.95
ある会社が、XGBoost アルゴリズムを使用して製品の故障を予測する ML モデルを導入しました。このモデルは Amazon SageMaker エンドポイントでホストされ、通常の動作データでトレーニングされています。AWS Lambda 関数が会社のアプリケーションに予測を提供します。
ML エンジニアは、受信したライブデータを使用して、時間の経過とともに低下するモデル精度を検出するソリューションを実装する必要があります。
これらの要件を満たすソリューションはどれですか?

96 / 114

96.

No.96
ある企業には、履歴トランザクションデータを使用して顧客の行動を予測する ML モデルがあります。ML エンジニアは、モデルの予測精度を高めるために、Amazon SageMaker でモデルを最適化しています。 ML エンジニアは、入力データとその結果の予測を調べて、さまざまな人口統計にわたってモデルのパフォーマンスを歪める可能性のある傾向を特定する必要があります。
このレベルの分析を提供するソリューションはどれですか?

97 / 114

97.

No.97
ある会社では、ML モデルの現在のバージョンを提供するために、高速インスタンスタイプのリザーブドインスタンスを 10 個使用しています。ML エンジニアは、モデルの新しいバージョンを Amazon SageMaker リアルタイム推論エンドポイントにデプロイする必要があります。
ソリューションでは、元の 10 個のインスタンスを使用して、両方のバージョンのモデルを提供する必要があります。また、ソリューションには、デプロイプロセスで使用できる追加のリザーブドインスタンスが 1 つ含まれている必要があります。バージョン間の移行は、ダウンタイムやサービスの中断なしに実行する必要があります。
これらの要件を満たすソリューションはどれですか?

98 / 114

98.

No.98
IoT 企業は、Amazon SageMaker を使用して、物体検出用の XGBoost モデルのトレーニングとテストを行っています。ML エンジニアは、ハイパーパラメータのバリアントを使用してモデルをトレーニングするときに、パフォーマンス メトリックを監視する必要があります。また、トレーニングが完了したら、ショート メッセージ サービス (SMS) テキスト メッセージを送信する必要があります。
これらの要件を満たすソリューションはどれですか?

99 / 114

99.

No.99
ある会社が、Amazon SageMaker ノートブックインスタンスを含む ML プロジェクトに取り組んでいます。ML エンジニアは、SageMaker ノートブックインスタンスがルートアクセスを許可しないようにする必要があります。
ルートアクセスを許可するノートブックインスタンスのデプロイを防ぐには、どのソリューションが適していますか?

100 / 114

100.

No.100
ある会社が Amazon SageMaker を使用して ML モデルを開発しています。この会社は機密性の高いトレーニングデータを Amazon S3 バケットに保存しています。モデルのトレーニングには、インターネットからのネットワーク分離が必要です。
この要件を満たすソリューションはどれですか?

101 / 114

101.

No.101
ある企業では、モデルの作成時に ML モデルのバージョンを自動的に作成する AWS ソリューションが必要です。
この要件を満たすソリューションはどれですか?

102 / 114

102.

No.102
ある企業では、Amazon Bedrock で実行されるオープンソースの大規模言語モデル (LLM) を補完するために、Retrieval Augmented Generation (RAG) を使用する必要があります。RAG の企業のデータは、Amazon S3 バケット内のドキュメント セットです。ドキュメントは、.csv ファイルと .docx ファイルで構成されています。
これらの要件を、運用オーバーヘッドが最も少ないソリューションはどれですか?

103 / 114

103.

No.103
ある企業は、Amazon SageMaker エンドポイントで本番推論用の ML モデルをデプロイする予定です。推論ペイロードの平均サイズは 100 MB から 300 MB までです。推論リクエストは 60 分以内に処理する必要があります。
これらの要件を満たす SageMaker 推論オプションはどれですか?

104 / 114

104.

No.104
ML エンジニアが画像分類トレーニング ジョブでクラスの不均衡に気付きました。
ML エンジニアはこの問題を解決するために何をすべきですか?

105 / 114

105.

No.105
ある企業は、顧客と ML モデルとのやり取りに関する .csv ファイルを毎日受け取ります。この企業は、ファイルを Amazon S3 に保存し、そのファイルを使用してモデルを再トレーニングします。ML エンジニアは、モデルを再トレーニングする前に、ファイル内のクレジットカード番号をマスクするソリューションを実装する必要があります。
どのソリューションが、開発の労力を最小限に抑えてこの要件を満たしますか?

106 / 114

106.

No.106
ある医療会社は、患者に治療を推奨するツールを構築するために AWS を使用しています。同社は、患者から健康記録と英語の自己申告テキスト情報を入手しました。同社は、この情報を使用して患者に関する洞察を得る必要があります。
最も少ない開発労力でこの要件を満たすソリューションはどれですか?

107 / 114

107.

No.107
ある会社は、分類モデルを構築するために、PDF ドキュメントからエンティティを抽出する必要があります。
最も短い時間でエンティティを抽出して保存するソリューションはどれですか?

108 / 114

108.

No.108
ある企業が、VPN 経由でアクセスできる Amazon SageMaker Studio ノートブックを共有しています。企業は、悪意のある人物が署名済み URL を悪用してノートブックにアクセスするのを防ぐために、アクセス制御を実施する必要があります。
これらの要件を満たすソリューションはどれですか?

109 / 114

109.

No.109
ML エンジニアは、既存の ML モデルを再トレーニングするために、2 つのソースからのデータをマージして変換する必要があります。1 つのデータ ソースは、Amazon S3 バケットに保存されている .csv ファイルで構成されています。各 .csv ファイルは、数百万のレコードで構成されています。もう 1 つのデータ ソースは、Amazon Aurora DB クラスターです。
マージ プロセスの結果は、2 番目の S3 バケットに書き込む必要があります。ML エンジニアは、このマージと変換のタスクを毎週実行する必要があります。
どのソリューションが、運用オーバーヘッドを最小限に抑えながらこれらの要件を満たしますか?

110 / 114

110.

No.110
ML エンジニアが、Amazon SageMaker モデルを本番環境のサーバーレスエンドポイントにデプロイしました。モデルは、InvokeEndpoint API オペレーションによって呼び出されます。
本番環境のモデルのレイテンシーは、テスト環境のベースライン レイテンシーよりも高くなっています。ML エンジニアは、レイテンシーの増加はモデルの起動時間によるものだと考えています。
この仮説を確認または否定するには、ML エンジニアは何をすべきでしょうか?

111 / 114

111.

No.111
ML エンジニアは、データセットが個人識別情報 (PII) に関する規制に準拠していることを確認する必要があります。ML エンジニアは、データを使用して Amazon SageMaker インスタンスで ML モデルをトレーニングします。SageMaker は PII を一切使用してはなりません。
どのソリューションが最も運用効率の高い方法でこれらの要件を満たしますか?

112 / 114

112.

No.112
企業は、新しく作成された Amazon SageMaker ノートブックインスタンスにカスタムスクリプトをインストールする必要があります。
どのソリューションが、運用オーバーヘッドを最小限に抑えてこの要件を満たしますか?

113 / 114

113.

★No.113
ある会社が、e コマース アプリケーション用のリアルタイム データ処理パイプラインを構築しています。このアプリケーションは、ほぼリアルタイムで取り込み、処理、視覚化する必要がある大量のクリックストリーム データを生成します。この会社には、データ処理用の SQL とインタラクティブな分析用の Jupyter ノートブックをサポートするソリューションが必要です。
これらの要件を満たすソリューションはどれですか?

114 / 114

114.

No.114
医療会社は臨床データを保存する必要があります。データには、個人を特定できる情報 (PII) と保護された健康情報 (PHI) が含まれます。
ML エンジニアは、PII と PHI が ML モデルのトレーニングに使用されないようにするためのソリューションを実装する必要があります。
これらの要件を満たすソリューションはどれですか?

Your score is

0%

■AWS MLA-C01(jp) Q.1-100

/100

AWS MLA-C01(JP) Q.1-100

AWS Certified Machine Learning Engineer - Associate は、本番環境に ML を実装して運用可能にする技術的能力を実証するものです。キャリアプロファイルと信頼性を向上させて、需要の高い機械学習に関連する職務に備えましょう。

1 / 100

1.

No.1
ある企業が Amazon SageMaker を使用して Web ベースの AI アプリケーションを構築しています。このアプリケーションは、ML 実験、トレーニング、中央モデル レジストリ、モデルのデプロイ、およびモデル モニタリングの機能を提供します。
アプリケーションは、ML ライフサイクル中にトレーニング データを安全かつ分離して使用する必要があります。トレーニング データは Amazon S3 に保存されます。
この企業は、中央モデル レジストリを使用して、アプリケーション内のさまざまなバージョンのモデルを管理する必要があります。
どのアクションが、運用オーバーヘッドを最小限に抑えながらこの要件を満たしますか?

2 / 100

2.

No.2
ある会社が、Amazon SageMaker を使用して Web ベースの AI アプリケーションを構築しています。このアプリケーションは、ML 実験、トレーニング、中央モデル レジストリ、モデルのデプロイ、およびモデルのモニタリングという機能を提供します。
アプリケーションは、ML ライフサイクル中にトレーニング データを安全かつ分離して使用する必要があります。トレーニング データは Amazon S3 に保存されます。
会社は連続したトレーニング ジョブを実験しています。
会社は、これらのジョブのインフラストラクチャの起動時間を最小限に抑えるにはどうすればよいですか?

3 / 100

3.

No.3
ある企業が Amazon SageMaker を使用して Web ベースの AI アプリケーションを構築しています。このアプリケーションは、ML 実験、トレーニング、中央モデルレジストリ、モデルのデプロイ、およびモデルのモニタリングという機能を提供します。
アプリケーションは、ML ライフサイクル中にトレーニングデータを安全かつ分離して使用する必要があります。トレーニングデータは Amazon S3 に保存されます。
承認されたモデルのみが本番エンドポイントにデプロイされるように、会社は手動承認ベースのワークフローを実装する必要があります。
この要件を満たすソリューションはどれですか?

4 / 100

4.

No.4
ある企業が Amazon SageMaker を使用して Web ベースの AI アプリケーションを構築しています。このアプリケーションは、ML 実験、トレーニング、中央モデルレジストリ、モデルのデプロイ、およびモデルのモニタリングという機能を提供します。
アプリケーションは、ML ライフサイクル中にトレーニング データを安全かつ分離して使用する必要があります。トレーニング データは Amazon S3 に保存されます。
企業は、アプリケーションからリアルタイム エンドポイントにデプロイされるモデルのバイアス ドリフトを監視するために、オンデマンド ワークフローを実行する必要があります。
この要件を満たすアクションはどれですか?

5 / 100

5.

No.5
ある会社が Amazon S3 の .csv ファイルに履歴データを保存しています。.csv ファイルの一部の行と列のみが入力されています。列にはラベルが付いていません。 ML エンジニアは、企業がデータを使用して ML モデルをトレーニングできるように、データを準備して保存する必要があります。

このタスクを実行するには、次のリストから適切な手順を選択して順序付けします。各手順は 1 回選択するか、まったく選択しないでください。(3 つ選択して順序付けします。)
• データのクリーニングと機能エンジニアリングのために Amazon SageMaker バッチ変換ジョブを作成します。
• 結果のデータを Amazon S3 に戻して保存します。
• Amazon Athena を使用して、スキーマと使用可能な列を推測します。
• AWS Glue クローラーを使用して、スキーマと使用可能な列を推測します。
• データのクリーニングと機能エンジニアリングに AWS Glue DataBrew を使用します。

6 / 100

6.

No.6
ML エンジニアは、Amazon SageMaker Feature Store を使用して、モデルをトレーニングするための機能を作成および管理する必要があります。
Feature Store で機能を作成して使用するには、次のリストから手順を選択して順序付けします。各手順は 1 回選択する必要があります (3 つ選択して順序付けします)。
• ストアにアクセスして、トレーニング用のデータセットを構築します。
• 機能グループを作成します。
• レコードを取り込みます。

7 / 100

7.

No.7
ある会社が Amazon SageMaker で ML モデルをホストしたいと考えています。ML エンジニアは、モデルをデプロイするために AWS CodePipeline で継続的インテグレーションと継続的デリバリー (Cl/CD) パイプラインを構成しています。モデルの新しいトレーニングデータが Amazon S3 バケットにアップロードされると、パイプラインが自動的に実行される必要があります。
次のリストからパイプラインの正しい手順を選択して順序付けします。各ステップは 1 回選択するか、まったく選択しないでください (3 つ選択して順序付けしてください)。
• 新しいデータがアップロードされると、S3 イベント通知によってパイプラインが呼び出されます。
• 新しいデータがアップロードされると、S3 ライフサイクル ルールによってパイプラインが呼び出されます。
• SageMaker は、S3 バケット内のデータを使用してモデルを再トレーニングします。
• パイプラインは、モデルを SageMaker エンドポイントにデプロイします。
• パイプラインは、モデルを SageMaker モデル レジストリにデプロイします。

8 / 100

8.

No.8
ML エンジニアが、大規模言語モデル (LLM) を使用して Amazon Bedrock 上に生成 AI アプリケーションを構築しています。
各説明について、次のリストから正しい生成 AI 用語を選択してください。各用語は 1 回選択するか、まったく選択しないでください。 (3 つ選択してください。)
• 埋め込み
• 検索拡張生成 (RAG)
• 温度
• トークン

9 / 100

9. No.9

ML エンジニアは、同様のサイズの住宅の価格を予測する ML モデルに取り組んでいます。モデルは、いくつかの特徴に基づいて予測を行います。ML エンジニアは、次の特徴エンジニアリング手法を使用して住宅の価格を推定します。
• 特徴の分割
• 対数変換
• ワンホット エンコーディング
• 標準化された分布
次の特徴のリストに対して正しい特徴エンジニアリング手法を選択してください。各特徴エンジニアリング手法は、1 回だけ選択するか、まったく選択しないでください (3 つ選択してください)。

10 / 100

10.

No.10
ML エンジニアが AWS で不正検出モデルを開発しています。トレーニング データセットには、オンプレミスの MySQL データベースからのトランザクション ログ、顧客プロファイル、およびテーブルが含まれています。トランザクション ログと顧客プロファイルは Amazon S3 に保存されています。
データセットには、モデルのアルゴリズムの学習に影響を与えるクラスの不均衡があります。さらに、多くの機能には相互依存性があります。アルゴリズムは、データ内の必要な基礎パターンをすべてキャプチャしていません。
さまざまなデータ ソースからデータを集約できる AWS のサービスまたは機能はどれですか。

11 / 100

11.

No.11
ML エンジニアが AWS で不正検出モデルを開発しています。トレーニング データセットには、トランザクション ログ、顧客プロファイル、オンプレミスの MySQL データベースのテーブルが含まれています。トランザクション ログと顧客プロファイルは Amazon S3 に保存されます。
データセットには、モデルのアルゴリズムの学習に影響を与えるクラスの不均衡があります。さらに、多くの機能には相互依存性があります。アルゴリズムは、データ内の必要な基礎パターンをすべてキャプチャしていません。
データが集約された後、ML エンジニアは、データ内の異常を自動的に検出し、結果を視覚化するソリューションを実装する必要があります。
これらの要件を満たすソリューションはどれですか?

12 / 100

12.

No.12
ML エンジニアが AWS で不正検出モデルを開発しています。トレーニング データセットには、オンプレミスの MySQL データベースからのトランザクション ログ、顧客プロファイル、テーブルが含まれています。トランザクション ログと顧客プロファイルは Amazon S3 に保存されています。
データセットには、モデルのアルゴリズムの学習に影響を与えるクラスの不均衡があります。さらに、多くの機能には相互依存性があります。アルゴリズムは、データ内の必要な基礎パターンをすべてキャプチャしていません。
トレーニング データセットには、カテゴリ データと数値データが含まれています。ML エンジニアは、モデルの精度を最大化するためにトレーニング データセットを準備する必要があります。
次のアクションでこの要件を満たすのはどれですか。最も運用上のオーバーヘッドが少ないのはどれですか?

13 / 100

13.

No.13
ML エンジニアが AWS で不正検出モデルを開発しています。トレーニング データセットには、オンプレミスの MySQL データベースからのトランザクション ログ、顧客プロファイル、テーブルが含まれています。トランザクション ログと顧客プロファイルは Amazon S3 に保存されています。
データセットには、モデルのアルゴリズムの学習に影響するクラスの不均衡があります。さらに、多くの機能に相互依存性があります。アルゴリズムは、データ内の必要な基礎パターンをすべてキャプチャしていません。
ML エンジニアがモデルをトレーニングする前に、ML エンジニアは不均衡なデータの問題を解決する必要があります。
どのソリューションが、最も少ない運用労力でこの要件を満たしますか?

14 / 100

14.

No.14
ML エンジニアが AWS で不正検出モデルを開発しています。トレーニング データセットには、オンプレミスの MySQL データベースからのトランザクション ログ、顧客プロファイル、テーブルが含まれます。トランザクション ログと顧客プロファイルは Amazon S3 に保存されます。
データセットには、モデルのアルゴリズムの学習に影響するクラスの不均衡があります。さらに、多くの機能には相互依存性があります。アルゴリズムは、データ内の必要な基礎パターンをすべてキャプチャしていません。
ML エンジニアは、Amazon SageMaker 組み込みアルゴリズムを使用してモデルをトレーニングする必要があります。
この要件を満たすために、ML エンジニアはどのアルゴリズムを使用する必要がありますか?

15 / 100

15.

No.15
ある企業は、顧客がサブスクリプションをキャンセルする可能性があるかどうかを予測するために、XGBoost 予測モデルを本番環境に導入しました。同社は、F1 スコアの偏差を検出するために Amazon SageMaker Model Monitor を使用しています。
モデル品質のベースライン分析中に、同社は F1 スコアのしきい値を記録しました。数か月間変化がなかった後、モデルの F1 スコアが大幅に低下しました。
F1 スコアが低下した理由は何でしょうか?

16 / 100

16.

No.16
ある会社には、Amazon SageMaker ノートブックインスタンスを使用して ML モデルをテストするデータサイエンティストのチームがあります。データサイエンティストが新しい権限を必要とする場合、会社は SageMaker ノートブックインスタンスの作成中に作成された個々のロールに権限をアタッチします。
会社はチームの権限を一元管理する必要があります。
この要件を満たすソリューションはどれですか?

17 / 100

17.

No.17
ML エンジニアは、ML モデルを使用して特定の場所のアパートの価格を予測する必要があります。
ML エンジニアは、モデルのパフォーマンスを評価するためにどのメトリックを使用する必要がありますか?

18 / 100

18.

No.18
ML エンジニアが確率的勾配降下法 (SGD) を使用してニューラル ネットワークをトレーニングしました。ニューラル ネットワークはテスト セットでパフォーマンスが低下しています。トレーニング損失と検証損失の値は高いままで、振動パターンを示しています。値は数エポック減少し、その後数エポック増加してから同じサイクルを繰り返します。
ML エンジニアはトレーニング プロセスを改善するために何をすべきでしょうか?

19 / 100

19.

No.19
ML エンジニアは、何千もの既存の CSV オブジェクトとアップロードされた新しい CSV オブジェクトを処理する必要があります。CSV オブジェクトは中央の Amazon S3 バケットに保存され、列の数も同じです。列の 1 つはトランザクションの日付です。ML エンジニアは、トランザクションの日付に基づいてデータをクエリする必要があります。
どのソリューションが、運用オーバーヘッドを最小限に抑えながらこれらの要件を満たしますか?

20 / 100

20.

No.20
ある企業には、大規模で構造化されていないデータセットがあります。データセットには、いくつかの主要な属性にわたって多くの重複レコードが含まれています。
AWS のどのソリューションが、コード開発を最小限に抑えてデータセット内の重複を検出しますか?

21 / 100

21.

No.21
ある企業は、Amazon EC2 インスタンスでバッチ データ処理ジョブを実行する必要があります。ジョブは週末に実行され、完了までに 90 分かかります。処理は中断を処理できます。会社は今後 6 か月間、毎週末にジョブを実行します。
これらの要件を最もコスト効率よく満たす EC2 インスタンス購入オプションはどれですか?

22 / 100

22.

No.22
ML エンジニアは、us-east-1 リージョンのアカウント A に Amazon Comprehend カスタムモデルを持っています。ML エンジニアは、モデルを同じリージョンのアカウント B にコピーする必要があります。
開発の労力を最小限に抑えてこの要件を満たすソリューションはどれですか?

23 / 100

23.

No.23
ML エンジニアが単純なニューラル ネットワーク モデルをトレーニングしています。ML エンジニアは、検証データセットでモデルのパフォーマンスを時間の経過とともに追跡します。モデルのパフォーマンスは最初は大幅に向上しますが、特定のエポック数を超えると低下します。
どのソリューションがこの問題を軽減しますか? (2 つ選択してください)。

24 / 100

24.

No.24
ある会社には、ドキュメントの埋め込みを保存するためにベクトル データベースを使用する Retrieval Augmented Generation (RAG) アプリケーションがあります。会社はアプリケーションを AWS に移行し、テキストファイルのセマンティック検索を提供するソリューションを実装する必要があります。 会社はすでにテキストリポジトリを Amazon S3 バケットに移行しています。
これらの要件を満たすソリューションはどれですか?

25 / 100

25.

★No.25
ある会社が Amazon Athena を使用して Amazon S3 のデータセットをクエリします。データセットには、会社が予測したいターゲット変数があります。
会社は、モデルがターゲット変数を予測できるかどうかを判断するために、ソリューションでデータセットを使用する必要があります。
どのソリューションが、この情報を最も少ない開発労力で提供しますか?

26 / 100

26.

No.26
ある企業は、各広告の配色を考慮して広告キャンペーンの成功を予測したいと考えています。ML エンジニアはニューラル ネットワーク モデル用のデータを準備しています。データセットには、カテゴリ データとして色情報が含まれています。
ML エンジニアは、モデルにどの機能エンジニアリング手法を使用する必要がありますか?

27 / 100

27.

No.27
ある会社ではハイブリッドクラウド環境を使用しています。オンプレミスでデプロイされたモデルは、Amazon 53 のデータを使用して、顧客にライブ会話エンジンを提供します。
モデルは機密データを使用しています。ML エンジニアは、機密データを識別して削除するためのソリューションを実装する必要があります。
どのソリューションが、運用オーバーヘッドを最小限に抑えながらこれらの要件を満たしますか?

28 / 100

28.

No.28
ML エンジニアは、AWS でデータ取り込みパイプラインと ML モデル展開パイプラインを作成する必要があります。すべての生データは Amazon S3 バケットに保存されます。
これらの要件を満たすソリューションはどれですか?

29 / 100

29.

No.29
何百人ものデータ サイエンティストを抱える企業が、Amazon SageMaker を使用して ML モデルを作成しています。モデルは、SageMaker モデル レジストリのモデル グループにあります。
データ サイエンティストは、コンピューター ビジョン、自然言語処理 (NLP)、音声認識の 3 つのカテゴリにグループ化されています。ML エンジニアは、既存のモデルをこれらのグループに整理して、大規模なモデルの検出可能性を向上させるソリューションを実装する必要があります。ソリューションは、モデル成果物の整合性と既存のグループ化に影響を与えてはなりません。
これらの要件を満たすソリューションはどれですか?

30 / 100

30.

No.30
ある会社が、新しく作成された VPC のパブリック サブネットで Amazon SageMaker ドメインを実行しています。ネットワークは適切に構成されており、ML エンジニアは SageMaker ドメインにアクセスできます。
最近、会社は特定の IP アドレスからドメインへの疑わしいトラフィックを発見しました。会社は特定の IP アドレスからのトラフィックをブロックする必要があります。
この要件を満たすネットワーク構成の更新はどれですか?

31 / 100

31.

No.31
ある会社がさまざまな言語で音声、動画、テキストデータを収集しています。この会社は、スペイン語で収集されたデータを要約するために、大規模言語モデル (LLM) を使用する必要があります。
これらの要件を最短時間で満たすソリューションはどれですか?

32 / 100

32.

No.32
金融会社が外部プロバイダーから大量のリアルタイム市場データストリームを受信します。ストリームは、毎秒数千の JSON レコードで構成されています。
会社は、異常なデータポイントを識別するために、AWS でスケーラブルなソリューションを実装する必要があります。
どのソリューションが、最小の運用オーバーヘッドでこれらの要件を満たしますか?

33 / 100

33.

No.33
ある企業には、製品リリース後の顧客とのやり取りからのチャット録音の大規模なコレクションがあります。ML エンジニアは、チャットデータを分析するための ML モデルを作成する必要があります。 ML エンジニアは、製品に関する顧客の感情をレビューして、製品の成功を判断する必要があります。
最短時間で評価を完了するために、ML エンジニアが実行すべきアクションはどれですか?

34 / 100

34.

No.34
ある企業には、Amazon Bedrock を介して Anthropic Claude 大規模言語モデル (LLM) にリクエストを送信する会話型 AI アシスタントがあります。ユーザーから、同様の質問を複数回行うと、異なる回答が返されることがあるという報告があります。 ML エンジニアは、応答をより一貫性のあるランダム性のないものに改善する必要があります。これらの要件を満たすソリューションはどれですか?

35 / 100

35.

No.35
ある会社が ML を使用して、農家の畑に特定の雑草が存在するかどうかを予測しています。この会社は、predictorjype ハイパーパラメータに multiclass_dassifier の値を使用して、Amazon SageMaker 線形学習器の組み込みアルゴリズムを使用しています。
偽陽性を最小限に抑えるには、会社はどうすればよいですか?

36 / 100

36.

No.36
ある会社が、自社の e コマース Web サイトからの販売取引用のデータ取り込みパイプラインを実装しました。この会社は、Amazon Data Firehose を使用して Amazon OpenSearch Service にデータを取り込みます。Firehose ストリームのバッファ間隔は 60 秒に設定されています。OpenSearch 線形モデルは、データに基づいてリアルタイムの販売予測を生成し、そのデータを OpenSearch ダッシュボードに表示します。
この会社は、リアルタイム ダッシュボードの 1 秒未満のレイテンシーをサポートするために、データ取り込みパイプラインを最適化する必要があります。
アーキテクチャのどの変更がこれらの要件を満たすでしょうか。

37 / 100

37.

No.37
ある企業が Amazon SageMaker で ML モデルをトレーニングしました。この企業は、本番環境で推論を提供するためにモデルをホストする必要があります。
モデルは可用性が高く、レイテンシーが最小限で応答する必要があります。各リクエストのサイズは 1 KB から 3 MB の間になります。モデルは、日中に予測できないリクエストの急増を受け取ります。推論は、需要の変化に比例して適応する必要があります。
これらの要件を満たすために、企業はモデルを本番環境に導入するにはどうすればよいでしょうか?

38 / 100

38.

No.38
ML エンジニアは、Amazon EMR クラスターを使用して大量のデータをバッチで処理する必要があります。データ損失は許容されません。
これらの要件を最もコスト効率よく満たすインスタンス購入オプションはどれですか?

39 / 100

39.

No.39
ある企業は、ML 運用の持続可能性を改善したいと考えています。
どのアクションが、企業のトレーニング ジョブに関連するエネルギー使用量と計算リソースを削減しますか? (2 つ選択してください)。

40 / 100

40.

No.40
ある会社が複数の ML 予測モデルを作成する予定です。トレーニング データは Amazon S3 に保存されます。データセット全体のサイズは 5 TB 以上で、CSV、JSON、Apache Parquet、および単純なテキスト ファイルで構成されています。
データは、複数の連続したステップで処理する必要があります。ステップには、完了するまでに数時間かかる複雑な操作が含まれます。処理の一部には、自然言語処理 (NLP) 変換が含まれます。プロセス全体を自動化する必要があります。
これらの要件を満たすソリューションはどれですか?

41 / 100

41.

No.41
ML エンジニアは、AWS CloudFormation を使用して、Amazon SageMaker エンドポイントがホストする ML モデルを作成する必要があります。
この要件を満たすために、ML エンジニアは CloudFormation テンプレートでどのリソースを宣言する必要がありますか?

42 / 100

42.

No.42
広告会社では、AWS Lake Formation を使用してデータレイクを管理しています。データレイクには、構造化データと非構造化データが含まれています。同社の ML エンジニアは、特定の広告キャンペーンに割り当てられています。
ML エンジニアは、Amazon Athena を介して、または Amazon S3 バケットで直接データを参照することによって、データとやり取りする必要があります。ML エンジニアは、割り当てられた広告キャンペーンに固有のリソースにのみアクセスできる必要があります。
どのソリューションが、これらの要件を最も効率的に運用できるでしょうか。

43 / 100

43.

No.43
ML エンジニアは、Amazon SageMaker Canvas でデータを使用して ML モデルをトレーニングする必要があります。データは Amazon S3 に保存され、構造が複雑です。ML エンジニアは、データの処理時間を最小限に抑えるファイル形式を使用する必要があります。
これらの要件を満たすファイル形式はどれですか?

44 / 100

44.

No.44
ML エンジニアは複数の ML モデルを評価しており、本番で使用するモデルを 1 つ選択する必要があります。モデルによる偽陰性の予測のコストは、偽陽性の予測のコストよりもはるかに高くなります。
ML エンジニアがモデルを選択する際に最も優先すべきメトリックの検出結果はどれですか?

45 / 100

45.

No.45
ある会社が Amazon SageMaker を使用して ML モデルをトレーニングし、デプロイしました。この会社は、SageMaker エンドポイントのすべての API 呼び出しイベントを記録および監視するソリューションを実装する必要があります。また、ソリューションでは、API 呼び出しイベントの数がしきい値を超えた場合に通知を提供する必要があります。
これらの要件を満たすソリューションはどれですか?

46 / 100

46.

No.46
ある会社には、AWS Glue ワークフローによってオーケストレーションされる AWS Glue データ処理ジョブがあります。AWS Glue ジョブはスケジュールに従って実行することも、手動で起動することもできます。
この会社は、ML モデル開発用に Amazon SageMaker Pipelines でパイプラインを開発しています。パイプラインは、モデル開発のデータ処理フェーズで AWS Glue ジョブの出力を使用します。ML エンジニアは、AWS Glue ジョブをパイプラインと統合するソリューションを実装する必要があります。
どのソリューションが、運用オーバーヘッドを最小限に抑えながらこれらの要件を満たしますか?

47 / 100

47.

No.47
ある会社では、Amazon Redshift データベースを単一のデータソースとして使用しています。データの一部は機密です。
データサイエンティストは、データベースから機密データの一部を使用する必要があります。ML エンジニアは、ソースデータを変換したり、匿名化されたデータをデータベースに保存したりすることなく、データサイエンティストにデータへのアクセスを許可する必要があります。
どのソリューションが、実装の労力を最小限に抑えてこれらの要件を満たしますか?

48 / 100

48.

No.48
ML エンジニアは、Amazon SageMaker Studio でディープラーニング モデルを微調整するためにトレーニング ジョブを使用しています。ML エンジニアは以前、同様のデータセットで同じ事前トレーニング済みモデルを使用していました。ML エンジニアは、勾配消失、GPU の活用不足、および過剰適合の問題を予想しています。
ML エンジニアは、これらの問題を検出し、問題が発生したときに定義済みの方法で対処するためのソリューションを実装する必要があります。また、ソリューションは、トレーニング中に包括的なリアルタイム メトリックを提供する必要があります。
どのソリューションが、運用オーバーヘッドを最小限に抑えながらこれらの要件を満たしますか?

49 / 100

49.

No.49
クレジットカード会社には、Amazon SageMaker エンドポイントで運用中の不正検出モデルがあります。この会社は、モデルの新しいバージョンを開発します。会社は、ライブ データを使用して、運用エンド ユーザーに影響を与えずに、新しいモデルのパフォーマンスを評価する必要があります。
これらの要件を満たすソリューションはどれですか?

50 / 100

50.

No.50
ある企業は、ユーザーのクリックに関する時系列データを Amazon S3 バケットに保存しています。生データは、毎日のユーザー アクティビティの何百万行にもなります。ML エンジニアは、データにアクセスして ML モデルを開発します。
ML エンジニアは、Amazon Athena を使用して毎日レポートを生成し、過去 3 日間のクリック傾向を分析する必要があります。企業は、データをアーカイブする前に 30 日間データを保持する必要があります。どのソリューションがデータ取得に最高のパフォーマンスを提供しますか?

51 / 100

51.

No.51
ある企業が、銀行アプリケーションで不正なクレジットカード取引をリアルタイムで検出する ML モデルを導入しました。このモデルは Amazon SageMaker 非同期推論を使用しています。消費者は推論結果の受信が遅れていると報告しています。
ML エンジニアは、推論パフォーマンスを向上させるソリューションを実装する必要があります。また、モデル品質の逸脱が発生したときに通知を提供するソリューションも必要です。
これらの要件を満たすソリューションはどれですか?

52 / 100

52.

No.52
ML エンジニアは、トレーニング済みの ML モデルをホストするためのソリューションを実装する必要があります。モデルへのリクエストのレートは、1 日を通して一定ではありません。
ML エンジニアは、モデルが使用されていないときにコストを最小限に抑えるスケーラブルなソリューションを必要としています。また、ソリューションは、ピーク使用時にリクエストに応答するモデルの容量を維持する必要があります。
これらの要件を満たすソリューションはどれですか?

53 / 100

53.

No.53
ある会社が Amazon SageMaker Studio を使用して ML モデルを開発しています。この会社には 1 つの SageMaker Studio ドメインがあります。ML エンジニアは、SageMaker のコンピューティング コストが特定のしきい値に達したときに自動アラートを提供するソリューションを実装する必要があります。
どのソリューションがこれらの要件を満たしますか?

54 / 100

54.

No.54
ある会社では、ML ワークロードに Amazon SageMaker を使用しています。同社の ML エンジニアは、不正検出モデルを構築するために 50 MB の Apache Parquet データ ファイルを受け取ります。ファイルには、不要な相関列がいくつか含まれています。
ML エンジニアは、最小限の労力でファイル内の不要な列を削除するにはどうすればよいでしょうか?

55 / 100

55.

No.55
ある会社が、顧客に購入を勧める製品を推奨するアプリケーションを作成しています。このアプリケーションは、Amazon Q Business への API 呼び出しを行います。会社は、Amazon Q Business からの応答に会社の主な競合他社の名前が含まれないようにする必要があります。
この要件を満たすソリューションはどれですか?

56 / 100

56.

No.56
ML エンジニアは、Amazon SageMaker を使用して、テキスト要約用の大規模言語モデル (LLM) を微調整する必要があります。 ML エンジニアは、ローコード ノーコード (LCNC) アプローチに従う必要があります。
これらの要件を満たすソリューションはどれですか?

57 / 100

57.

No.57
ある企業には、株価を予測するために毎晩 1 回実行する必要がある ML モデルがあります。モデル入力は、当日に収集された 3 MB のデータです。モデルは翌日の予測を生成します。予測プロセスの実行が完了するまでに 1 分もかかりません。
これらの要件を満たすために、Amazon SageMaker にモデルをデプロイするにはどうすればよいでしょうか?

58 / 100

58.

No.58
ML エンジニアが Amazon SageMaker で ML モデルをトレーニングし、ドサーキット TV 映像から自動車事故を検出しました。ML エンジニアは SageMaker Data Wrangler を使用して、事故の画像と非事故の画像のトレーニング データセットを作成しました。
モデルはトレーニングと検証中に良好なパフォーマンスを示しました。しかし、さまざまなカメラからの画像の品質にばらつきがあるため、本番環境ではモデルのパフォーマンスが低下しています。
どのソリューションが最も短時間でモデルの精度を向上させるでしょうか。

59 / 100

59.

No.59
ある会社には、さまざまな API を使用して入力テキストの埋め込みを生成するアプリケーションがあります。会社は、3 か月ごとに API トークンを自動的にローテーションするソリューションを実装する必要があります。
この要件を満たすソリューションはどれですか?

60 / 100

60.

No.60
ML エンジニアは、欠損値、重複、および極端な外れ値を含むデータセットを受け取ります。ML エンジニアは、これらのデータセットを 1 つのデータ フレームに統合し、ML 用にデータを準備する必要があります。
これらの要件を満たすソリューションはどれですか?

61 / 100

61.

No.61
ある企業には、顧客が会社のスタッフからの長期的なサポートを必要としたかどうかを示す履歴データがあります。この企業は、新規顧客が長期的なサポートを必要とするかどうかを予測するための ML モデルを開発する必要があります。
この要件を満たすために、企業はどのモデリングアプローチを使用すべきですか?

62 / 100

62.

No.62
ML エンジニアが Amazon SageMaker の外部でバイナリ分類モデルを開発しました。ML エンジニアは、追加のチューニングのために、SageMaker Canvas ユーザーがモデルにアクセスできるようにする必要があります。
モデル成果物は Amazon S3 バケットに保存されます。ML エンジニアと Canvas ユーザーは同じ SageMaker ドメインに属しています。
ML エンジニアが Canvas ユーザーとモデルを共有できるようにするには、どの要件の組み合わせを満たす必要がありますか? (2 つ選択してください)。

63 / 100

63.

No.63
ある企業が Amazon SageMaker でディープラーニング モデルを構築しています。この企業は、トレーニング データセットとして大量のデータを使用しています。会社は、モデルのハイパーパラメータを最適化して、検証データセットの損失関数を最小化する必要があります。
どのハイパーパラメータ調整戦略が、最小の計算時間でこの目標を達成しますか?

64 / 100

64.

No.64
ある会社が、プライマリ AWS アカウントで Amazon Redshift ML を使用する予定です。ソースデータは、セカンダリ アカウントの Amazon S3 バケットにあります。
ML エンジニアは、セカンダリ アカウントの S3 バケットにアクセスするために、プライマリ アカウントに ML パイプラインを設定する必要があります。ソリューションでは、パブリック IPv4 アドレスを必要としません。
これらの要件を満たすソリューションはどれですか?

65 / 100

65.

No.65
ある会社では、AWS Lambda 関数を使用して ML モデルからのメトリクスを監視しています。ML エンジニアは、メトリクスがしきい値を超えたときに電子メールメッセージを送信するソリューションを実装する必要があります。
この要件を満たすソリューションはどれですか?

66 / 100

66.

No.66
ある会社が Amazon SageMaker を使用して、予測 ML モデルを本番環境にデプロイしました。この会社は、モデルで SageMaker Model Monitor を使用しています。モデルの更新後、ML エンジニアは Model Monitor チェックでデータ品質の問題に気付きました。
ML エンジニアは、Model Monitor が特定したデータ品質の問題を軽減するために何をすべきですか?

67 / 100

67.

No.67
ある企業には、顧客が企業の Web サイトにアップロードした画像に基づいてテキストの説明を生成する ML モデルがあります。画像の合計サイズは最大 50 MB です。
ML エンジニアは、画像を A​​mazon S3 バケットに保存することにしました。 ML エンジニアは、需要の変化に合わせて拡張できる処理ソリューションを実装する必要があります。
どのソリューションが、運用オーバーヘッドが最も少なく、これらの要件を満たしますか?

68 / 100

68.

No.68
ML エンジニアは、ドキュメントから意味のある一意のキーワードを識別して抽出するために AWS サービスを使用する必要があります。
これらの要件を満たすソリューションのうち、運用オーバーヘッドが最も少ないのはどれですか?

69 / 100

69.

No.69
ある企業は、ML エンジニアにトレーニング データへの適切なアクセス権を与える必要があります。ML エンジニアは、自分のビジネス グループのトレーニング データにのみアクセスする必要があります。ML エンジニアは、他のビジネス グループのトレーニング データにアクセスすることはできません。
この企業は単一の AWS アカウントを使用し、すべてのトレーニング データを Amazon S3 バケットに保存します。すべての ML モデルのトレーニングは Amazon SageMaker で行われます。
ML エンジニアに適切なアクセス権を提供するソリューションはどれですか?

70 / 100

70.

No.70
ある企業は、予測分析を実行するためにカスタム ML モデルをホストする必要があります。予測分析は、毎日同じ 2 時間の間に予測可能で持続的な負荷で実行されます。
分析期間中の複数の呼び出しには、迅速な応答が必要です。企業は、基盤となるインフラストラクチャと自動スケーリング アクティビティを管理するために AWS を必要としています。
これらの要件を満たすソリューションはどれですか?

71 / 100

71.

No.71
ある会社の ML エンジニアが、感情分析用の ML モデルを Amazon SageMaker エンドポイントにデプロイしました。ML エンジニアは、モデルがどのように予測を行うかを会社の関係者に説明する必要があります。
どのソリューションがモデルの予測を説明するでしょうか?

72 / 100

72.

No.72
ML エンジニアは、Amazon SageMaker を使用して、分散トレーニングを必要とするディープラーニング モデルをトレーニングしています。トレーニングを何度か試した後、ML エンジニアはインスタンスが期待どおりに動作していないことに気付きました。ML エンジニアは、トレーニング インスタンス間の通信オーバーヘッドを特定します。
インスタンス間の通信オーバーヘッドを最小限に抑えるために、ML エンジニアは何をすべきでしょうか?

73 / 100

73.

No.73
ある会社では、カスタム Python スクリプトと独自のデータセットを使用して、オンプレミスで ML モデルを実行しています。この会社は PyTorch を使用しています。モデルの構築には、固有のドメイン知識が必要です。この会社は、モデルを AWS に移行する必要があります。
最も少ない労力でこれらの要件を満たすソリューションはどれですか?

74 / 100

74.

No.74
ある会社では、Amazon SageMaker と数百万のファイルを使用して ML モデルをトレーニングしています。各ファイルのサイズは数メガバイトです。ファイルは Amazon S3 バケットに保存されています。この会社はトレーニングのパフォーマンスを改善する必要があります。
どのソリューションが、最短時間でこれらの要件を満たしますか?

75 / 100

No.75
ある企業は、顧客からの表形式のデータを使用して ML モデルを開発したいと考えています。データには、破棄すべきではない機密情報を含む意味のある順序付けられた機能が含まれています。ML エンジニアは、別のチームがモデルの構築を開始する前に、機密データがマスクされていることを確認する必要があります。

75. これらの要件を満たすソリューションはどれですか?

76 / 100

76.

No.76
ML エンジニアは、大規模なデータセットから非同期的に推論を得るために ML モデルをデプロイする必要があります。また、ML エンジニアは、モデルのデータ品質のスケジュールされたモニタリングを実装する必要があります。ML エンジニアは、データ品質の変化が発生したときにアラートを受信する必要があります。
これらの要件を満たすソリューションはどれですか?

77 / 100

77.

No.77
ML エンジニアは、AWS Glue DataBrew の最小最大正規化を使用してトレーニングデータを正規化しました。ML エンジニアは、実稼働推論データを予測のためにモデルに渡す前に、トレーニングデータと同じ方法で実稼働推論データを正規化する必要があります。
この要件を満たすソリューションはどれですか?

78 / 100

78.

No.78
ある会社が Amazon SageMaker を使用して、画像に基づく分類評価を行う予定です。この会社には、Amazon FSx for NetApp ONTAP システム仮想マシン (SVM) に保存されている 6 TB のトレーニングデータがあります。SVM は SageMaker と同じ VPC にあります。
ML エンジニアは、SageMaker 環境にある ML モデルがトレーニングデータにアクセスできるようにする必要があります。
これらの要件を満たすソリューションはどれですか?

79 / 100

79.

No.79
ある企業は、ML モデルのベンダーから定期的に新しいトレーニングデータを受け取ります。ベンダーは、3~4 日ごとに、クリーンアップされ準備されたデータを会社の Amazon S3 バケットに配信します。
会社には、モデルを再トレーニングするための Amazon SageMaker パイプラインがあります。 ML エンジニアは、新しいデータが S3 バケットにアップロードされたときにパイプラインを実行するソリューションを実装する必要があります。
どのソリューションが、最小限の運用労力でこれらの要件を満たしますか?

80 / 100

80.

No.80
ML エンジニアは、Amazon SageMaker XGBoost アルゴリズムを使用して不正検出モデルを開発しています。このモデルは、取引を不正か正当かに分類します。
テスト中、このモデルはトレーニング データセット内の不正の識別に優れています。ただし、このモデルは、新しい取引や見たことのない取引での不正の識別には非効率的です。
ML エンジニアは、新しい取引の不正検出を改善するために何をすべきでしょうか?

81 / 100

81.

No.81
ある会社では、バイナリ分類モデルを本番環境で使用しています。 ML エンジニアは、モデルの新しいバージョンを開発する必要があります。
新しいモデル バージョンでは、正のラベルと負のラベルの正しい予測を最大化する必要があります。ML エンジニアは、これらの要件を満たすために、メトリックを使用してモデルを再調整する必要があります。
ML エンジニアは、モデルの再調整にどのメトリックを使用する必要がありますか?

82 / 100

82.

★No.82
ある会社では、Amazon SageMaker を使用して ML モデルを作成しています。同社のデータ サイエンティストは、オーケストレーションする ML ワークフローをきめ細かく制御する必要があります。また、データ サイエンティストは、SageMaker ジョブとワークフローを有向非巡回グラフ (DAG) として視覚化する機能も必要としています。データ サイエンティストは、モデル検出実験の実行履歴を保持し、監査とコンプライアンス検証のためのモデル ガバナンスを確立する必要があります。
これらの要件を満たすソリューションはどれですか?

83 / 100

83.

No.83
ある企業は、コンテナ化された ML アプリケーションのコストを削減したいと考えています。アプリケーションは、Amazon EC2 インスタンス、AWS Lambda 関数、および Amazon Elastic Container Service (Amazon ECS) クラスターで実行される ML モデルを使用します。EC2 ワークロードと ECS ワークロードは、予測とアーティファクトを保存するために Amazon Elastic Block Store (Amazon EBS) ボリュームを使用します。
ML エンジニアは、非効率的に使用されているリソースを特定する必要があります。また、ML エンジニアは、これらのリソースのコストを削減するための推奨事項を生成する必要もあります。
最も少ない開発労力でこれらの要件を満たすソリューションはどれですか?

84 / 100

84.

No.84
ある企業は、自社のすべての ML モデルの中央カタログを作成する必要があります。モデルは、企業が最初にモデルを開発した AWS アカウントにあります。モデルは、Amazon Elastic Container Registry (Amazon ECR) リポジトリでホストされています。
これらの要件を満たすソリューションはどれですか?

85 / 100

85.

No.85
ある会社が新しい ML モデルを開発しました。会社では、モデルを本番環境に完全にリリースする前に、トラフィックの 10% でオンラインモデル検証を行う必要があります。会社は、モデルを提供するために、アプリケーションロードバランサー (ALB) の背後にある Amazon SageMaker エンドポイントを使用しています。
どのソリューションが、必要なオンライン検証を最小の運用オーバーヘッドで設定しますか?

86 / 100

86.

No.86
ある会社では、ML モデルを開発する必要があります。モデルは、画像内のアイテムを識別し、アイテムの場所を提供する必要があります。
これらの要件を満たす Amazon SageMaker アルゴリズムはどれですか?

87 / 100

87.

No.87
ある会社には、さまざまなソースからの 1 TB のファイルを含む Amazon S3 バケットがあります。S3 バケットには、同じ S3 フォルダに CSV、JSON、XLSX、Apache Parquet のファイル タイプが含まれています。
ML エンジニアは、AWS Glue DataBrew を使用してデータを処理するソリューションを実装する必要があります。ML エンジニアは、AWS Glue が将来出力を使用できるように、最終出力を Amazon S3 に保存する必要もあります。
これらの要件を満たすソリューションはどれですか?

88 / 100

88.

No.88
製造会社では、ML モデルを使用して、製品が品質基準を満たしているかどうかを判断します。モデルは「合格」または「不合格」の出力を生成します。ロボットは、モデルを使用して組み立てラインの写真を分析し、製品を 2 つのカテゴリに分類します。
モデルのパフォーマンスを評価するために、会社はどの指標を使用すべきですか? (2 つ選択してください。)

89 / 100

89.

No.89
ML エンジニアは、ML トレーニング ジョブの実行時に転送中のすべてのデータを暗号化する必要があります。ML エンジニアは、転送中の暗号化がトレーニング ジョブ中に使用される Amazon SageMaker プロセスに適用されていることを確認する必要があります。
これらの要件を満たすソリューションはどれですか?

90 / 100

90.

No.90
ML エンジニアは、時系列予測モデルの品質を評価するためにメトリクスを使用する必要があります。
このモデルに適用されるメトリクスはどれですか? (2 つ選択してください)

91 / 100

91.

No.91
ある会社では、高速インスタンスを使用する Amazon SageMaker ML モデルを実行しています。モデルにはリアルタイム応答が必要です。モデルごとにスケーリング要件が異なります。会社は、モデルのコールド スタートを許可してはなりません。
これらの要件を満たすソリューションはどれですか?

92 / 100

92.

No.92
ある会社では、ML プロセスに Amazon SageMaker を使用しています。コンプライアンス監査により、トレーニング データ用の Amazon S3 バケットが S3 管理キー (SSE-S3) を使用したサーバー側暗号化を使用していることが判明しました。
会社では、顧客管理キーが必要です。ML エンジニアは、AWS KMS キー (SSE-KMS) を使用したサーバー側暗号化を使用するように S3 バケットを変更します。ML エンジニアは、その他の構成変更は行いません。
暗号化設定を変更した後、SageMaker トレーニング ジョブが AccessDenied エラーで失敗し始めます。
この問題を解決するために、ML エンジニアは何をすべきでしょうか?

93 / 100

93.

No.93
ある会社が、コンピューティング最適化インスタンスを使用して Amazon SageMaker でトレーニング ジョブを実行します。トレーニング実行の需要は、今後 55 週間一定のままです。インスタンスは毎週 35 時間実行する必要があります。会社は、モデル トレーニングのコストを削減する必要があります。
これらの要件を満たすソリューションはどれですか?

94 / 100

94.

★No.94
HOTSPOT
-
ある企業は、過去の取引データを使用して顧客の行動を予測する ML モデルをトレーニングする必要があります。
次のリストから適切な AWS サービスを選択し、データに対して各タスクを実行します。各サービスは 1 回だけ選択するか、まったく選択しないでください。 (3 つ選択してください)

• Amazon Athena
• AWS Glue
• Amazon Kinesis Data Streams
• Amazon S3

探索と分析のためにデータをクエリします。選択...
選択...
Amazon Athena
AWS Glue
Amazon Kinesis Data Streams
Amazon S3

データを保存します。選択...
選択...
Amazon Athena
AWS Glue
Amazon Kinesis Data Streams
Amazon S3

データを変換します。選択...
選択...
Amazon Athena
AWS Glue
Amazon Kinesis Data Streams
Amazon S3

95 / 100

95.

No.95
ある会社が、XGBoost アルゴリズムを使用して製品の故障を予測する ML モデルを導入しました。このモデルは Amazon SageMaker エンドポイントでホストされ、通常の動作データでトレーニングされています。AWS Lambda 関数が会社のアプリケーションに予測を提供します。
ML エンジニアは、受信したライブデータを使用して、時間の経過とともに低下するモデル精度を検出するソリューションを実装する必要があります。
これらの要件を満たすソリューションはどれですか?

96 / 100

96.

No.96
ある企業には、履歴トランザクションデータを使用して顧客の行動を予測する ML モデルがあります。ML エンジニアは、モデルの予測精度を高めるために、Amazon SageMaker でモデルを最適化しています。 ML エンジニアは、入力データとその結果の予測を調べて、さまざまな人口統計にわたってモデルのパフォーマンスを歪める可能性のある傾向を特定する必要があります。
このレベルの分析を提供するソリューションはどれですか?

97 / 100

97.

No.97
ある会社では、ML モデルの現在のバージョンを提供するために、高速インスタンスタイプのリザーブドインスタンスを 10 個使用しています。ML エンジニアは、モデルの新しいバージョンを Amazon SageMaker リアルタイム推論エンドポイントにデプロイする必要があります。
ソリューションでは、元の 10 個のインスタンスを使用して、両方のバージョンのモデルを提供する必要があります。また、ソリューションには、デプロイプロセスで使用できる追加のリザーブドインスタンスが 1 つ含まれている必要があります。バージョン間の移行は、ダウンタイムやサービスの中断なしに実行する必要があります。
これらの要件を満たすソリューションはどれですか?

98 / 100

98.

No.98
IoT 企業は、Amazon SageMaker を使用して、物体検出用の XGBoost モデルのトレーニングとテストを行っています。ML エンジニアは、ハイパーパラメータのバリアントを使用してモデルをトレーニングするときに、パフォーマンス メトリックを監視する必要があります。また、トレーニングが完了したら、ショート メッセージ サービス (SMS) テキスト メッセージを送信する必要があります。
これらの要件を満たすソリューションはどれですか?

99 / 100

99.

No.99
ある会社が、Amazon SageMaker ノートブックインスタンスを含む ML プロジェクトに取り組んでいます。ML エンジニアは、SageMaker ノートブックインスタンスがルートアクセスを許可しないようにする必要があります。
ルートアクセスを許可するノートブックインスタンスのデプロイを防ぐには、どのソリューションが適していますか?

100 / 100

100.

No.100
ある会社が Amazon SageMaker を使用して ML モデルを開発しています。この会社は機密性の高いトレーニングデータを Amazon S3 バケットに保存しています。モデルのトレーニングには、インターネットからのネットワーク分離が必要です。
この要件を満たすソリューションはどれですか?

Your score is

0%

■AWS MLA-C01(jp) Q.101-114

/14

AWS MLA-C01(JP) Q.101-114

AWS Certified Machine Learning Engineer - Associate は、本番環境に ML を実装して運用可能にする技術的能力を実証するものです。キャリアプロファイルと信頼性を向上させて、需要の高い機械学習に関連する職務に備えましょう。

1 / 14

1.

No.101
ある企業では、モデルの作成時に ML モデルのバージョンを自動的に作成する AWS ソリューションが必要です。
この要件を満たすソリューションはどれですか?

2 / 14

2.

No.102
ある企業では、Amazon Bedrock で実行されるオープンソースの大規模言語モデル (LLM) を補完するために、Retrieval Augmented Generation (RAG) を使用する必要があります。RAG の企業のデータは、Amazon S3 バケット内のドキュメント セットです。ドキュメントは、.csv ファイルと .docx ファイルで構成されています。
これらの要件を、運用オーバーヘッドが最も少ないソリューションはどれですか?

3 / 14

3.

No.103
ある企業は、Amazon SageMaker エンドポイントで本番推論用の ML モデルをデプロイする予定です。推論ペイロードの平均サイズは 100 MB から 300 MB までです。推論リクエストは 60 分以内に処理する必要があります。
これらの要件を満たす SageMaker 推論オプションはどれですか?

4 / 14

4.

No.104
ML エンジニアが画像分類トレーニング ジョブでクラスの不均衡に気付きました。
ML エンジニアはこの問題を解決するために何をすべきですか?

5 / 14

5.

No.105
ある企業は、顧客と ML モデルとのやり取りに関する .csv ファイルを毎日受け取ります。この企業は、ファイルを Amazon S3 に保存し、そのファイルを使用してモデルを再トレーニングします。ML エンジニアは、モデルを再トレーニングする前に、ファイル内のクレジットカード番号をマスクするソリューションを実装する必要があります。
どのソリューションが、開発の労力を最小限に抑えてこの要件を満たしますか?

6 / 14

6.

No.106
ある医療会社は、患者に治療を推奨するツールを構築するために AWS を使用しています。同社は、患者から健康記録と英語の自己申告テキスト情報を入手しました。同社は、この情報を使用して患者に関する洞察を得る必要があります。
最も少ない開発労力でこの要件を満たすソリューションはどれですか?

7 / 14

7.

No.107
ある会社は、分類モデルを構築するために、PDF ドキュメントからエンティティを抽出する必要があります。
最も短い時間でエンティティを抽出して保存するソリューションはどれですか?

8 / 14

8.

No.108
ある企業が、VPN 経由でアクセスできる Amazon SageMaker Studio ノートブックを共有しています。企業は、悪意のある人物が署名済み URL を悪用してノートブックにアクセスするのを防ぐために、アクセス制御を実施する必要があります。
これらの要件を満たすソリューションはどれですか?

9 / 14

9.

No.109
ML エンジニアは、既存の ML モデルを再トレーニングするために、2 つのソースからのデータをマージして変換する必要があります。1 つのデータ ソースは、Amazon S3 バケットに保存されている .csv ファイルで構成されています。各 .csv ファイルは、数百万のレコードで構成されています。もう 1 つのデータ ソースは、Amazon Aurora DB クラスターです。
マージ プロセスの結果は、2 番目の S3 バケットに書き込む必要があります。ML エンジニアは、このマージと変換のタスクを毎週実行する必要があります。
どのソリューションが、運用オーバーヘッドを最小限に抑えながらこれらの要件を満たしますか?

10 / 14

10.

No.110
ML エンジニアが、Amazon SageMaker モデルを本番環境のサーバーレスエンドポイントにデプロイしました。モデルは、InvokeEndpoint API オペレーションによって呼び出されます。
本番環境のモデルのレイテンシーは、テスト環境のベースライン レイテンシーよりも高くなっています。ML エンジニアは、レイテンシーの増加はモデルの起動時間によるものだと考えています。
この仮説を確認または否定するには、ML エンジニアは何をすべきでしょうか?

11 / 14

11.

No.111
ML エンジニアは、データセットが個人識別情報 (PII) に関する規制に準拠していることを確認する必要があります。ML エンジニアは、データを使用して Amazon SageMaker インスタンスで ML モデルをトレーニングします。SageMaker は PII を一切使用してはなりません。
どのソリューションが最も運用効率の高い方法でこれらの要件を満たしますか?

12 / 14

12.

No.112
企業は、新しく作成された Amazon SageMaker ノートブックインスタンスにカスタムスクリプトをインストールする必要があります。
どのソリューションが、運用オーバーヘッドを最小限に抑えてこの要件を満たしますか?

13 / 14

13.

★No.113
ある会社が、e コマース アプリケーション用のリアルタイム データ処理パイプラインを構築しています。このアプリケーションは、ほぼリアルタイムで取り込み、処理、視覚化する必要がある大量のクリックストリーム データを生成します。この会社には、データ処理用の SQL とインタラクティブな分析用の Jupyter ノートブックをサポートするソリューションが必要です。
これらの要件を満たすソリューションはどれですか?

14 / 14

14.

No.114
医療会社は臨床データを保存する必要があります。データには、個人を特定できる情報 (PII) と保護された健康情報 (PHI) が含まれます。
ML エンジニアは、PII と PHI が ML モデルのトレーニングに使用されないようにするためのソリューションを実装する必要があります。
これらの要件を満たすソリューションはどれですか?

Your score is

0%

最終更新: 3月 25, 2025