10問中 0問が回答されています
質問:
You have already completed the テスト before. Hence you can not start it again.
問題を読み込んでいます…
You must sign in or sign up to start the テスト.
まず、次の操作を完了する必要があります:
正解数 0/問題数10
回答にかかった時間:
終了時間となりました
回答お疲れ様でした。
Earned Point(s): 0 of 0, (0)
0 Essay(s) Pending (Possible Point(s): 0)
おめでとう!ポイントが1追加されました!
【MLS-101】あるデータサイエンティストは、既存のオンプレミス ETL プロセスをクラウドに移行する必要があります。
現在のプロセスは一定の時間間隔で実行され、PySparkを使用して、複数の大規模データソースを組み合わせて、下流処理のための単一の統合出力にフォーマットします。
データサイエンティストは、クラウドソリューションに対して次の要件を与えられています。
・ 複数のデータソースを組み合わせる
・ 既存のPySpark論理を再利用する
・ 既存のスケジュールでソリューションを実行する
・ 管理する必要のあるサーバーの数を最小化する
このソリューションを構築するのにどのアーキテクチャを使用すべきでしょうか。
【MLS-102】ある企業の機械学習のスペシャリストは、Amazon SageMakerのためのスケーラブルなデータストレージソリューションを設計中です。同社は、既存のTensorFlowベースのモデルを持っていて、そのトレーニングにtrain.pyスクリプトを使っています。このモデルは、現在TFRecord形式で保存されている静的なトレーニングデータに依存しています。 ML専門家は、SageMakerにトレーニングデータを最小限の開発オーバーヘッドで提供するために何をすべきでしょうか?
【MLS-103】あるデータサイエンティストが、ある会社の必要な在庫レベルを予測するモデルに取り組んでいます。すべての履歴データは、Amazon S3上の会社のデータレイクに.csvファイルで保存されています。データセットは約500GBのデータで構成されています。データサイエンティストは、モデルをトレーニングする前に、SQLを使用してデータを探索したいと考えています。同社はコストを最小限に抑えたいと考えています。これらの要件を満たす、運用上のオーバーヘッドが最も少ないオプションはどれですか?
【MLS-104】データサイエンティストは、数週間にわたってAmazon SageMakerノートブックインスタンスを実行しています。この間、Jupyter Notebookの新バージョンが、追加のソフトウェアアップデートとともにリリースされました。セキュリティチームは、実行中のすべてのSageMakerノートブックインスタンスに、SageMakerが提供する最新のセキュリティおよびソフトウェアアップデートを使用することを義務付けています。
データサイエンティストは、どのようにしてこの要求を満たせますか?
【MLS-105】ある会社が何千もの小売店に衣類を卸売りしています。データサイエンティストは、各店舗の各商品の1日の販売量を予測するモデルを作成する必要があります。データサイエンティストは、半分以上の店舗が6ヶ月未満しか営業していないことを発見しました。売上データは週ごとに一貫性があります。データベースからの日次データは毎週集計され、売上がない週は現在のデータセットから省かれています。5年分(100MB)の売上データがAmazon S3にあります。開発する予測モデルの性能に悪影響を与える要因と、それを軽減するためにデータサイエンティストが取るべき行動はどれですか?(2つ選んでください)
【MLS-106】あるメーカーが多数の工場を運営しており、機械の予期せぬダウンタイムによって複数の工場で生産が停止するような複雑なサプライチェーン関係にあります。
データサイエンティストは、工場からのセンサーデータを分析し、先制メンテナンスが必要な機器を特定し、サービスチームを派遣して予定外のダウンタイムを防ぎたいと考えています。
1台の機械から読み取れるセンサーデータは、温度、電圧、振動、回転数、圧力など、最大で200のデータポイントが含まれます。
このセンサーデータを収集するために、メーカーは工場全体にWi-FiとLANを配備しています。
多くの工場では、信頼できる高速インターネット接続がないにもかかわらず、メーカーはほぼリアルタイムの推論機能を維持したいと考えています。
このようなビジネス要件に対応するモデルを展開するアーキテクチャはどれでしょうか?
【MLS-107】機械学習スペシャリストが、オンラインショッピングサイトから顧客データを収集します。このデータには、人口統計、過去の訪問履歴、地域情報などが含まれています。専門家は、これらのデータを使って顧客のショッピングパターン、好み、傾向を特定するための機械学習手法を開発し、サイトを改善し、より良いサービスとスマートな推奨を行うことが求められます。
スペシャリストは、どのソリューションを推奨すべきでしょうか?
【MLS-108】ある小売企業が、自社の Web サイトにリコメンドシステムを構築したいと考えています。
このシステムは既存のユーザーに対してリコメンドを行う必要があり、各ユーザーの過去の閲覧履歴に基づく必要があります。
また、ユーザーが過去に購入した商品をフィルタリングする必要があります。
これらの要件を満たすために、最も少ない開発工数で実現できるのはどのソリューションでしょうか?
【MLS-109】ある自動車エンジンの製造業者は、運転中の自動車からデータを収集しています。
収集されたデータには、タイムスタンプ、エンジン温度、回転数(RPM)、およびその他のセンサー測定値が含まれます。
この会社は、エンジンに問題が発生する時期を予測し、ドライバーにエンジンのメンテナンスを受けるように事前に通知したいと考えています。
エンジンデータは学習用にデータレイクにロードされます。
実運用に導入可能な最も適切な予測モデルはどれでしょうか?
【MLS-110】機械学習スペシャリストは、ある大企業と協力して製品に機械学習を活用しようとしています。
この企業は、顧客のカテゴリーを今後6ヶ月以内に解約する顧客と、解約しない顧客に分類したいと考えています。
このタスクを達成するために、スペシャリストはどの機械学習モデルタイプを使用すべきでしょうか。