MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-150】医療スタートアップは PHI を含む機械学習データ 50 TB を S3 バケット prod-ml-data に保存している。
SageMaker ノートブックと ECS バッチ推論タスクはいずれも VPC (vpc-1234) のプライベートサブネットで実行され、インターネットや他アカウントからのアクセスは厳禁である。
VPC 外へのアウトバウンド通信を発生させず、運用負荷を最小化しながら上述のセキュリティ要件を満たす構成はどれか。

VPC に S3 Gateway エンドポイントを作成し、エンドポイントポリシーで prod-ml-data の GetObject/PutObject を許可し、バケットポリシーで "aws:SourceVpce" を当該エンドポイント ID のみに限定する
各プライベートサブネットに NAT ゲートウェイを配置し、バケットポリシーで "aws:SourceIp" に VPC CIDR を指定してアクセスを許可する
S3 インターフェイスエンドポイントを作成し、SageMaker で Network Isolation を無効化し、バケットのパブリックアクセスブロックを有効化する
S3 アクセスポイントを作成し、ACL を Private に設定し、バケットポリシーはデフォルトのまま運用する

ヒントボタン

ヒント1
プライベートサブネットから Amazon S3 へアクセスする際に NAT Gateway を使うと、実際の宛先が S3 のパブリックエンドポイントであってもトラフィックはインターネットゲートウェイ側にルーティングされます。VPC Flow Logs を有効化すれば 0.0.0.0/0 に出て行くパケットが確認できるはずです。組織が HIPAA 要件や PHI を理由に「VPC 外へのアウトバウンド通信を許可しない」という制約を設けている場合、この通信経路はリスク評価で早い段階に除外されやすい点を思い出してください。

ヒント2
S3 へのプライベート接続には Interface Endpoint と Gateway Endpoint の二種類があります。Interface 型は ENI ごとに利用料金が発生し、データプレーンは PrivateLink の帯域に乗るため 50 TB といった大容量を処理するとコストとスループットの両面で注意が必要です。一方 Gateway 型はルートテーブルでプレフィックスリストを指すだけで、IP の管理や追加料金がなく運用も軽量です。バケットまたはエンドポイントポリシーで GetObject/PutObject のみを許可し、リソースや VPCE ID を条件にすれば、SageMaker や ECS が意図しない外部と通信せずに済むことを比較してみてください。

ヒント3
PHI を含むファイルを安全に扱うには、S3 側の Block Public Access、バケットポリシーの aws:SourceVpce 条件、VPC側のエンドポイントポリシーという多層ガードを同時に成立させることが重要です。さらに NAT や IGW を置かずともルートテーブルを書き換えるだけで透過的に動作し、SageMaker ノートブックや ECS バッチのコード変更も不要なアーキテクチャであれば、機密性・可用性・運用コストの三要件をバランスよく満たせることを総合的に判断してください。

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-151】金融機関A社は、SageMakerノートブックインスタンスから機密学習データを格納する S3 バケット「ml-secure」へ、オンプレミスと Direct Connect で接続されたプライベート VPC 経由の通信のみに限定したい。
要件: 1) 社外IP経路は完全遮断 2) データサイエンティストは既存の IAM ロール ml-researcher を継続使用 3) ネットワーク ACL と NAT Gateway は変更不可。
上記を満たす最も効率的な構成はどれか。

ノートブックをプライベートサブネットへ移し、S3 用 Gateway VPC エンドポイントを作成。バケットポリシーに "aws:SourceVpce" で当該エンドポイント ID のみ許可し、ml-researcher ロールは変更しない構成とする。
S3 のパブリックエンドポイントを利用し、バケットポリシーに "aws:SourceIp" でオンプレミスの固定グローバルIPを許可、それ以外を拒否して経路を制限する。
ノートブックに S3 用インターフェイス VPC エンドポイントをアタッチし、ml-researcher ロールの IAM ポリシーに "aws:SourceVpc" 条件を追加して VPC 内からのみアクセスを許可する。
ノートブックを現行のパブリックサブネットに残し、VPC フローログでインターネット宛通信を検出したら AWS Lambda で自動隔離する運用プロセスを追加して情報漏えいを防止する。

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-152】ヘルスケア SaaS 企業 A社は、Amazon SageMaker で PHI を含む 50 TB のトレーニングデータを扱う。
要件は次の 4 つである。
① SSE-KMS による保管時暗号化
② カスタマーマネージドキーを 12 か月ごとに自動ローテーション
③ キーとデータ操作を 90 日間検索可能に監査
④ ML エンジニア用 IAM ロールのみがキーを使用できること。
運用負荷を最小化しつつ要件を満たすアーキテクチャはどれか。

対称 CMK を新規作成して自動ローテーションを有効化し、キー-ポリシーで ML エンジニアロールのみに kms:Encrypt/Decrypt を許可。S3 バケットと SageMaker の暗号化キーに指定し、全リージョン CloudTrail を CloudWatch Logs に 90 日保持する。
AWS 管理キー (aws/sagemaker) を使用して S3 と SageMaker の暗号化を有効化し、CloudTrail は作成せず S3 サーバーアクセスログを 90 日保存し、IAM ポリシーでロール以外を拒否する。
外部キーをインポートした CMK を作成し自動ローテーションを無効化。AWS Config の記録のみで監査し、キー-ポリシーはデフォルトのままとする。
SSE-S3 を採用してキー管理を S3 に任せ、バケットイベントを EventBridge に送信して 90 日保管し、SageMaker ロールにその他操作を拒否するポリシーを付与する。

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-153】機械学習基盤を提供する製造業 A 社は、Amazon SageMaker ノートブックインスタンス (ml.t3.medium) を 15 台運用している。
情報セキュリティ部門は「CVE 公開後 24 時間以内に OS レベルのセキュリティパッチを適用し、データサイエンティストの稼働時間 (8:00〜20:00) には停止を発生させない」ことを必須要件とした。
各インスタンスの停止許容時間は 15 分以内で、将来的な台数増に対しても運用負荷を抑えたい。
最も適切な運用方法はどれか。

毎晩 EBS スナップショットを取得し、Amazon Inspector の結果を確認後に管理者が手動で SSH 接続して yum update を実行する
IAM で SSM Run Command の権限をデータサイエンティストに付与し、各自が業務開始前にノートブックへログインして yum update を実行する
Lifecycle Configuration に `yum update -y` を記述し、EventBridge ルールで深夜に Stop→Start を自動実行して 15 分以内に全台へパッチを適用する
ノートブックを常時起動し VPC エンドポイントのみを許可する閉域構成とすることで外部脅威を遮断し、パッチ適用を不要とする

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-154】金融 SaaS 企業は SageMaker ノートブックを VPC 内で運用し、PCI DSS 準拠のため通信を AWS ネットワーク外へ一切流出させたくない。
VPC(10.0.0.0/16)にはプライベートサブネットのみを作り、オンプレ(10.1.0.0/16)とは Direct Connect で接続済み。
開発者 10 名はオンプレから HTTPS でノートブックに接続し、S3 バケットと SageMaker API へアクセスする必要がある。
最小構成で要件を満たす設計はどれか。

ノートブックをプライベートサブネットに置き、S3 Gateway VPC エンドポイントと SageMaker インターフェース VPC エンドポイントを追加、SG で 10.1.0.0/16 の HTTPS のみ許可し、NAT ゲートウェイや IGW は作成しない
ノートブックをパブリックサブネットに置き、IGW 経由で S3 と SageMaker に接続、S3 バケットポリシーで 10.0.0.0/16 のみ許可する
ノートブックをプライベートサブネットに置き、外向き NAT ゲートウェイ経由で S3 と SageMaker へ接続し、VPC エンドポイントは作成しない
ノートブックをプライベートサブネットに置き、S3 Gateway エンドポイントのみを作成、SageMaker API は IGW 経由、開発者アクセスは Site-to-Site VPN で 0.0.0.0/0 を許可する

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-155】金融機関A社は10 TBの機密取引データをAmazon S3（ap-northeast-1）に置き、Amazon SageMakerトレーニングジョブをm5.2xlarge×32のSpotで週次実行している。
監査部門は
①インターネット経路を完全遮断しデータ流出リスクをゼロにする、
②RTO15分かつ学習時I/O1 Gbit/s以上を維持する、
③NATゲートウェイを廃止しコスト削減を図る、の3条件を提示した。
最小の運用負荷で要件を満たす構成はどれか。

学習ジョブにネットワーク分離を有効化し、プライベートサブネットに配置したSageMaker用とS3用Interface VPCエンドポイント経由で通信させ、S3バケットポリシーでaws:SourceVpce条件を設定して組織内エンドポイント以外を拒否する
学習ジョブをパブリックサブネットに配置し、S3のBlock Public Accessを無効化してCloudTrailとGuardDutyのアラートで送信を検知し次第隔離する運用を行う
SageMaker Studioをインターネットゲートウェイのみに接続し、データセットを署名付きURLで取得してVPCエンドポイントを削除し通信経路を単純化して運用負荷を下げる
学習ジョブのIAMロールにAmazonS3ReadOnlyAccessを直接付与し、VPC NACLで0.0.0.0/0のアウトバウンドを拒否して外部送信を防止しつつ既存のNATゲートウェイを残す

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-156】医療系 SaaS 企業は HIPAA 準拠のため、PHI を含む画像データで深層学習モデルを Amazon SageMaker で開発・推論している。
要件は:
①S3 上のデータとモデルを SSE-KMS で暗号化し、VPC 外からのアクセスを遮断する。
②学習・処理・推論コンテナのインターネット送信を禁止し、必要な AWS サービスとの通信のみ許可する。
③開発者は SageMaker Studio で可視化するが外部サイトへの HTTP/S 接続は不可とする。
④運用コストは最小限とする。
これらを同時に満たす最適なアーキテクチャはどれか。

Studio をパブリックサブネットに配置し、S3 バケットをパブリック ACL で公開したうえでカスタマー管理 KMS で暗号化し、Training ジョブはデフォルト設定で実行する
Studio・Training・Processing・Batch Transform を同一 VPC のプライベートサブネットに配置し、S3/ECR/STS/Logs の Interface VPC Endpoint を作成、モデル登録時に EnableNetworkIsolation を true にし、S3 には SSE-KMS を必須とする
Studio をデフォルト設定で起動し、Training ジョブに 0.0.0.0/0 のアウトバウンド許可を持つセキュリティグループを付与し、S3 は SSE-S3 を使用する
Studio を VPC のプライベートサブネットに置くが、Training ジョブには VPC を指定せず、モデルには EnableNetworkIsolation を設定し、CloudWatch Logs の VPC Endpoint のみを作成する

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-157】金融系スタートアップは取引明細を S3 に Parquet 形式で保存し、Amazon SageMaker で不正検知モデルを日次学習している。
PII（氏名・カード番号）は学習前にマスキングし、元データはカスタマー管理型 KMS キーで暗号化、キーは年次自動ローテーションすることが義務付けられている。
データサイエンティストにはマスク済みデータのみを閲覧させ、運用負荷とコストを最小化したい。
最適な実装はどれか。

SSE-KMS で暗号化した S3 オブジェクトを Glue ETL (PySpark) で読み込み、DynamicFrame で氏名・カード番号を SHA-256 ハッシュに置換して別プレフィックスへ書き出し、Data Catalog にマスク済みテーブルを登録し、SageMaker ロールには当テーブルへの参照権のみ付与する。
SSE-S3 で暗号化した S3 オブジェクトに Glue DataBrew プロファイルジョブを適用し、PII をアスタリスクでマスク後、同一バケットに上書き保存し、SageMaker ロールにはバケット全体へのフルアクセスをポリシーで許可する。
各クライアントから CSE で暗号化したファイルを S3 に配置し、PUT トリガーの Lambda が PII を削除し Amazon Redshift のテーブルに INSERT、日次で SageMaker が Redshift Spectrum からデータを取得して学習する。
SSE-KMS で暗号化したファイルを Glue ETL で読み込み、氏名・カード番号を Base64 でエンコードし同じ列に上書き、Athena で解析できるよう保存し、SageMaker 学習ではオリジナル列をそのまま使用する。

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-158】医療系スタートアップでは PII を含む 5 TB の学習データを S3 に保存し、Amazon SageMaker トレーニングジョブ（ml.p3.2xlarge、毎日 4 時間稼働）で解析している。
要件は次のとおり：
①データとモデル成果物は暗号化された状態で保存すること　
②キーは自社管理とし、年１回自動ローテーションを行う　
③SageMaker 以外の IAM ユーザには複合化を許可しない　
④運用負荷とコストを最小化する。
これらを満たす実装はどれか。

S3 バケットに SSE-KMS を設定し自社 CMK を指定、鍵ポリシーで SageMaker 実行ロールのみを許可、CMK の自動ローテーションを有効化し SageMaker の暗号化設定にも同一 CMK を適用する
S3 と SageMaker の暗号化に alias/aws/s3 と alias/aws/sagemaker を用い、バケットポリシーで IAM ユーザを拒否してキー管理はすべて AWS に任せる
SageMaker ノートブックで AWS Encryption SDK によりクライアント側暗号化を実施し、SSE-S3 を無効にしてアップロード、キーのローテーションは手動で行う
自社 CMK で S3 を SSE-KMS 化するがローテーションを無効化し、SageMaker では EBS 暗号化のみを有効にして CMK は指定しない

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-159】あるECメディア企業は日次50万枚の顧客投稿画像をS3に保存し、Amazon Rekognition DetectLabelsで不適切コンテンツを自動検出して結果をデータレイクに格納するMLワークロードを構築している。
GDPR遵守のため
①画像と推論結果は顧客管理KMSキーで暗号化保存すること、
②インターネットを経由せずにAPIを呼び出すこと、
③サービス側に画像を永続保存させないことが必須である。
運用負荷を最小化しつつ要件を満たす設計はどれか。

S3バケットのデフォルト暗号化に顧客管理CMKを指定し、Interface VPCエンドポイント経由でDetectLabels APIを呼び出し、出力JSONを同じバケットに保存する。顔コレクションは作成しない。
S3にSSE-S3を設定し、パブリックエンドポイントからIndexFaces APIを実行してコレクションに登録後、結果をEFSに保管する。
クライアント側暗号化でAES-256を用いKMSを使用せず、DetectLabels APIをインターネット経由で呼び出し、結果をSecrets Managerに保管する。
AWS管理キーによるSSE-KMSを用いたS3バケットに保存し、CreateStreamProcessorでKinesis Video Streamsを24時間保持し、NAT Gateway経由でAPIを呼び出す。

ヒントボタン

画像ファイルと推論結果をGDPRに沿って暗号化保管するには、Amazon S3 のデフォルト暗号化に Customer-Managed Key を指定して SSE-KMS を使うと、鍵のライフサイクルを AWS KMS で一元管理でき、クライアント側の手動暗号化や鍵配布が不要になり運用負荷も最小化できます。SSE-S3 は AWS 管理キーで自動暗号化され便利ですが顧客が鍵をコントロールできないため要件を満たさず、クライアント側暗号化はライブラリ実装と復号コードの維持が必要で大規模処理では保守コストが大きくなる点と比較してもこの構成が適切です。さらにオブジェクトロックやバージョニングと組み合わせることで、データレイクの完全性も確保でき、ガバナンス報告の簡素化にも寄与します。

インターネット経路を避けるには NAT Gateway ではなく、Amazon Rekognition の Interface VPC エンドポイントを作成しプライベートサブネットから AWS PrivateLink で DetectLabels API へ直接接続することで、通信が AWS ネットワーク内に閉じ IGW やパブリック IP の管理が不要となりセキュリティグループだけで細粒度制御できます。この方式は VPC Flow Logs で監査も容易なため GDPR のアクセス証跡要件にも対応しやすく、帯域や可用性は AWS インフラにより冗長化されている点も運用担当者にとって安心材料になります。

Amazon Rekognition の DetectLabels は処理後にイメージを保持しないためサービス側永続保存を回避できますが、IndexFaces や CreateStreamProcessor は特徴量や映像をコレクション・Kinesis Video Streams に保存する点が GDPR 上のリスクとなるので注意が必要です。S3 イベントで DetectLabels を呼び出し、結果 JSON を同一バケットに書き戻す流れにし、VPC エンドポイントと CMK を組み合わせることで①顧客管理キーによる暗号化②プライベート経路③サービス側非保持を同時に満たせる構成かを総合的に比較すると最適案が見えてきます。

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-160】金融系企業は、PII を含む 500 GB の CSV を S3 バケット encrypted-data/ 以下に KMS (CMK) で暗号化し、毎夜 SageMaker Processing で前処理し、結果を s3://ml-output/ に保存する。
Docker イメージはプライベート ECR に格納し、ジョブはプライベートサブネット内で実行する。
セキュリティ部門は「ジョブ実行 IAM ロールは最小権限とし、他バケットへのアクセスを禁止、鍵の誤用を防止せよ」と要求している。
最適な設計はどれか。

SageMaker 用に専用実行ロールを作成し、s3:GetObject encrypted-data/*、s3:PutObject ml-output/*、ecr:GetAuthorizationToken/BatchGetImage/GetDownloadUrlForLayer、kms:Decrypt/GenerateDataKey を対象リソースの ARN に限定。両バケットと CMK のポリシーを Principal を当該ロールのみに許可する設定に更新する。
SageMaker 実行ロールに AmazonSageMakerFullAccess と AmazonS3FullAccess を付与し、バケットと CMK はデフォルトポリシーのままとする。
Notebook インスタンスのロールをそのまま Processing ジョブに使い、S3 は VPC エンドポイントポリシーで許可し、KMS ポリシーは変更せず SSE-KMS の自動復号に任せる。
EC2 用インスタンスプロファイルを Processing ジョブに指定し、ECR へ * フルアクセスと S3:GetObject/PutObject * を許可し、アクセス制御はネットワーク ACL のみで行う。

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-161】フィンテック企業は本番アカウントで Amazon SageMaker を用いて 3 リージョンに推論エンドポイントを展開している。
API 呼び出しは 1 日約 1,000 件。
同社は AWS Organizations を利用しており、内部監査部門は「すべての SageMaker API 呼び出し痕跡を改ざん検知付きで 2 年間保存し、集中管理アカウントから横断的に検索できること」と要求した。
運用負荷とコストを最小化しながら要件を満たす構成はどれか。

本番アカウントの各リージョンで単一リージョン CloudTrail を個別に作成し、SSE-S3 で暗号化したローカル S3 バケットに保存し、必要時に Athena で照会する。
Organizations でマルチリージョン CloudTrail を 1 つ作成し、ログファイル検証を有効化したうえで、KMS 暗号化した監査アカウントの S3 バケットに集約し、S3 ライフサイクルで 2 年後に自動削除する。
SageMaker Studio ノートブックに CloudWatch エージェントを導入し、API 呼び出しメトリクスを CloudWatch Logs へ出力して 2 年間保持し、クロスアカウントロールで監査アカウントへ読み取りを許可する。
本番アカウントで AWS Config を有効化し、SageMaker リソースタイプのみ記録し、履歴を SSE-S3 暗号化の監査アカウント S3 バケットに配送して 2 年間保持し、Athena で検索する。

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-162】金融 SaaS 企業は Amazon SageMaker マネージドリアルタイムエンドポイント (ml.c5.large×2、オートスケール) を本番運用中である。
SLO として P95 推論レイテンシ 200 ms 未満を定義し、5 分間連続で超過した場合に運用チームへメールを送る監視を最短で実装したい。
追加インフラコストは最小、推論コードの変更も最小限に抑える必要がある。
最も適切な構成はどれか。

エンドポイントのアクセスログを CloudWatch Logs に送信し、ログメトリクスフィルターでレイテンシを抽出してカスタムメトリクス化し、SNS 通知付き CloudWatch アラームを作成する。
推論コンテナに boto3 を数行追加して CloudWatch PutMetricData API で P95 レイテンシを独自ネームスペースへ送信し、SNS 通知アクション付き CloudWatch アラームを 200 ms/5 分で設定する。
Notebook インスタンスに CloudWatch Agent を導入し、/invocations エンドポイントを 1 分間隔でポーリングしてレイテンシを収集し、SNS 通知付きアラームを構成する。
EventBridge で SageMaker InvokeEndpoint イベントを捕捉し、Step Functions で 5 分平均レイテンシを計算してしきい値を判定し、SNS へ通知する。

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-163】医療系スタートアップは PHI を含む 3 TB の CSV を S3 バケット (バージョニングとブロックパブリックアクセスを有効化) に保存し、Amazon SageMaker トレーニングジョブ (ml.p3.8xlarge、1 日 2 回) でモデルを再学習している。
要件は次のとおり:
1. 開発者は生データを閲覧不可
2. トレーニングジョブのみが s3:GetObject と CMK での復号を実行可能
3. CMK を年 1 回自動ローテーションし、CloudTrail で監査
最小権限でこれらを満たす実装として最も適切なものはどれか。

SageMaker 用実行ロールを作成し、対象バケットの arn を限定した s3:GetObject と kms:Decrypt/DescribeKey を許可するインラインポリシーを付与。CMK キーポリシーにそのロールのみを Principal として追加し、バケットポリシーで aws:PrincipalArn 条件を設定する。
SageMaker 実行ロールに AmazonS3FullAccess と AWSKeyManagementServicePowerUser を付与し、バケットの暗号化を SSE-S3 に設定する。CMK は使わず CloudTrail のみで監査する。
開発者の IAM ユーザーに KMS:Encrypt/KMS:Decrypt を許可し、クライアントサイド暗号化したファイルをアップロードさせる。SageMaker ジョブはインスタンスメタデータに保存した暗号鍵で複合する。
CMK キーポリシーに Principal:"*" を設定し、S3 バケットのパブリックブロックを解除してプレサインド URL でのみアクセスさせる。SageMaker にはデフォルトロールをそのまま使用する。

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-164】医療系 SaaS 企業は、プライベートサブネットに配置した SageMaker 推論エンドポイントをアプリケーションサーバー（10.0.0.0/16）からのみ HTTPS で呼び出し、インターネット経路を一切通過させたくありません。
さらに、エンドポイント API は IAM ロール MLRole のみが操作でき、他のプリンシパルは拒否する必要があります。
最小権限で運用負荷も低い構成として最も適切なものはどれですか。

VPC 内に SageMaker インターフェース型 VPC エンドポイントを作成し、エンドポイントポリシーで MLRole のみに sagemaker:* を許可し、エンドポイントのセキュリティグループで 10.0.0.0/16 からの TCP 443 のみを許可する
パブリック SageMaker エンドポイントを利用し、Security Hub でパブリックアクセスを検出した際に Lambda で自動遮断する運用を組み込む
S3 ゲートウェイ型 VPC エンドポイントを導入し、ポリシーで SourceVpc を 10.0.0.0/16 に制限し、Notebook からのアウトバウンド通信は NAT Gateway を経由させる
Transit Gateway を介して共有サービス VPC のインターネットゲートウェイへルーティングし、SageMaker エンドポイントのセキュリティグループを 0.0.0.0/0 の TCP 443 に設定する

カテゴリ: MLS-4.3機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。

1
2
3

【MLS-165】フィンテック企業A社は顧客口座取引3 TBを格納したS3バケットをAmazon SageMakerノートブックから前処理する計画である。
データはPCI-DSS対象のためインターネット非通過が必須で、RTOは1時間以内、運用負荷とコストは最小化したい。
既存VPCにはパブリック／プライベートサブネットがあり、NAT Gatewayは月次費用削減のため廃止予定である。
オンプレDCとはSite-to-Site VPNで接続済みで、ノートブックはSageMaker上のみで利用する。
これらの要件をすべて満たすネットワーク／権限制御の設計として最も適切なものを選べ。

ノートブックをプライベートサブネットに配置し、SageMakerとS3のInterface VPCエンドポイントを作成。S3バケットポリシーでvpce-IDを条件に許可し、ノートブックIAMロールに必要最小限のs3:Get*/Put*を付与し、IGW/NATを使用しない構成とする。
ノートブックをパブリックサブネットに配置し、セキュリティグループで0.0.0.0/0のHTTPSのみ許可、S3接続はVPCエンドポイントを用いずインターネット経由、バケットポリシーはAWSアカウント番号で制限する構成とする。
ノートブックをプライベートサブネットに配置し、NAT Gateway経由でS3へアクセス、バケットはSSE-KMSを有効化し、IAMロールにはAmazonS3FullAccessを付与、VPCエンドポイントは作成しない構成とする。
ノートブックをオンプレVLANと同一CIDRのサブネットに置き、S3との通信にVPCピアリングを設定、セキュリティグループはVPC CIDRを許可、バケットポリシーでaws:SourceIp=VPC CIDRを条件にし、NAT Gatewayは使わない構成とする。