モジュール 0
モジュール A
モジュール 1: データ分析パイプラインでの Amazon Redshift の使用
- Amazon Redshift クラスター
- クラスターの拡張
- Amazon Redshift ML
- Amazon Redshift のコスト
モジュール 2: 取り込みとストレージ
- COPY コマンド
- Redshift Data API
- SUPER 型
- Redshift SQL リファレンス
モジュール 3: データの処理と最適化
モジュール 4: Amazon Redshift クラスターのセキュリティおよびモニタリング
- Redshift Spectrum におけるアクセス制御
- フェデレーティッドクエリにおけるアクセス制御
- 一時的な認証情報
- 暗号化
- コンプライアンス
- クエリモニタリング
モジュール5 : データウェアハウス分析ソリューションの設計
- 設問 1 の解答例
- タイプとして RA3 を選択します。もしデータ容量が 10TB未満であれば、コストパフォーマンス的に DC2 も検討の余地はありますが、障害時の他の AZ に復旧させる場合は RA3 が必要になります。
- 設問 2 の解答例
- Q2-1: COPY コマンドを使用します。
- Q2-2: データファイルを列指向型のフォーマットにしたうえで分割し、同じサイズにします。。1 回の COPY コマンドでそれらのファイルを指定して実行することで並列に処理されます。
- 設問 3 の解答例
- Redshift Data API の Python 版 を使用します。
- 設問 4 の解答例
- 直近 3 年分のデータだけを Redshift に格納し、他の 7 年分は S3 バケットに入れます。外部テーブルを定義し、Redshift Spectrum でアクセスします。
- 設問 5 の解答例
- Q5-1: ワークロードが予測しにくいので自動 WLM を選択します。
- Q5-2: 時々発生する負荷の高いクエリには、Concurrency Scaling を有効化して使用することで対処します。