参考リンク :: Building Data Analytics Solutions Using Amazon Redshift

Home > 参考リンク

モジュール 0

コース紹介：Building Data Analytics Solutions Using Amazon Redshift

モジュール A

モジュール 1: データ分析パイプラインでの Amazon Redshift の使用

Amazon Redshift クラスター
クラスターの拡張
- Amazon Redshift の伸縮自在なサイズ変更の仕組みを教えてください。
Amazon Redshift ML
- Amazon Redshift ML が一般公開されました — SQL を使用して機械学習モデルを作成し、データから予測を行う
Amazon Redshift のコスト
- Amazon Redshift の料金
- Amazon Redshift での使用制限の管理

モジュール 2: 取り込みとストレージ

COPY コマンド
- ロードデータの分割
- スライス数の確認
  - Amazon Redshift のクラスターとノード
Redshift Data API
- AWS CLI での Data API
- AWS SDK for Python での Data API
SUPER 型
Redshift SQL リファレンス
- SQL リファレンス

モジュール 3: データの処理と最適化

同時実行スケーリング
- 同時実行スケーリングの候補

モジュール 4: Amazon Redshift クラスターのセキュリティおよびモニタリング

Redshift Spectrum におけるアクセス制御
- AWS Lake Formation で Redshift Spectrum を使用する
- Amazon Redshift Spectrum を使用してデータレイク内のデータをクエリする
フェデレーティッドクエリにおけるアクセス制御
- フェデレーテッドクエリを使用するためのシークレットと IAM ロールの作成
一時的な認証情報
- GetClusterCredentials を呼び出すアクセス許可を持つ IAM ロールまたはユーザーを作成する
暗号化
- Amazon Redshift データベース暗号化
コンプライアンス
- Amazon Redshift のコンプライアンス検証
クエリモニタリング
- 新しい Amazon Redshift コンソールでクエリをモニタリングおよび最適化する | AWS Blog

モジュール5 : データウェアハウス分析ソリューションの設計

設問 1 の解答例
- タイプとして RA3 を選択します。もしデータ容量が 10TB未満であれば、コストパフォーマンス的に DC2 も検討の余地はありますが、障害時の他の AZ に復旧させる場合は RA3 が必要になります。
設問 2 の解答例
- Q2-1: COPY コマンドを使用します。
- Q2-2: データファイルを列指向型のフォーマットにしたうえで分割し、同じサイズにします。。1 回の COPY コマンドでそれらのファイルを指定して実行することで並列に処理されます。
設問 3 の解答例
- Redshift Data API の Python 版を使用します。
設問 4 の解答例
- 直近 3 年分のデータだけを Redshift に格納し、他の 7 年分は S3 バケットに入れます。外部テーブルを定義し、Redshift Spectrum でアクセスします。
設問 5 の解答例
- Q5-1: ワークロードが予測しにくいので自動 WLM を選択します。
- Q5-2: 時々発生する負荷の高いクエリには、Concurrency Scaling を有効化して使用することで対処します。