☁️

Redshift RA3 と Spectrumの使い分け

2021/05/31に公開 📖 約1分

☁️AWS 📊Redshift

どちらもコンピュートとストレージ層が分離されているアーキテクチャのため、どういうユースケースのときにどっちを使うべきかという疑問。

例
- RA3パターン
  - S3にデータをオフロードしてストレージを節約しているパターン等はRA3に
  - Redshift内でETLを行いデータを加工するパターン
  - S3上でのパーティション分割などSpectrumからのスキャン性能とかあまり気にしたくない時に
- Spectrum
  - 他のAWSサービスからS3上のデータにアクセスするパターン。現時点においてもDWH上にデータを置いていないパターン等はSpectrumへ。（この場合はAthenaとの使い分けがまた悩みどころ…。）
  - EMRでデータを加工してRedshiftでデータを参照するパターン
  - Redshift内のデータと組み合わせて使うパターン

GitHubで編集を提案

☁️AWS 📊Redshift