EMRのエラーをS3のログから確認
ログダウンロード用のディレクトリを作成、及び移動
mkdir j-3PS6MU0W27GMG
cd j-3PS6MU0W27GMG
ログのダウンロード
※j-3PS6MU0W27GMG
はCluster ID
aws s3 sync s3://aws-logs-xxx-ap-northeast-1/elasticmapreduce/j-3PS6MU0W27GMG .
解凍
find . -type f -exec gunzip {} \;
エラーとワーニングを検索
時系列に並ぶようにsort
find . | grep log | xargs egrep "WARN|ERROR" | sort -k2
関連しているかもしれない記事
- EMR Pysparkでデータフレームを縦に連結してデータを増幅させる
- Redshiftのdecimalの数値計算時の注意点
- Redshiftのskew tableを確認する
- Redshiftのサンプルデータベース(TICKIT)を作る
- RedshiftのS3へのデータアンロード