Cloudera Apache Hadoop 認定管理者 (CCAH)について

CDHを構築/運用してナレッジも溜まってきたのでCCAHを受けてみようかと思い調べました。

CCAH認定試験種類

CDH4のCCA-410
CDH5のCCA-500、UpgradeのCCA-505があります。
(2014年7月現在)

CCA-410は日本語で受験出来ます。
(2014年7月現在)

CCA-410から受けてみようかと。
CDH5は現在構築して検証中なので運用にまわってから考えます。

CCA-410試験概要

問題数: 60 問
制限時間: 90 分
合格点: 70%

CCA-410試験範囲

HDFS (38%)
MapReduce (10%)
Apache Hadoopクラスタの計画 (12%)
Apache Hadoopクラスタのインストールと管理 (17%)
リソース管理 (6%)
監視とロギング (6%)
エコシステム (5%)

HDFSが全体の40%近くなのでここを重点的に勉強したほうがよさそうですね。

質問例を解いてみる

質問例

Q1
これは”NameNode” ”ヒープサイズ”でググると。

Q2
NameNodeの処理フローかな。

Q3
FairSchedulerとminMapsの理解。
Developmentプールの200Mapスロットが必要なジョブだけがsubmitされる。

Q4
再割り当てされると助かりますね。

Q5
実行中のタスクをGUIでしか見ないからわからない。

意外に難しいのでしっかり勉強しないと受かりそうにないですね。
勉強したらまとめブログ書いていきます。

役に立ちそうなリンク

Hadoop Operations
HDFS HA セミナー

(ノ´▽`)ノ{+++THANK YOU+++}ヽ(´▽`ヽ)

Hadoop徹底入門 第2版 オープンソース分散処理環境の構築

Hadoop徹底入門 第2版 オープンソース分散処理環境の構築

Hadoopオペレーション ―システム運用管理ガイド

Hadoopオペレーション ―システム運用管理ガイド