Tableau DesktopでCloudera CDHに接続する

今回はTableau DesktopでCloudera CDHに接続する方法をまとめます。

Tableauとは

BIツールの一つで簡単な操作でデータを分析することが出来ます。
詳しくはこちら

特徴の一つとして
ExcelからMySQLAmazon Redshift、Google BigQuery等、様々なデータソースに接続できます。
今回はデータソースの一つ”Cloudera Hadoop”に接続してみます。

Tableau Desktopの用意

こちら から”無料で試す”をクリックしてソフトウェアをダウンロードしてください。

今回はWindows7にインストールしました。14日間無償で体験できます。

Cloudera CDHの用意

いつものように Cloudera Managerでさくっとインストールしました。
CDHといってもHiveに接続するのでHiveをインストールしておきます。

Cloudera Connectorsインストール

Cloudera CDHに接続する為にはCloudera Connectorsのインストールが必要になります。
こちらから”ODBC Drivers & Connectors for Hive”をダウンロードしインストールします。
Tableau Desktopをwindowsにインストールしたのでこちらもwindows版をインストールします。

Tableau Desktop設定

こちらを参照して設定を行っていきます。
Tableau Desktopを起動し”データに接続”をクリックします。

f:id:kashigeru:20141020221637j:plain

データソースの中から”Cloudera hadoopを選択します。

f:id:kashigeru:20141020221546j:plain

サーバーIP、ポート(デフォルト:10000)
タイプ:Hive Server2、認証情報を入力し接続をクリックします。

f:id:kashigeru:20141020221932j:plain

接続出来れば下記画面になります。

f:id:kashigeru:20141020222417j:plain

スキーマ、表(table)を検索します。

f:id:kashigeru:20141020222458j:plain

表(table)を右側にドラッグ&ドロップし”ワークシートに移動”をクリックします。

f:id:kashigeru:20141020222611j:plain

画面が遷移し左側に定義されているカラム名が表示されます。
これでTableau Desktopで分析出来る状態になりました。

f:id:kashigeru:20141020222749j:plain

Tableau desktopを使いこなせば こういうグラフをクリックだけで作る事が出来ます。

今回はここまで。
(ノ´▽`)ノ{+++THANK YOU+++}ヽ(´▽`ヽ)

Hadoop 第3版

Hadoop 第3版