Tableau からAzure Data Lake Storage にJDBC Driver で連携してビジュアライズ

Tableau からリアルタイムAzure Data Lake Storage のデータに連携してビジュアライズ。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-05-22

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

CData Driver for ADLS を使って、BI・ビジュアライズツールのTableau からAzure Data Lake Storage のデータをノーコードで連携して利用できます。この記事では、CData JDBC Driver for ADLS を使います。JDBC は、Windows 版のTabelau でもMac 版のTableau でも同じように利用できます。

Tabelau からAzure Data Lake Storage のデータへの接続を確立

Tableau での操作の前に.jar ファイルを以下のパスに格納します:

  • Windows: C:\Program Files\Tableau\Drivers
  • MacOS: ~/Library/Tableau/Drivers

.jar ファイルを配置したら、Azure Data Lake Storage への接続を設定します。

  1. Tableau を開きます。
  2. [データ]->[新しいデータソース]を開きます。
  3. [その他のデータベース(JDBC)]をクリックします。
  4. URL にJDBC 接続文字列を入力します。
  5. Azure Data Lake Storage 接続プロパティの取得・設定方法

    Azure Data Lake Storage Gen 2 への接続

    Gen 2 Data Lake Storage アカウントに接続するには、以下のプロパティを設定します。

    • Account:ストレージアカウントの名前。
    • FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前。
    • Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます。

    Azure Data Lake Storage Gen 2 への認証

    本製品は、次の4つの認証方法をサポートします:アクセスキーの使用、共有アクセス署名の使用、Azure Active Directory OAuth(AzureAD)、Managed Service Identity(AzureMSI)。

    アクセスキー

    アクセスキーを使用して接続するには、はじめにADLS Gen2 ストレージアカウントで利用可能なアクセスキーを取得する必要があります。

    Azure ポータルで:

    1. ADLS Gen2 ストレージアカウントにアクセスします。
    2. 設定でアクセスキーを選択します。
    3. 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします。
    4. 接続の準備ができたら、次のプロパティを設定します。

      • AuthSchemeAccessKey
      • AccessKey:先にAzure ポータルで取得したアクセスキーの値。

    共有アクセス署名(SAS)

    共有アクセス署名を使用して接続するには、はじめにAzure Storage Explorer ツールを使用して署名を生成する必要があります。

    接続の準備ができたら、次のプロパティを設定します。

    • AuthSchemeSAS
    • SharedAccessSignature:先に生成した共有アクセス署名の値。

    AzureAD、AzureMSI での認証方法については、ヘルプドキュメントの「Azure Data Lake Storage Gen 2 への認証」セクションを参照してください。

    JDBC Driver の接続文字列デザイナーを使う

    JDBC 接続文字列を作るには、Azure Data Lake Storage JDBC Driver のビルトイン接続文字列デザイナーを使う方法があります。ドライバーの.jar ファイルをダブルクリックするか、コマンドラインから.jar ファイルを実行します。

    Windows:

    java -jar 'C:\Program Files\CData\CData JDBC Driver for ADLS 2019\lib\cdata.jdbc.adls.jar'

    MacOS:

    java -jar cdata.jdbc.adls.jar

    接続プロパティに値を入力して、生成される接続文字列をクリップボードにコピーします。

    接続文字列デザイナーを使って、JDBC URL を生成する (Salesforce is shown.)

    JDBC URLを設定する際には、Max Rows プロパティを設定することをお勧めします。これにより取得される行数が制限され、パフォーマンスを向上させます。

    デザイナーで生成されるJDBC URL のサンプル:

    jdbc:adls:Schema=ADLSGen2;Account=myAccount;FileSystem=myFileSystem;AccessKey=myAccessKey;InitiateOAuth=REFRESH
  6. 方言:SQL92
  7. サインインをクリックします。
  8. 接続エラーの場合には、Java がダウンロードされていない場合、Java が64bit マシン用ではなく32bit 用である、などの場合がありますので確認をお願いします。

スキーマ検出とデータのクエリ

  1. [データベース]のドロップダウンで、CData を選択します。
  2. [スキーマ]で、[CData]を選択します。
  3. テーブルをJOIN エリアにドラッグします。複数のテーブルを選択することも可能です。
  4. Drag the table onto the join area.
  5. [今すぐ更新]か[自動更新]を選択します。[今すぐ更新]では、はじめの1000行のデータをプレビューで取得します(もしくは表示行を指定するボックスに取得する行数を指定可能 )。[自動更新]では、自動的にデータを取得してプレビューに表示します。
  6. [接続]メニューでは、[ライブ]もしくは[抽出]を選択します。常にリアルタイムデータを扱いたい場合には、[ライブ]を選択します。
  7. ワークシートのタブを開きます。CData Driver は、カラム情報やデータ型情報を自動的に検出するので、取得したAzure Data Lake Storage のデータのカラムはディメンションとメジャーに分けてリスト表示されます。
  8. Click the tab for your worksheet.
  9. デイメンションやメジャーを列・行のフィールドにドロップして、ビジュアライズを作成します。

CData JDBC Driver for ADLS をTabelau で使うことで、ノーコードでAzure Data Lake Storage のデータをビジュアライズできました。ぜひ、30日の無償評価版 をお試しください。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。