Databricks のデータを(CData Connect 経由の)Tableau Desktop でビジュアライズ

CData Connect(またはConnect Server)でDatabricks のデータのMySQL データべースを作成し、Tableau Desktop でリアルタイムDatabricks のデータからビジュアライゼーションを構築します。

加藤龍彦
デジタルマーケティング

最終更新日:2021-02-05

この記事で実現できるDatabricks 連携のシナリオ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

Tableau は企業がデータを使用して問題を解決する方法を変革するビジュアル分析プラットフォームです。CData Connect (またはConnect Server)と組み合わせることで、Tableau 内のリアルタイムDatabricks のデータに簡単にアクセスできます。この記事では、Databricks の仮想MySQL データベースを作成し、Tableau でその仮想データベースに接続して、簡単なチャートを作成する方法を説明します。

Databricks のデータの仮想MySQL データベース

CData Connect は、シンプルなポイントアンドクリックインターフェースを使用してデータソースに接続し、API を生成します。

  1. Connect にログインし、「CONNECTIONS」をクリックします。 データベースを追加
  2. [Available Data Sources]から[Databricks]を選択します。
  3. Databricks に接続するために必要な認証プロパティを入力します。

    Databricks 接続プロパティの取得・設定方法

    Databricks クラスターに接続するには、以下のプロパティを設定します。

    • Database:Databricks データベース名。
    • Server:Databricks クラスターのサーバーのホスト名
    • HTTPPath:Databricks クラスターのHTTP パス。
    • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
    Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    Databricks への認証

    CData は、次の認証スキームをサポートしています。

    • Basic
    • 個人用アクセストークン
    • Azure Active Directory(AD)
    • Azure サービスプリンシパル
    • OAuthU2M
    • OAuthM2M

    Basic

    Basic 認証には、ユーザー名とパスワードが必要です。以下を設定します。

    • AuthSchemeBasic
    • User:ユーザーネーム。これはデフォルト値("Token")をオーバーライドします。
    • Token:パスワード。

    その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

    Configuring a connection (Salesforce is shown).
  4. Test Database]をクリックします。
  5. [Permission]->[ Add]とクリックし、適切な権限を持つ新しいユーザー(または既存のユーザー) を追加します。

仮想データベースが作成されたら、Tableau Desktop からDatabricks に接続できるようになります。

Tableau Desktop でリアルタイムDatabricks のデータをビジュアライズ

以下のステップでは、CData Connect で仮想Databricks のデータベースに接続し、データから簡単なビジュアライゼーションを構築する方法の概要を説明します。

  1. Tableau を開き、[Connect]->[To a Server]と進んだ先の[MySQL]をクリックします。
  2. 接続ウィザードで、CData Connect インスタンスの値を入力し、[Sign In]をクリックします。
    • Server:Connect インスタンスのアドレス
    • Port:Connect インスタンス用のMySQL エンドポイントのポート(デフォルト:8006
    • Database:Databricks のデータ用に構成した仮想データベース
    • Username & Password:CData Connect ユーザーの資格情報
    Connect to CData Connect from Tableau Desktop
  3. 新しく作成したデータベースと、ビジュアライズするテーブルを選択します。(必要に応じて結合されたテーブルの関係を定義します。)
  4. Choosing a Database and Tables (a connection to CSV documents is shown)
  5. [Dimensions and Measures]を選択して、ビジュアライゼーションを構成します。
  6. Visualizing Databricks データ in Tableau Desktop

オンプレミスのアプリケーションからDatabricks のデータへのSQL アクセス

この時点で、Tableau Desktop ワークブックからリアルタイムDatabricks への、直接接続が有効になります。新しいビジュアライゼーションの作成やダッシュボードの構築などを行うことができます。Tableau などのデスクトップアプリケーションから、250 以上のSaaS、Big Data、NoSQL ソース(Databricks を含む)のデータにSQL でアクセスする方法については、CData Connect ページを参照するか、無料トライアルをダウンロードしてください。

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。