Tableau Cloud でDatabricks ビジュアライゼーションを作成

CData Connect Cloud を使用してDatabricks に接続し、Databricks のデータを使ってTableau Cloud でビジュアライゼーションを作成します。

加藤龍彦
デジタルマーケティング

最終更新日:2022-03-07

この記事で実現できるDatabricks 連携のシナリオ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

Tableau Cloud は、クラウドホスティングの分析プラットフォームです。CData Connect Cloud と組み合わせると、ビジュアライゼーションやダッシュボード用にDatabricks のデータにクラウドベースでアクセスできます。この記事では、Databricks に接続し、Tableau Cloud でDatabricks のデータからビジュアライゼーションを作成する方法を説明します。

CData Connect Cloud とは?

CData Connect Cloud は、以下のような特徴を持ったクラウド型のリアルタイムデータ連携製品です。

  • SaaS やクラウドデータベースを中心とする150種類以上のデータソース
  • BI、アナリティクス、ETL、ローコードツールなど30種類以上のツールやアプリケーションから利用可能
  • リアルタイムのデータ接続に対応。データの複製を作る必要はありません
  • ノーコードでシンプルな設定

詳しくは、こちらの製品資料をご確認ください。

Connect Cloud アカウントの取得

以下のステップを実行するには、CData Connect Cloud のアカウントが必要になります。こちらから製品の詳しい情報とアカウント作成、30日間無償トライアルのご利用を開始できますので、ぜひご利用ください。


Connect Cloud からDatabricks に接続する

CData Connect Cloud では、直感的なクリック操作ベースのインターフェースを使ってデータソースに接続できます。
  1. Connect Cloud にログインし、 Add Connection をクリックします。 コネクションを追加
  2. Add Connection パネルから「Databricks」を選択します。 データソースを選択
  3. 必要な認証プロパティを入力し、Databricks に接続します。

    Databricks 接続プロパティの取得・設定方法

    Databricks クラスターに接続するには、以下のプロパティを設定します。

    • Database:Databricks データベース名。
    • Server:Databricks クラスターのサーバーのホスト名
    • HTTPPath:Databricks クラスターのHTTP パス。
    • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
    Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    Databricks への認証

    CData は、次の認証スキームをサポートしています。

    • Basic
    • 個人用アクセストークン
    • Azure Active Directory(AD)
    • Azure サービスプリンシパル
    • OAuthU2M
    • OAuthM2M

    Basic

    Basic 認証には、ユーザー名とパスワードが必要です。以下を設定します。

    • AuthSchemeBasic
    • User:ユーザーネーム。これはデフォルト値("Token")をオーバーライドします。
    • Token:パスワード。

    その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

    接続の設定(Salesforce の表示)
  4. Create & Test をクリックします。
  5. Edit Databricks Connection ページのPermissions タブに移動し、ユーザーベースのアクセス許可を更新します。 権限を更新

パーソナルアクセストークンの追加

OAuth 認証をサポートしていないサービス、アプリケーション、プラットフォーム、またはフレームワークから接続する場合は、認証に使用するパーソナルアクセストークン(PAT)を作成できます。きめ細かなアクセス管理を行うために、サービスごとに個別のPAT を作成するのがベストプラクティスです。

  1. Connect Cloud アプリの右上にあるユーザー名をクリックし、User Profile をクリックします。
  2. User Profile ページでPersonal Access Token セクションにスクロールし、 Create PAT をクリックします。
  3. PAT の名前を入力して Create をクリックします。 Creating a new PAT
  4. パーソナルアクセストークンは作成時にしか表示されないため、必ずコピーして安全に保存してください。

コネクションが構成されたら、Tableau Cloud からDatabricks に接続できるようになります。

Tableau Cloud でDatabricks のデータをリアルタイムでビジュアライズ

以下のステップは、Connect Cloud の仮想Databricks のデータベースを使用してTableau Cloud で新しいデータソースを作成し、データから簡単なビジュアライゼーションを作成する方法の概要です。

  1. Tableau Cloud にログインしてアカウントを選択し、新しいワークブックを作成します。
  2. 新しいワークブックでデータウィザードからMicrosoft SQL Server Connector を選択し、Connect Cloud インスタンスの値を入力します。
    • Servertds.cdata.com,14333 に設定します。
    • Database を先ほど設定したDatabricks のコネクションの名称(例:Databricks1)に設定します。
    • Username をConnect Cloud のユーザー名に設定します。(user@mydomain.com)
    • Password を上記のユーザーのPAT に設定します。
    • Require SSL のチェックボックスにチェックを入れます。
    Tableau Cloud からConnect Cloud に接続
  3. 新しく作成したデータベースと、ビジュアライズするテーブルを選択します。(必要に応じてJOIN されたデーブルの関係を定義します)
  4. データベースとテーブルを選択
  5. 「Dimensions and Measures」を選択してビジュアライゼーションを構成します。
  6. Databricks のデータをTableau Cloud 内でビジュアライズ

クラウドアプリケーションからDatabricks のデータにリアルタイムアクセス

これで、Tableau Cloud ワークブックからDatabricks のデータにリアルタイムで直接クラウドベースの接続が可能です。さらに、データソースやワークブックを公開することなく、Tableau Desktop から新しいビジュアライゼーションを作成したり、ダッシュボードを作成したりすることができます。Tableau Cloud のようなクラウドアプリケーションで、100 を超えるSaaS、ビッグデータ、NoSQL ソースのデータにリアルタイムアクセスする方法の詳細については、Connect Cloud ページを参照してください。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。