SAS JMP でのCData ODBC Driver for Databricks の使用

CData ODBC ドライバを使用して、Databricks をSAS JMP で使用可能な統計分析ツールに統合できます。この記事では、Graph Builder とQuery Builder でDatabricks を表示する方法について説明します。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-06-10

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

また、CData ODBC Driver for Databricks を使用して、リアルタイムデータをSAS JMP の統計分析に統合できます。ドライバーは、クエリを直接Databricks API にプロキシし、分析がデータへの変更を反映していることを確認します。CData ODBC Driver は、レポートをデザインする際バックグラウンドでJMP によって使用される、標準SQL をサポートします。

Databricks API は、双方向アクセスをサポートしています。この記事では、Databricks をレポートにアクセスし、データのビジュアライゼーションを作成する方法を説明します。また、SQL を使用してJMP Query Builder からDatabricks のデータをクエリおよび操作する方法も説明します。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Databricks をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにDatabricks のデータを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてDatabricks の接続を設定、2.SAP JMP 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとDatabricks への接続設定

まずは、本記事右側のサイドバーからDatabricks ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

未指定の場合は、初めにODBC DSN(data source name)で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。

Databricks 接続プロパティの取得・設定方法

Databricks クラスターに接続するには、以下のプロパティを設定します。

  • Database:Databricks データベース名。
  • Server:Databricks クラスターのサーバーのホスト名
  • HTTPPath:Databricks クラスターのHTTP パス。
  • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

Databricks への認証

CData は、次の認証スキームをサポートしています。

  • Basic
  • 個人用アクセストークン
  • Azure Active Directory(AD)
  • Azure サービスプリンシパル
  • OAuthU2M
  • OAuthM2M

Basic

Basic 認証には、ユーザー名とパスワードが必要です。以下を設定します。

  • AuthSchemeBasic
  • User:ユーザーネーム。これはデフォルト値("Token")をオーバーライドします。
  • Token:パスワード。

その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

DSN を構成する際に、Max Rows プロパティを定めることも可能です。これによって返される行数を制限するため、ビジュアライゼーション・レポートのデザイン時のパフォーマンスを向上させるのに役立ちます。

Query Builder でDatabricks のデータをインポート

Databricks DSN を作成したら、SQL を使用してDatabricks API の機能を呼び出すことができます。以下のステップに従ってQuery Builder でサポートされているクエリを実行します。

  1. SAS JMP で[File]->[Database]->[Query Builder]とクリックします。[Select Database Connection]ダイアログが表示されます。
  2. [New Connection]をクリックします。
  3. [Machine Data Source]タブで[DSN]を選択します。次のステップでは、[Select Tables for Query]ダイアログが表示されます。
  4. [Available Tables]セクションでテーブルを選択し、[Primary]をクリックします。
  5. [Available Columns]を[Included Columns]タブにドラッグすると、基になるSQL クエリが更新されます。 The generated query in the Query Builder.(Salesforce is shown.)
  6. データを表示するには[Run Query]をクリックします。 The results of a query in the Query Builder.(Salesforce is shown.)
  7. 結果を現在のデータで更新するには、[Update from Database]を右クリックし、[Run Script]をクリックします。

Databricks のデータの操作

以下のようなJSL スクリプトから、データ操作クエリを実行できます。スクリプトを実行するには、ツールバーの[New Script]をクリックします。接続するには、DSN を指定します。これで、標準SQL 構文を使用できるようになります。

Open Database( "DSN=CData Databricks Source;", "INSERT INTO Customers (Country) VALUES ('US');");

Databricks のデータをビジュアライズ

インポート後、Graph Builder を使用して視覚的にグラフを作成できます。Graph Builder を開くには、ツールバーの[Graph Builder]ボタンをクリックします。

  1. ディメンションカラムをx 軸にドラッグします。例:City
  2. メジャーカラムをy 軸にドラッグします。例:CompanyName
  3. チャートタイプを選択します。例:棒グラフ Configuration of a basic chart.(Salesforce is shown.)

Databricks からSAP JMP へのデータ連携には、ぜひCData ODBC ドライバをご利用ください

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。