Excel からMicrosoft Query を使ってDatabricks に接続する方法

この記事では、CData ODBC ドライバを使って、Microsoft Query でExcel にデータをインポートします。Microsoft Query でパラメータを使う方法も説明します。

古川えりか
コンテンツスペシャリスト

最終更新日:2023-09-07

この記事で実現できるDatabricks 連携のシナリオ

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

Microsoft Query を使うことで、Excel からデータベースやファイル、外部データソースにアクセスしてデータをインポート、更新できます。CData ODBC Driver for Databricks はMicrosoft Query の連携先を拡張して、270種類以上のCRM、ERP、MA、会計ツールなどのデータソースへのアクセスを実現します。 この記事では、Microsoft Query を使ってDatabricks のデータをスプレッドシートにインポートする方法をご紹介します。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持った製品です。

  1. Databricks をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレデータソースに対応
  2. Excel やMicrosoft Query をはじめとする多様な帳票・BI ツールにDatabricks のデータを連携
  3. ノーコードでの手軽な接続設定
  4. 標準SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてDatabricks の接続を設定、2.Microsoft Query でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

Databricks への接続を設定

まずは、本記事右側のサイドバーからDatabricks ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

ODBC ドライバーのインストール完了時にODBC DSN 設定画面が立ち上がります。または、Microsoft ODBC データソースアドミニストレーターを使ってDSN を作成および設定できます。

Databricks 接続プロパティの取得・設定方法

Databricks クラスターに接続するには、以下のプロパティを設定します。

  • Database:Databricks データベース名。
  • Server:Databricks クラスターのサーバーのホスト名
  • HTTPPath:Databricks クラスターのHTTP パス。
  • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

Databricks への認証

CData は、次の認証スキームをサポートしています。

  • Basic
  • 個人用アクセストークン
  • Azure Active Directory(AD)
  • Azure サービスプリンシパル
  • OAuthU2M
  • OAuthM2M

Basic

Basic 認証には、ユーザー名とパスワードが必要です。以下を設定します。

  • AuthSchemeBasic
  • User:ユーザーネーム。これはデフォルト値("Token")をオーバーライドします。
  • Token:パスワード。

その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

Microsoft ODBC データソースアドミニストレーターで必要なプロパティを設定する方法の詳細は、ヘルプドキュメントの「はじめに」を参照してください。

  • Excel で[データ]タブを開き[その他のデータソースから]->[Microsoft Query から]を選びます。
  • Open Microsoft Query from the Data tab.
  • マシンにインストールされているMicrosoft Office のバージョンに合わせて、32 bit CData Databricks Source または64 bit CData Databricks Source x64 DSN を選びます。Query Wizard を使うオプションを選択し、クエリを作成/編集します。
  • The list of available ODBC DSNs in the Choose Data Source dialog.
  • Query Wizard で、スプレッドシートにインポートしたいテーブルのノードを展開します。インポートしたいカラムを選択し、矢印をクリックしてクエリに追加します。あるいはテーブル名を選択して、テーブルにあるすべてのカラムを追加します。
  • Available tables and columns in the Choose Columns step of the Query Wizard. (Salesforce is shown.)
  • [Filter Data]ページではクライテリアを指定できます。例えば、日付の範囲を設定して結果を絞れます。
  • The Filter Data step of the Query Wizard. (Salesforce is shown.)
  • クエリでパラメータを使いたい場合は、Microsoft Query でクエリを編集するオプションを選択します。
  • クエリにパラメータを設定するには、SQL を直接修正する必要があります。その場合は、[Query Editor]の[SQL]ボタンをクリックします。フィルタクライテリアを事前に設定している場合は、クエリ内にWHERE 句が存在します。
  • パラメータを使うには、WHERE 句のフィールド値にワイルドカード文字として "?" を使います。例えばCustomers をインポートしている場合は、"Country=?" を設定できます。
  • SQL ステートメントの編集が終わったら[SQL]ダイアログを閉じます。パラメータ値を入力するように促されますが、次のステップでセルを選択して値を入れることになるので、このダイアログではボックスは空のままにしておきます。
  • The generated SQL statement. (Salesforce is shown.)
  • Microsoft Query を閉じます。[Import Data]ダイアログが表示されます。結果をインポートするセルを入力します。 The Import Data dialog.
  • [Import Data]ダイアログを閉じます。パラメータ値を入力するように促されます。パラメータボックスの隣にあるボタンをクリックしてセルを選択します。値が変更されたらスプレッドシートを自動的にリフレッシュするオプションを選択します。 データはこれでExcel にインポートされました。セルB1の値を変更すると、データは指定した検索クライテリアによってフィルタされます。 The results of the query, with the search criteria applied. (Salesforce is shown.)

    おわりに

    このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをMicrosoft Query からコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

    日本のユーザー向けにCData ODBC ドライバは、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

  • 関連コンテンツ

    トライアル・お問い合わせ

    30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。