Microsoft Power Query からDatabricks のデータに連携してExcel から利用

CData Databricks ODBC Driver とMicrosoft Power Query を使って、Databricks のデータをExcel にインポートする方法を紹介します。

古川えりか
コンテンツスペシャリスト

最終更新日:2023-06-14

この記事で実現できるDatabricks 連携のシナリオ

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

CData ODBC Driver for Databricks を使ってMicrosoft Power Query からDatabricks に接続すれば、お好みのDatabricks のデータを取得できます。この記事では、CData ODBC ドライバを使ってDatabricks をMicrosoft Power Query にインポートする方法について詳しく説明します。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持った製品です。

  1. Databricks をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレデータソースに対応
  2. Excel やPower Query をはじめとする多様な帳票・BI・データ分析ツールにDatabricks のデータを連携
  3. ノーコードでの手軽な接続設定

CData ODBC ドライバでは、1.データソースとしてDatabricks の接続を設定、2.Power Query 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

Databricks への接続の設定

まずは、本記事右側のサイドバーからDatabricks ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

  1. ODBC ドライバーのインストール完了時にODBC DSN 設定画面が立ち上がります。または、Microsoft ODBC データソースアドミニストレーターを使ってDSN を作成および設定できます。

    Databricks 接続プロパティの取得・設定方法

    Databricks クラスターに接続するには、以下のプロパティを設定します。

    • Database:Databricks データベース名。
    • Server:Databricks クラスターのサーバーのホスト名
    • HTTPPath:Databricks クラスターのHTTP パス。
    • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
    Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    Databricks への認証

    CData は、次の認証スキームをサポートしています。

    • Basic
    • 個人用アクセストークン
    • Azure Active Directory(AD)
    • Azure サービスプリンシパル
    • OAuthU2M
    • OAuthM2M

    Basic

    Basic 認証には、ユーザー名とパスワードが必要です。以下を設定します。

    • AuthSchemeBasic
    • User:ユーザーネーム。これはデフォルト値("Token")をオーバーライドします。
    • Token:パスワード。

    その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

Microsoft Power Query でDatabricks のデータをインポート

ODBC 側の設定が完了したら、Excel からPower Query を起動して実際にデータを取得していきます。

  1. Excel のリボンから「データ」->「データの取得」-「Power Query の起動」をクリックします。
  2. Power Query エディター画面が開くので、「新しいクエリ」->「新しいソース」->「その他ソース」->「ODBC」をクリックします。
  3. 使用するデータソースを選択します。
  4. 詳細クエリで、カスタムデータをインポートするSELECT 文(SQL)を入力することもできます。例: SELECT * FROM Customers ODBC 接続文字列とSELECT 文。
  5. 必要に応じてクレデンシャル情報を入力し、「接続」をクリックします。ナビゲータが開くので、ツリー形式で表示されるテーブルから使用するテーブルを選択します。プレビューにデータが表示されます。OK を押します。データがクエリビューに表示されます。別のデータソースからクエリを結合、または「Power Query formulas」を使ってデータをリファインできます。ワークシートにクエリをロードするには、[閉じて読み込む]ボタンをクリックします。
  6. Power Query で取得したテーブル。

Databricks からPower Query へのデータ連携には、ぜひCData ODBC ドライバをご利用ください

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをPower Query からコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

日本のユーザー向けにCData ODBC ドライバは、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。