各製品の資料を入手。
詳細はこちら →Mac OS X 上のMS Excel でSpark のデータを連携利用
iODBC でCData ODBC Driver のDSN を作成し、Mac OS X 上のMicrosoft Excel でSpark に連携。
最終更新日:2022-01-15
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
Microsoft Excel は、データの入力、集計、グラフ表示、ピボットテーブル、マクロプログラミング言語など多様な機能により、Windows、Mac マシンを問わずビジネスユーザーに愛用されているアプリケーションです。 本記事では、iODBC でのSpark DSN の作成方法と、Mac OS X で起動するMicrosoft Excel からのSparkの連携利用について説明します。
CData ODBC ドライバとは?
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
- Spark をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
- 多様なアプリケーション、ツールにSpark のデータを連携
- ノーコードでの手軽な接続設定
- 標準 SQL での柔軟なデータ読み込み・書き込み
CData ODBC ドライバでは、1.データソースとしてSpark の接続を設定、2.Excel 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
Mac OS X へのCData ODBC ドライバのインストール
まずは、本記事右側のサイドバーからSparkSQL ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
CData ODBC Driver for SparkSQL は、iODBC Driver マネージャに事前設定されているので、簡単に多くのツールから簡単に使うことができます。
iODBC のDSN の作成
ODBC Driver for SparkSQL をインストールすると、iODBC Driver マネージャに登録されます。iODBC Administrator でDSN の接続プロパティを入力する必要があります。 ドライバーのインストールで自動的にシステムDSN が作成されます。システムDSN はすべてのユーザーからアクセスできます。一方、ユーザーDSN はそのユーザーからしかアクセスできません。 ただし、システムDSN の設定には権限が必要です。
- ターミナルを開き、次のコマンドを入力して正しい権限でAdministrator を開きます: sudo /Applications/iODBC/iODBC\ Administrator.app/Contents/MacOS/iODBC\ Administrator
- System タブでCData SparkSQL データソースを開きます。
- Add ボタンをクリックし、key-value ペアの形で接続プロパティを入力します。
SparkSQL への接続
SparkSQL への接続を確立するには以下を指定します。
- Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
- Port:SparkSQL インスタンスへの接続用のポートに設定。
- TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
- AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
Databricks への接続
Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。
- Server:Databricks クラスターのサーバーのホスト名に設定。
- Port:443
- TransportMode:HTTP
- HTTPPath:Databricks クラスターのHTTP パスに設定。
- UseSSL:True
- AuthScheme:PLAIN
- User:'token' に設定。
- Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。
OAuth での認証の場合、OAuth フローが正しく実行されるためにDSN に追加でkey-value ペアを入力します:
Keyword | Value | |
---|---|---|
Other | CheckPromptMode=False |
Microsoft Excel からSpark のデータにアクセス
上のステップで設定されたDSN を使って、Microsoft Excel からSpark のデータにアクセスができます。
- Microsoft Excel を開き、スプレッドシートを開きます。
- データリボンの[データベース]から[新しいクエリ]を選択します。
- 上のステップで設定したユーザーもしくはシステムDSN を選択して、OK を押します。
- Microsoft Query ウィザードでクエリを作成します:
- [Return Data]をクリックして、クエリを実行して、Excel にデータを取得します。

おわりに
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。