各製品の資料を入手。
詳細はこちら →Birst でDatabricks データ のビジュアライゼーションを構築
CData JDBC Driver とBirst クラウドエージェントを使用して、Birst でDatabricks のデータ のリアルタイムの視覚化を構築します。
最終更新日:2021-10-31
この記事で実現できるDatabricks 連携のシナリオ
こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。
Birst は、組織が複雑なプロセスを迅速に理解し、最適化することを支援するクラウドビジネスインテリジェンス(BI)ツールおよび分析プラットフォームです。CData JDBC Driver for Databricks と組み合わせると、Birst Cloud Agent を経由してリアルタイムDatabricks のデータ に接続し、ビジュアライズを構築できます。ここでは、Cloud Agent を使用してDatabricks に連携し、Birst で動的レポートを作成する方法を段階的に説明します。
強力なデータ処理機能により、CData JDBC Driver はBirst のDatabricks のデータ 操作に高いパフォーマンスを提供します。Birst からDatabricks への複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作を直接Databricks にプッシュし、組込みSQL エンジンを利用してクライアント側でサポートしない操作を処理します。組み込みの動的メタデータクエリにより、JDBC ドライバーはネイティブのBirst データ型を使用してDatabricks のデータ を視覚化および分析することを可能にします。
Birst でDatabricks データ へのJDBC 接続を設定
Birst プロジェクトを作成する前に、JDBC Driver を操作するためのBirst Cloud Agent をインストールする必要があります。また、JDBC ドライバーのJAR ファイル(および存在する場合はLIC ファイル)をCloud Agent のインストール場所の/drivers/ ディレクトリにコピーします。
ドライバーとCloud Agent のインストールが完了したら、開始できます。
- Birst で新しいプロジェクトを作成します。
- 接続に名前を付けます。(e.g. CDataDatabricks)
- Live Access を選択します。
- エージェントを選択します。
- Database Type をOther に設定します。
- SQL タイプをMSSQL に設定します。
- 接続文字列を設定します。
Databricks 接続プロパティの取得・設定方法
Databricks クラスターに接続するには、以下のプロパティを設定します。
- Database:Databricks データベース名。
- Server:Databricks クラスターのサーバーのホスト名。
- HTTPPath:Databricks クラスターのHTTP パス。
- Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks への認証
CData は、次の認証スキームをサポートしています。
- Basic
- 個人用アクセストークン
- Azure Active Directory(AD)
- Azure サービスプリンシパル
- OAuthU2M
- OAuthM2M
Basic
Basic 認証には、ユーザー名とパスワードが必要です。以下を設定します。
- AuthScheme:Basic。
- User:ユーザーネーム。これはデフォルト値("Token")をオーバーライドします。
- Token:パスワード。
その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。
ビルトイン接続文字列デザイナー
JDBC URL の構成については、Databricks JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。
java -jar cdata.jdbc.databricks.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
JDBC URL を構成する際、Max Rows 接続プロパティを設定することもできます。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。
以下はDatabricks の一般的なJDBC 接続文字列です。
jdbc:databricks:Server=127.0.0.1;Port=443;TransportMode=HTTP;HTTPPath=MyHTTPPath;UseSSL=True;User=MyUser;Password=MyPassword;
- Driver Name cdata.jdbc.databricks.DatabricksDriver を設定し、[Save]をクリックします。


NOTE Databricks への認証は接続文字列に管理されるため、[Security Credentials]は空白でも問題ありません。
Databricks データ オブジェクトを設定
接続が構成されたら、データセットのスキーマを構成し、ビジュアライズするテーブル、ビュー、そしてカラムを選択することができるようになります。
- スキーマを選択します。 (e.g. Databricks)
- [Tables]や[Views]をクリックしてこれらのエンティティに接続し、[Apply]をクリックします。
- アクセスする[Tables]と[Columns]を選択し、[Done]をクリックします。

オブジェクトが構成されたら、Pronto Prepare and Relate ツールを用いて、データ準備の実行やデータのリレーションを検出できるようになります。
ビジュアライゼーションを構築
データを準備し、接続されたオブジェクト間のリレーションを定義することで、ビジュアライゼーションを構築することができるようになります。
- メニューから、Visualizer ツールを選択します。
- オブジェクトからMeasures & Categories を選択します。
- 選択したMeasure(s) に適切なビジュアライゼーションを選択し、構成します。


CData JDBC Driver for Databricks をCloud Agent やBirst とともに用いることにより、Databricks で簡単に堅牢なビジュアライゼーションとレポートを作成できます。30日の無償評価版をダウンロードし、Birst ビジュアライゼーションの構築を開始してください。