各製品の資料を入手。
詳細はこちら →Azure Data Catalog のデータ のPostgreSQL インターフェースを作成
Azure Data Catalog JDBC Driver のリモート機能を使用し、データアクセス用のPostgreSQL エントリポイントを作成します。
最終更新日:2022-12-02
この記事で実現できるAzure Data Catalog 連携のシナリオ
こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。
PostgreSQL には多くの対応クライアントがあります。標準のドライバーからBI、アナリティクスツールまで、PostgreSQL はデータ接続の人気のインターフェースです。JDBC ドライバーを使用することで、簡単に任意の標準クライアントから接続できるPostgreSQL エントリポイントを作成できます。
Azure Data Catalog にPostgreSQL データベースとしてアクセスするには、CData JDBC Driver for AzureDataCatalog とJDBC foreign data wrapper (FDW) を使用します。この記事ではFDW をコンパイルしてインストールし、PostgreSQL サーバーからAzure Data Catalog にクエリを実行します。
JDBC データソースとしてAzure Data Catalog のデータに接続する
JDBC データソースとしてAzure Data Catalog に接続するには、以下が必要です。
- Driver のJAR パス:JAR ファイルは、インストールディレクトリのlib サブフォルダにあります。
Driver クラス
cdata.jdbc.azuredatacatalog.AzureDataCatalogDriver
- JDBC URL:
URL は、"jdbc:azuredatacatalog:" で始まり、セミコロンで区切られた名前と値の組み合わせで任意の接続プロパティを含めることができます。
Azure Data Catalog 接続プロパティの取得・設定方法
OAuth 認証で接続
Azure Data Catalog の認証にはOAuth を使用します。CData 製品では組込みOAuth が利用できるので、接続プロパティを設定することなく接続を試行するだけで、ブラウザ経由でAAS に認証できます。詳しい設定方法については、ヘルプドキュメントの「Azure Data Catalog への認証」セクションを参照してください。
設定は任意ですが、CatalogName プロパティを設定することでAzure Data Catalog から返されるカタログデータを明示的に指定できます。
CatalogName:Azure Data Catalog に紐づいているカタログ名に設定。空のままにすると、デフォルトのカタログが使用されます。カタログ名は、「Azure Portal」->「データカタログ」->「カタログ名」から取得できます。
ビルトイン接続文字列デザイナ
JDBC URL の構成については、Azure Data Catalog JDBC Driver に組み込まれている接続文字列デザイナを使用できます。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。
java -jar cdata.jdbc.azuredatacatalog.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
以下は一般的なJDBC URL です。
jdbc:azuredatacatalog:InitiateOAuth=GETANDREFRESH
JDBC FDW を構築する
FDW は、PostgreSQL を再コンパイルせずに、PostgreSQL の拡張機能としてインストールできます。例としてjdbc2_fdw 拡張子を使用します。
- ご使用のバージョンのJRE 共有オブジェクトから、/usr/lib/libjvm.so にシンボリックリンクを追加します。コマンド例:
ln -s /usr/lib/jvm/java-6-openjdk/jre/lib/amd64/server/libjvm.so /usr/lib/libjvm.so
- ビルドするには、以下のコマンドを実行してください。
make install USE_PGXS=1
Azure Data Catalog のデータをPostgreSQL データベースとしてクエリする
拡張機能をインストールした後、以下のステップに従ってAzure Data Catalog へのクエリの実行を開始します。
- データベースにログイン
-
データベースの拡張機能をロード
CREATE EXTENSION jdbc2_fdw;
-
Azure Data Catalog のオブジェクトを作成
CREATE SERVER AzureDataCatalog FOREIGN DATA WRAPPER jdbc2_fdw OPTIONS ( drivername 'cdata.jdbc.azuredatacatalog.AzureDataCatalogDriver', url 'jdbc:azuredatacatalog:InitiateOAuth=GETANDREFRESH', querytimeout '15', jarfile '/home/MyUser/CData/CData\ JDBC\ Driver\ for\ Salesforce MyDriverEdition/lib/cdata.jdbc.azuredatacatalog.jar');
-
PostgreSQL デーモンに認識されているユーザーのユーザー名とパスワードのユーザーマッピングを作成
CREATE USER MAPPING for postgres SERVER AzureDataCatalog OPTIONS ( username 'admin', password 'test');
-
ローカルデータベースに外部テーブルを作成
postgres=# CREATE FOREIGN TABLE tables ( tables_id text, tables_DslAddressDatabase text, tables_Type numeric) SERVER AzureDataCatalog OPTIONS ( table_name 'tables');
postgres=# SELECT * FROM tables;
おわりに
このようにCData JDBC Driver for AzureDataCatalog を使って簡単にAzure Data Catalog のデータを取得して検索対象にすることができました。ぜひ、30日の無償評価版 をお試しください。