各製品の資料を入手。
詳細はこちら →PolyBase で外部データソースとしてPostgreSQL を連携利用
CData ODBC ドライバとSQL Server 2019 のPolyBase を使って、リアルタイムPostgreSQL に外部データソースとしてアクセス。
最終更新日:2022-04-21
この記事で実現できるPostgreSQL 連携のシナリオ
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
SQL Server のPolyBase は、データベーステーブルをクエリするTransact-SQL 構文を使って、外部データにクエリする仕組みです。 CData ODBC Driver for PostgreSQL を組み合わせて使うことで、SQL Server データと同じようにPostgreSQL へのアクセスが可能です。 本記事では、外部データソースと外部テーブルの作成から、T-SQL クエリを使ってリアルタイムPostgreSQL のデータへ接続を認可するところまで説明します。
CData ODBC ドライバーは、ドライバーに組み込まれた最適化されたデータ処理により、PolyBase でリアルタイムPostgreSQL のデータを送受信するための圧倒的なパフォーマンスを提供します。SQL Server からPostgreSQL に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をPostgreSQL に直接プッシュダウンし、組み込みSQL エンジンを利用して、サポートされていない操作(一般的にはSQL 関数とJOIN 操作) をクライアント側で処理します。また、PolyBase を使用することで、単一のクエリを使用して分散ソースからデータをプルし、SQL Server データをPostgreSQL と結合することもできます。
CData ODBC ドライバとは?
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
- PostgreSQL をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
- 多様なアプリケーション、ツールにPostgreSQL のデータを連携
- ノーコードでの手軽な接続設定
- 標準 SQL での柔軟なデータ読み込み・書き込み
CData ODBC ドライバでは、1.データソースとしてPostgreSQL の接続を設定、2.PolyBase 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
CData ODBC ドライバのインストールとPostgreSQL への接続設定
まずは、本記事右側のサイドバーからPostgreSQL ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
未指定の場合は、初めにODBC DSN(data source name)で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。PolyBase を使用してSQL Server に外部データソースを作成するには、System DSN を構成します。(CData PostgreSQL Sys は自動的に作成されます。)
PostgreSQL への接続には、Server、Port(デフォルトは5432)、Database、およびUser、Password のプロパティを設定します。Database プロパティが設定されない場合には、User のデフォルトデータベースに接続します。
パスワード方式によるSSH 接続
パスワード方式によるSSH接続時に必要なプロパティ一覧を以下に示します。
- User: PostgreSQL のユーザ
- Password: PostgreSQL のパスワード
- Database: PostgreSQL の接続先データベース
- Server: PostgreSQL のサーバー
- Port: PostgreSQL のポート
- UserSSH: "true"
- SSHAuthMode: "Password"
- SSHPort: SSH のポート
- SSHServer: SSH サーバー
- SSHUser: SSH ユーザー
- SSHPassword: SSH パスワード
接続文字列形式では以下のようになります。
User=admin;Password=adminpassword;Database=test;Server=postgresql-server;Port=5432;UseSSH=true;SSHPort=22;SSHServer=ssh-server;SSHUser=root;SSHPassword=sshpasswd;
公開鍵認証方式によるSSH 接続
公開鍵認証によるSSH接続時に必要なプロパティ一覧を以下に示します。
- User: PostgreSQL のユーザ
- Password: PostgreSQL のパスワード
- Database: PostgreSQL の接続先データベース
- Server: PostgreSQL のサーバー
- Port: PostgreSQL のポート
- UserSSH: "true"
- SSHAuthMode: "Public_Key"
- SSHClientCertType: キーストアの種類
- SSHPort: SSH のポート
- SSHServer: SSH サーバー
- SSHUser: SSH ユーザー
- SSHClientCert: 秘密鍵ファイルのパス
接続文字列形式では以下のようになります。
User=admin;Password=adminpassword;Database=test;Server=PostgreSQL-server;Port=5432;UseSSH=true;SSHClientCertType=PEMKEY_FILE;SSHPort=22;SSHServer=ssh-server;SSHUser=root;SSHClientCert=C:\Keys\key.pem;
[接続のテスト]をクリックして、DSN がPostgreSQL に正しく接続できているかを確認します。[テーブル]タブに移動し、PostgreSQL のテーブル定義を確認します。
PostgreSQL のデータの外部データソースを作成
接続を構成したのち、外部データソースのマスター暗号化キーと資格情報データベースを作成する必要があります。
マスター暗号化キーの作成
以下のSQL コマンドを実行して新しいマスターキー[ENCRYPTION]を作成し、外部データソースの資格情報を暗号化します。
CREATE MASTER KEY ENCRYPTION BY PASSWORD = 'password';
資格情報データベースの作成
以下のSQL コマンドを実行してPostgreSQL に接続されている外部データソースの資格情報を作成します。
Note:IDENTITY とSECRET はPostgreSQL のUser プロパティとPassword プロパティに対応しています。
CREATE DATABASE SCOPED CREDENTIAL postgresql_creds WITH IDENTITY = 'username', SECRET = 'password';
PostgreSQL の外部データソースを作成
以下のSQL コマンドを実行し、以前作成したDSN と資格情報を使用して、PolyBase でPostgreSQL の外部データソースを作成します。
NoteSERVERNAME とPORT は、PostgreSQL のServer とPort の接続プロパティに対応しています。PUSHDOWN は、デフォルトでON に設定されているため、ODBC Driver は、サーバー側の処理を利用して複雑なクエリを実行できます。
CREATE EXTERNAL DATA SOURCE cdata_postgresql_source WITH ( LOCATION = 'odbc://SERVERNAME[:PORT]', CONNECTION_OPTIONS = 'DSN=CData PostgreSQL Sys', -- PUSHDOWN = ON | OFF, CREDENTIAL = postgresql_creds );
PostgreSQL の外部テーブルを作成
外部データソースを作成したら、CREATE EXTERNAL TABLE ステートメントを使用してSQL Server インスタンスからPostgreSQL にリンクします。テーブルカラムの定義は、CData ODBC Driver for PostgreSQL によって公開されているものと一致しなければなりません。DSN Configuration Wizard の[テーブル]タブを参照し、テーブルの定義を確認できます。

CREATE TABLE ステートメントのサンプル
以下は、PostgreSQL Orders に基づいて外部テーブルを作成するステートメントの一例です。
CREATE EXTERNAL TABLE Orders( ShipName [nvarchar](255) NULL, ShipCity [nvarchar](255) NULL, ... ) WITH ( LOCATION='Orders', DATA_SOURCE=cdata_postgresql_source );
SQL Server インスタンスでPostgreSQL の外部テーブルを作成すると、ローカルデータとリモートデータを同時にクエリできるようになります。CData ODBC Driver に組み込まれているクエリ処理により、可能な限り多くのクエリ処理がPostgreSQL にプッシュされることで、ローカルのリソースと計算リソースが解放されます。ODBC Driver for PostgreSQL の30日間無料トライアルをダウンロードし、SQL Server データでリアルタイムPostgreSQL のデータを使い始めましょう。
PostgreSQL からPolyBase へのデータ連携には、ぜひCData ODBC ドライバをご利用ください
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。