各製品の資料を入手。
詳細はこちら →Informatica PowerCenter でSnowflake のデータを抽出、変換、ロードする
Informatica PowerCenter でSnowflake のデータのシンプルなWorkflow を作成。
最終更新日:2022-04-03
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
Informatica は、データ転送用の強力で洗練された手段を提供します。CData ODBC Driver for Snowflake を利用することで、Informatica の強力なデータ転送と操作機能でシームレスに統合された、業界が認めた標準ドライバーにアクセスできるようになります。このチュートリアルでは、Informatica PowerCenter でシンプルなWorkflow を作成してSnowflake のデータを抽出し、フラットファイルにロードする方法について説明します。
CData ODBC ドライバとは?
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
- Snowflake をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
- 多様なアプリケーション、ツールにSnowflake のデータを連携
- ノーコードでの手軽な接続設定
- 標準 SQL での柔軟なデータ読み込み・書き込み
CData ODBC ドライバでは、1.データソースとしてSnowflake の接続を設定、2.Informatica PowerCenter 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
CData ODBC ドライバのインストールとSnowflake への接続設定
まずは、本記事右側のサイドバーからSnowflake ODBC Driver の無償トライアルをPowerCenter サーバーとクライアントマシーンにドライバーをインストールします。30日間無償で、製品版の全機能が使用できます。
どちらにおいても、データソースのODBC DSN で接続プロパティを指定します。これはドライバーインストール時の最後の手順にあたります。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。
Snowflake データベースに接続するには、認証に加えて次のプロパティを設定します。
- Url:自身のSnowflake URL、例えばhttps://orgname-myaccount.snowflakecomputing.com。
- Legacy URL を使用する場合:https://myaccount.region.snowflakecomputing.com
- 自身のURL を見つけるには:
- Snowflake UI の左下にある自身の名前をクリックします。
- Account ID にカーソルを合わせます。
- Copy Account URL アイコンをクリックして、アカウントURL をコピーします。
- Database(オプション):によって公開されるテーブルとビューを、特定のSnowflake データベースのものに制限します。
- Schema(オプション):本製品によって公開されるテーブルとビューを、特定のSnowflake データベーススキーマのものに制限します。
Snowflake への認証
本製品は、Snowflake ユーザー認証、フェデレーション認証、およびSSL クライアント認証をサポートしています。認証するには、User とPassword を設定し、AuthScheme プロパティで認証メソッドを選択します。
キーペア
ユーザーアカウントに定義されたプライベートキーを使用してセキュアなトークンを作成することにより、キーペア認証を使用して認証できます。この方法で接続するには、AuthScheme をPRIVATEKEY に設定し、次の値を設定します。
- User:認証に使用するユーザーアカウント。
- PrivateKey:プライベートキーを含む.pem ファイルへのパスなど、ユーザーに使用されるプライベートキー。
- PrivateKeyType:プライベートキーを含むキーストアの種類(PEMKEY_FILE、PFXFILE など)。
- PrivateKeyPassword:指定されたプライベートキーのパスワード。
その他の認証方法は、ヘルプドキュメントの「Snowflake への認証」セクションを参照してください。
PowerCenter でETL ワークフローを作成する
次のステップに従ってPowerCenter でワークフローを作成し、Snowflake のデータをプルしてフラットファイルにプッシュします。
ODBC ドライバーを使用してソースを作成する
- %INFA_HOME%\clients\PowerCenterClient\client\bin にあるpowrmart.ini ファイルで、次の行をODBCDLL セクションに追加します。
CData=PMODBC.DLL
- PowerCenter Workflow Manager で新しいODBC リレーショナル接続を追加し、ユーザー名とパスワードのプロパティをODBC Driver がインストールされているマシンのユーザーに設定して、接続文字列をドライバーのSystem DSN(CData Snowflake Sys)に設定します。
- PowerCenter Designer でリポジトリに接続し、フォルダを開きます。
- 「Source Analyzer」を選択してソースメニューをクリックし、「Import from Database」を選択します。
- ODBC データソースのドロップダウンメニューで、以前構成したDSN(CData Snowflake Sys)を選択します。
- 「connect」をクリックし、含めるテーブルとビューを選択します。
- 「OK」をクリックします。
ソースを使用してフラットファイルターゲットを作成する
- 「Targets Analyzer」を選択し、以前に作成したソースをワークスペースにドラッグアンドドロップします。既存のソースを使用することで、カラムがターゲットにコピーされます。
- 新しいターゲットを右クリックし、「edit」をクリックしてデータベースタイプをフラットファイルに変更します。
Snowflake のデータとフラットファイル間のマッピングを作成する
- 「Mapping Designer」をクリックします。
- ソースとターゲットをワークスペースにドラッグします。(プロンプトが表示されたら、新しいマッピングに名前を付けます。)
- ワークスペースで右クリックし、「Autolink by Name」を選択します。
- カラムをソース修飾子からターゲット定義にドラッグします。
- フォルダをセーブ(Ctrl + S)します。
マッピングを使用してワークフローを作成する
ソース、ターゲット、マッピングを作成して保存したら、ワークフローを作成することができるようになります。
- マッピングを右クリックして「generate workflow」を選択し、「Workflow Generation」ウィザードを開きます。
- 再利用不可のセッションでワークフローを作成します。
- (以前作成した関連する接続への)接続オブジェクトが適切に構成されていることを確認してプレフィックスを設定します。
- 必要に応じて接続を設定します。
- ワークフローを確認して「Finish」をクリックします。
ワークフローを作成したら、PowerCenter Workflow Manager を開いてワークフローにアクセスして開始し、Snowflake のデータをフラットファイルに素早く転送できます。ODBC Driver for Snowflake を使用して、ソースとターゲットをPowerCenter から設定することで、Informatica PowerCenter でSnowflake のデータをお好みのエレガントで強力な機能に統合することができます。
Snowflake からInformatica PowerCenter へのデータ連携には、ぜひCData ODBC ドライバをご利用ください
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。