各製品の資料を入手。
詳細はこちら →Informatica PowerCenter でGoogle Data Catalog のデータを抽出、変換、ロードする
Informatica PowerCenter でGoogle Data Catalog のデータのシンプルなWorkflow を作成。
最終更新日:2022-04-03
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
Informatica は、データ転送用の強力で洗練された手段を提供します。CData ODBC Driver for GoogleDataCatalog を利用することで、Informatica の強力なデータ転送と操作機能でシームレスに統合された、業界が認めた標準ドライバーにアクセスできるようになります。このチュートリアルでは、Informatica PowerCenter でシンプルなWorkflow を作成してGoogle Data Catalog のデータを抽出し、フラットファイルにロードする方法について説明します。
CData ODBC ドライバとは?
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
- Google Data Catalog をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
- 多様なアプリケーション、ツールにGoogle Data Catalog のデータを連携
- ノーコードでの手軽な接続設定
- 標準 SQL での柔軟なデータ読み込み・書き込み
CData ODBC ドライバでは、1.データソースとしてGoogle Data Catalog の接続を設定、2.Informatica PowerCenter 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
CData ODBC ドライバのインストールとGoogle Data Catalog への接続設定
まずは、本記事右側のサイドバーからGoogleDataCatalog ODBC Driver の無償トライアルをPowerCenter サーバーとクライアントマシーンにドライバーをインストールします。30日間無償で、製品版の全機能が使用できます。
どちらにおいても、データソースのODBC DSN で接続プロパティを指定します。これはドライバーインストール時の最後の手順にあたります。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。
Google Data Catalog 接続プロパティの取得・設定方法
認証プロパティを追加する前に、次の接続プロパティを設定してください。
- OrganizationId:接続するGoogle Cloud Platform の組織リソースに関連付けられたID。これはGCP コンソールに移動して確認してください。 「プロジェクト」ドロップダウンメニューを開き、リストから組織へのリンクをクリックします。このページから組織ID を取得できます。
- ProjectId:接続するGCP のプロジェクトリソースに関連付けられたID。GCP コンソールのダッシュボードに移動し、「プロジェクトを選択」のメニューからお好みのプロジェクトを選択して確認してください。プロジェクトID は、「プロジェクト情報」項目に表示されます。
Google Data Catalog への認証
CData 製品は、認証にユーザーアカウント、サービスアカウント、およびGCP インスタンスアカウントの使用をサポートします。
OAuth の設定方法については、ヘルプドキュメントの「OAuth」セクションを参照してください。
PowerCenter でETL ワークフローを作成する
次のステップに従ってPowerCenter でワークフローを作成し、Google Data Catalog のデータをプルしてフラットファイルにプッシュします。
ODBC ドライバーを使用してソースを作成する
- %INFA_HOME%\clients\PowerCenterClient\client\bin にあるpowrmart.ini ファイルで、次の行をODBCDLL セクションに追加します。
CData=PMODBC.DLL
- PowerCenter Workflow Manager で新しいODBC リレーショナル接続を追加し、ユーザー名とパスワードのプロパティをODBC Driver がインストールされているマシンのユーザーに設定して、接続文字列をドライバーのSystem DSN(CData GoogleDataCatalog Sys)に設定します。
- PowerCenter Designer でリポジトリに接続し、フォルダを開きます。
- 「Source Analyzer」を選択してソースメニューをクリックし、「Import from Database」を選択します。
- ODBC データソースのドロップダウンメニューで、以前構成したDSN(CData GoogleDataCatalog Sys)を選択します。
- 「connect」をクリックし、含めるテーブルとビューを選択します。
- 「OK」をクリックします。
ソースを使用してフラットファイルターゲットを作成する
- 「Targets Analyzer」を選択し、以前に作成したソースをワークスペースにドラッグアンドドロップします。既存のソースを使用することで、カラムがターゲットにコピーされます。
- 新しいターゲットを右クリックし、「edit」をクリックしてデータベースタイプをフラットファイルに変更します。
Google Data Catalog のデータとフラットファイル間のマッピングを作成する
- 「Mapping Designer」をクリックします。
- ソースとターゲットをワークスペースにドラッグします。(プロンプトが表示されたら、新しいマッピングに名前を付けます。)
- ワークスペースで右クリックし、「Autolink by Name」を選択します。
- カラムをソース修飾子からターゲット定義にドラッグします。
- フォルダをセーブ(Ctrl + S)します。
マッピングを使用してワークフローを作成する
ソース、ターゲット、マッピングを作成して保存したら、ワークフローを作成することができるようになります。
- マッピングを右クリックして「generate workflow」を選択し、「Workflow Generation」ウィザードを開きます。
- 再利用不可のセッションでワークフローを作成します。
- (以前作成した関連する接続への)接続オブジェクトが適切に構成されていることを確認してプレフィックスを設定します。
- 必要に応じて接続を設定します。
- ワークフローを確認して「Finish」をクリックします。
ワークフローを作成したら、PowerCenter Workflow Manager を開いてワークフローにアクセスして開始し、Google Data Catalog のデータをフラットファイルに素早く転送できます。ODBC Driver for GoogleDataCatalog を使用して、ソースとターゲットをPowerCenter から設定することで、Informatica PowerCenter でGoogle Data Catalog のデータをお好みのエレガントで強力な機能に統合することができます。
Google Data Catalog からInformatica PowerCenter へのデータ連携には、ぜひCData ODBC ドライバをご利用ください
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。