各製品の資料を入手。
詳細はこちら →Informatica PowerCenter でGoogle Sheets のデータを抽出、変換、ロードする
Informatica PowerCenter でGoogle Sheets のデータのシンプルなWorkflow を作成。
最終更新日:2022-04-03
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
Informatica は、データ転送用の強力で洗練された手段を提供します。CData ODBC Driver for GoogleSheets を利用することで、Informatica の強力なデータ転送と操作機能でシームレスに統合された、業界が認めた標準ドライバーにアクセスできるようになります。このチュートリアルでは、Informatica PowerCenter でシンプルなWorkflow を作成してGoogle Sheets のデータを抽出し、フラットファイルにロードする方法について説明します。
CData ODBC ドライバとは?
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
- Google Sheets をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
- 多様なアプリケーション、ツールにGoogle Sheets のデータを連携
- ノーコードでの手軽な接続設定
- 標準 SQL での柔軟なデータ読み込み・書き込み
CData ODBC ドライバでは、1.データソースとしてGoogle Sheets の接続を設定、2.Informatica PowerCenter 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
CData ODBC ドライバのインストールとGoogle Sheets への接続設定
まずは、本記事右側のサイドバーからGoogleSheets ODBC Driver の無償トライアルをPowerCenter サーバーとクライアントマシーンにドライバーをインストールします。30日間無償で、製品版の全機能が使用できます。
どちらにおいても、データソースのODBC DSN で接続プロパティを指定します。これはドライバーインストール時の最後の手順にあたります。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。
スプレッドシートに接続するには、Google への認証を行い、Spreadsheet 接続プロパティにスプレッドシートの名前またはフィードリンクを設定します。Google Drive のスプレッドシートの情報一覧を表示したい場合は、認証後にSpreadsheets ビューにクエリを実行します。
ClientLogin(ユーザー名 / パスワード認証)は、2012年4月20日より正式に非推奨となり、現在は利用できません。代わりに、OAuth 2.0 認証規格を使用してください。 個々のユーザーに代わってGoogle API にアクセスするには、埋め込みクレデンシャルを使用するか、独自のOAuth アプリを登録します。
OAuth は、Google Apps ドメインのユーザーに代わって、サービスアカウントを使って接続することもできます。サービスアカウントで認証するには、OAuth JWT 値を取得するためのアプリケーションを登録する必要があります。
Google アカウント、Google Apps アカウント、二段階認証を使用するアカウントなど、様々なアカウントタイプでGoogle スプレッドシートに接続する方法は、ヘルプドキュメントの「はじめに」を参照してください。
PowerCenter でETL ワークフローを作成する
次のステップに従ってPowerCenter でワークフローを作成し、Google Sheets のデータをプルしてフラットファイルにプッシュします。
ODBC ドライバーを使用してソースを作成する
- %INFA_HOME%\clients\PowerCenterClient\client\bin にあるpowrmart.ini ファイルで、次の行をODBCDLL セクションに追加します。
CData=PMODBC.DLL
- PowerCenter Workflow Manager で新しいODBC リレーショナル接続を追加し、ユーザー名とパスワードのプロパティをODBC Driver がインストールされているマシンのユーザーに設定して、接続文字列をドライバーのSystem DSN(CData GoogleSheets Sys)に設定します。
- PowerCenter Designer でリポジトリに接続し、フォルダを開きます。
- 「Source Analyzer」を選択してソースメニューをクリックし、「Import from Database」を選択します。
- ODBC データソースのドロップダウンメニューで、以前構成したDSN(CData GoogleSheets Sys)を選択します。
- 「connect」をクリックし、含めるテーブルとビューを選択します。
- 「OK」をクリックします。
ソースを使用してフラットファイルターゲットを作成する
- 「Targets Analyzer」を選択し、以前に作成したソースをワークスペースにドラッグアンドドロップします。既存のソースを使用することで、カラムがターゲットにコピーされます。
- 新しいターゲットを右クリックし、「edit」をクリックしてデータベースタイプをフラットファイルに変更します。
Google Sheets のデータとフラットファイル間のマッピングを作成する
- 「Mapping Designer」をクリックします。
- ソースとターゲットをワークスペースにドラッグします。(プロンプトが表示されたら、新しいマッピングに名前を付けます。)
- ワークスペースで右クリックし、「Autolink by Name」を選択します。
- カラムをソース修飾子からターゲット定義にドラッグします。
- フォルダをセーブ(Ctrl + S)します。
マッピングを使用してワークフローを作成する
ソース、ターゲット、マッピングを作成して保存したら、ワークフローを作成することができるようになります。
- マッピングを右クリックして「generate workflow」を選択し、「Workflow Generation」ウィザードを開きます。
- 再利用不可のセッションでワークフローを作成します。
- (以前作成した関連する接続への)接続オブジェクトが適切に構成されていることを確認してプレフィックスを設定します。
- 必要に応じて接続を設定します。
- ワークフローを確認して「Finish」をクリックします。
ワークフローを作成したら、PowerCenter Workflow Manager を開いてワークフローにアクセスして開始し、Google Sheets のデータをフラットファイルに素早く転送できます。ODBC Driver for GoogleSheets を使用して、ソースとターゲットをPowerCenter から設定することで、Informatica PowerCenter でGoogle Sheets のデータをお好みのエレガントで強力な機能に統合することができます。
Google Sheets からInformatica PowerCenter へのデータ連携には、ぜひCData ODBC ドライバをご利用ください
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。