各製品の資料を入手。
詳細はこちら →Informatica PowerCenter でRedshift のデータを抽出、変換、ロードする
Informatica PowerCenter でRedshift のデータのシンプルなWorkflow を作成。
最終更新日:2022-04-03
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
Informatica は、データ転送用の強力で洗練された手段を提供します。CData ODBC Driver for Redshift を利用することで、Informatica の強力なデータ転送と操作機能でシームレスに統合された、業界が認めた標準ドライバーにアクセスできるようになります。このチュートリアルでは、Informatica PowerCenter でシンプルなWorkflow を作成してRedshift のデータを抽出し、フラットファイルにロードする方法について説明します。
CData ODBC ドライバとは?
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
- Redshift をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
- 多様なアプリケーション、ツールにRedshift のデータを連携
- ノーコードでの手軽な接続設定
- 標準 SQL での柔軟なデータ読み込み・書き込み
CData ODBC ドライバでは、1.データソースとしてRedshift の接続を設定、2.Informatica PowerCenter 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
CData ODBC ドライバのインストールとRedshift への接続設定
まずは、本記事右側のサイドバーからRedshift ODBC Driver の無償トライアルをPowerCenter サーバーとクライアントマシーンにドライバーをインストールします。30日間無償で、製品版の全機能が使用できます。
どちらにおいても、データソースのODBC DSN で接続プロパティを指定します。これはドライバーインストール時の最後の手順にあたります。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。
Redshift への接続には次を設定します:
- Server: 接続するデータベースをホストしているクラスタのホスト名およびIP アドレス。
- Port: クラスタのポート。
- Database: データベース名、ブランクの場合ユーザーのデフォルトデータベースになります。
- User: ユーザー名。
- Password: ユーザーのパスワード。
Server およびPort の値はAWS の管理コンソールで取得可能です:
- Amazon Redshift console (http://console.aws.amazon.com/redshift) を開く。
- Clusters ページで、クラスタ名をクリック。
- クラスタのConfiguration タブで、表示された接続文字列からクラスタのURL をコピーします。
PowerCenter でETL ワークフローを作成する
次のステップに従ってPowerCenter でワークフローを作成し、Redshift のデータをプルしてフラットファイルにプッシュします。
ODBC ドライバーを使用してソースを作成する
- %INFA_HOME%\clients\PowerCenterClient\client\bin にあるpowrmart.ini ファイルで、次の行をODBCDLL セクションに追加します。
CData=PMODBC.DLL
- PowerCenter Workflow Manager で新しいODBC リレーショナル接続を追加し、ユーザー名とパスワードのプロパティをODBC Driver がインストールされているマシンのユーザーに設定して、接続文字列をドライバーのSystem DSN(CData Redshift Sys)に設定します。
- PowerCenter Designer でリポジトリに接続し、フォルダを開きます。
- 「Source Analyzer」を選択してソースメニューをクリックし、「Import from Database」を選択します。
- ODBC データソースのドロップダウンメニューで、以前構成したDSN(CData Redshift Sys)を選択します。
- 「connect」をクリックし、含めるテーブルとビューを選択します。
- 「OK」をクリックします。
ソースを使用してフラットファイルターゲットを作成する
- 「Targets Analyzer」を選択し、以前に作成したソースをワークスペースにドラッグアンドドロップします。既存のソースを使用することで、カラムがターゲットにコピーされます。
- 新しいターゲットを右クリックし、「edit」をクリックしてデータベースタイプをフラットファイルに変更します。
Redshift のデータとフラットファイル間のマッピングを作成する
- 「Mapping Designer」をクリックします。
- ソースとターゲットをワークスペースにドラッグします。(プロンプトが表示されたら、新しいマッピングに名前を付けます。)
- ワークスペースで右クリックし、「Autolink by Name」を選択します。
- カラムをソース修飾子からターゲット定義にドラッグします。
- フォルダをセーブ(Ctrl + S)します。
マッピングを使用してワークフローを作成する
ソース、ターゲット、マッピングを作成して保存したら、ワークフローを作成することができるようになります。
- マッピングを右クリックして「generate workflow」を選択し、「Workflow Generation」ウィザードを開きます。
- 再利用不可のセッションでワークフローを作成します。
- (以前作成した関連する接続への)接続オブジェクトが適切に構成されていることを確認してプレフィックスを設定します。
- 必要に応じて接続を設定します。
- ワークフローを確認して「Finish」をクリックします。
ワークフローを作成したら、PowerCenter Workflow Manager を開いてワークフローにアクセスして開始し、Redshift のデータをフラットファイルに素早く転送できます。ODBC Driver for Redshift を使用して、ソースとターゲットをPowerCenter から設定することで、Informatica PowerCenter でRedshift のデータをお好みのエレガントで強力な機能に統合することができます。
Redshift からInformatica PowerCenter へのデータ連携には、ぜひCData ODBC ドライバをご利用ください
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。
- %INFA_HOME%\clients\PowerCenterClient\client\bin にあるpowrmart.ini ファイルで、次の行をODBCDLL セクションに追加します。