各製品の資料を入手。
詳細はこちら →Azure Data Lake Storage ODBC データソースとの間にInformatica マッピングを作成
Informatica にAzure Data Lake Storage へのODBC 接続を作成し、Azure Data Lake Storage のデータを参照および転送。
最終更新日:2022-06-09
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
Informatica はデータを転送、変換するための強力で洗練された手段です。CData ODBC Driver for ADLS は、Informatica の強力なデータ転送・変換機能とシームレスに連携可能な、業界で実証済みの標準ドライバです。このチュートリアルでは、Informatica PowerCenter でAzure Data Lake Storage のデータを転送および参照する方法を説明します。
CData ODBC ドライバとは?
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
- Azure Data Lake Storage をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
- 多様なアプリケーション、ツールにAzure Data Lake Storage のデータを連携
- ノーコードでの手軽な接続設定
- 標準 SQL での柔軟なデータ読み込み・書き込み
CData ODBC ドライバでは、1.データソースとしてAzure Data Lake Storage の接続を設定、2.Informatica 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
CData ODBC ドライバのインストールとAzure Data Lake Storage への接続設定
まずは、本記事右側のサイドバーからADLS ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
Azure Data Lake Storage への接続に関する情報と、Windows およびLinux 環境でのDSN の設定手順を以下で説明します。
Azure Data Lake Storage 接続プロパティの取得・設定方法
Azure Data Lake Storage Gen 2 への接続
Gen 2 Data Lake Storage アカウントに接続するには、以下のプロパティを設定します。
- Account:ストレージアカウントの名前。
- FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前。
- Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます。
Azure Data Lake Storage Gen 2 への認証
本製品は、次の4つの認証方法をサポートします:アクセスキーの使用、共有アクセス署名の使用、Azure Active Directory OAuth(AzureAD)、Managed Service Identity(AzureMSI)。
アクセスキー
アクセスキーを使用して接続するには、はじめにADLS Gen2 ストレージアカウントで利用可能なアクセスキーを取得する必要があります。Azure ポータルで:
- ADLS Gen2 ストレージアカウントにアクセスします。
- 設定でアクセスキーを選択します。
- 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします。
- AuthScheme:AccessKey。
- AccessKey:先にAzure ポータルで取得したアクセスキーの値。
接続の準備ができたら、次のプロパティを設定します。
共有アクセス署名(SAS)
共有アクセス署名を使用して接続するには、はじめにAzure Storage Explorer ツールを使用して署名を生成する必要があります。
接続の準備ができたら、次のプロパティを設定します。
- AuthScheme:SAS。
- SharedAccessSignature:先に生成した共有アクセス署名の値。
AzureAD、AzureMSI での認証方法については、ヘルプドキュメントの「Azure Data Lake Storage Gen 2 への認証」セクションを参照してください。
Windows
接続プロパティが未設定の場合は、まずODBC DSN(データソース名)で設定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。
Linux
CData ODBC Driver for ADLS をLinux 環境にインストールする場合、ドライバーのインストールによってDSN が事前に定義されます。DSN を変更するには、システムデータソースファイル(/etc/odbc.ini)を編集し、必要な接続プロパティを定義します。
/etc/odbc.ini
[CData ADLS Source]
Driver = CData ODBC Driver for ADLS
Description = My Description
Schema = ADLSGen2
Account = myAccount
FileSystem = myFileSystem
AccessKey = myAccessKey
これらの構成ファイルの使用方法については、オンラインのヘルプドキュメントを参照してください。
Resources データへのリンクテーブルを作成する
「オブジェクトエクスプローラー」からリンクテーブルを作成してライブResources データにアクセスする方法は、次のとおりです。
ODBC 接続を作成する
下記の手順に従って、Informatica PowerCenter のAzure Data Lake Storage に接続します。
- Informatica Developer ツールで、リポジトリに接続してプロジェクトを作成しておきます。
- 「Connection Explorer」ペインで右クリックし、「Create a Connection」をクリックします。
- 「New Database Connection」ウィザードが表示されたら、接続に名前とID を入力し、「Type」メニューで「ODBC」を選択します。
- 「Connection String」プロパティに
jdbc:adls:Schema=ADLSGen2;Account=myAccount;FileSystem=myFileSystem;AccessKey=myAccessKey;
を入力します。
注意:Linux オペレーティングシステムで作業している場合は、「Driver Manager for Linux」プロパティをunixODBC 2.3.x に設定します。
Azure Data Lake Storage のデータオブジェクトを作成する
Azure Data Lake Storage へのODBC 接続を作成したら、Informatica でAzure Data Lake Storage エンティティにアクセスできるようになります。下記の手順に従って、Resources エンティティをプロジェクトに追加します。
- 「Object Explorer」でプロジェクトを右クリックし、「New」->「Data Object」をクリックします。
- ウィザードが表示されたら「Relational Data Object」オプションを選択します。
- 「Connection」ボックス横にある「Browse」ボタンをクリックし、先に作成したODBC 接続を選択します。
- 既存のリソースからデータオブジェクトを作成するオプションを選択し、「Resource」ボックス横にある「Browse」ボタンをクリックします。
- ダイアログが表示されたら、「Show Default Schema Only」オプションの選択を解除してODBC 接続のノードを展開します。必要なエンティティを選択します。
これで、Data Viewer でテーブルをブラウズできます。テーブル用ノードを右クリックし「Open」をクリックします。「Data Viewer」ビューで「Run」をクリックします。

マッピングを作成する
下記の手順に従って、Azure Data Lake Storage ソースをマッピングに追加します。
- 「Object Explorer」でプロジェクトを右クリックし、「New」->「Mapping」をクリックします。
- Azure Data Lake Storage 接続のノードを展開してから、テーブル用のデータオブジェクトをエディタ上にドラッグします。
- ダイアログが表示されたら「Read」オプションを選択します。

以下のステップに従って、Azure Data Lake Storage カラムをフラットファイルにマッピングします。
- 「Object Explorer」でプロジェクトを右クリックし、「New」->「Data Object」をクリックします。
- 「Flat File Data Object」->「Create as Empty」->「Fixed Width」と選択します。
- Azure Data Lake Storage オブジェクトのプロパティで目的の行を選択して右クリックし、コピーします。コピーした行をフラットファイルプロパティにペーストします。
- フラットファイルのデータオブジェクトをマッピングにドラッグします。ダイアログが表示されたら「Write」オプションを選択します。
- クリックおよびドラッグしてカラムを接続します。
Azure Data Lake Storage のデータを転送するには、ワークスペース内で右クリックして「Run Mapping」をクリックします。

おわりに
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。