Mule アプリケーションからAzure Data Lake Storage のデータにアクセス:CData JDBC Driver

CData JDBC ドライバとHTTP、SQL を組み合わせれば、Azure Data Lake Storage のデータのJSON エンドポイントに接続できるMule アプリケーションを簡単に作成できます。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-07-28

この記事で実現できるAzure Data Lake Storage 連携のシナリオ

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

CData JDBC Driver for ADLS はAzure Data Lake Storage のデータをMule アプリケーションと連携することで、読みといった機能をおなじみのSQL クエリを使って実現します。JDBC ドライバーを使えば、Azure Data Lake Storage のデータをバックアップ、変換、レポート作成、分析するMule アプリケーションをユーザーは簡単に作成できます。

本記事では、Mule プロジェクト内でCData JDBC Driver for ADLS を使用して、Azure Data Lake Storage のデータのWeb インターフェースを作成する方法を紹介します。作成したアプリケーションを使えば、HTTP 経由でAzure Data Lake Storage のデータをリクエストして、JSON 形式で結果を取得できます。まったく同様の手順で、すべてのCData JDBC ドライバで250 を超えるデータソースのWeb インターフェースを作成できます。手順は以下のとおりです。

  1. Anypoint Studio で新しいMule プロジェクトを作る。
  2. Message Flow にHTTP コネクタを追加する。
  3. HTTP コネクタのアドレスを設定する。 HTTP コネクタを追加・設定
  4. HTTP コネクタの追加後、Database Select コネクタを同じフローに追加する。
  5. データベースへの新しい接続を作成し(または既存の接続を編集し)、プロパティを設定する。
    • 接続を「Generic Connection」に設定
    • Required Libraries セクションでCData JDBC ドライバのJAR ファイルを指定する(例:cdata.jdbc.adls.jar)。 JAR ファイルを追加(Salesforce の場合)。
    • Azure Data Lake Storage の接続文字列にURL を指定

      Azure Data Lake Storage 接続プロパティの取得・設定方法

      Azure Data Lake Storage Gen 2 への接続

      Gen 2 Data Lake Storage アカウントに接続するには、以下のプロパティを設定します。

      • Account:ストレージアカウントの名前。
      • FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前。
      • Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます。

      Azure Data Lake Storage Gen 2 への認証

      本製品は、次の4つの認証方法をサポートします:アクセスキーの使用、共有アクセス署名の使用、Azure Active Directory OAuth(AzureAD)、Managed Service Identity(AzureMSI)。

      アクセスキー

      アクセスキーを使用して接続するには、はじめにADLS Gen2 ストレージアカウントで利用可能なアクセスキーを取得する必要があります。

      Azure ポータルで:

      1. ADLS Gen2 ストレージアカウントにアクセスします。
      2. 設定でアクセスキーを選択します。
      3. 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします。
      4. 接続の準備ができたら、次のプロパティを設定します。

        • AuthSchemeAccessKey
        • AccessKey:先にAzure ポータルで取得したアクセスキーの値。

      共有アクセス署名(SAS)

      共有アクセス署名を使用して接続するには、はじめにAzure Storage Explorer ツールを使用して署名を生成する必要があります。

      接続の準備ができたら、次のプロパティを設定します。

      • AuthSchemeSAS
      • SharedAccessSignature:先に生成した共有アクセス署名の値。

      AzureAD、AzureMSI での認証方法については、ヘルプドキュメントの「Azure Data Lake Storage Gen 2 への認証」セクションを参照してください。

      組み込みの接続文字列デザイナ

      JDBC 用のURL の作成にサポートが必要な場合は、Azure Data Lake Storage JDBC Driver に組み込まれた接続文字列デザイナを使用できます。JAR ファイルをダブルクリックするか、コマンドラインからJAR ファイルを実行してください。

      java -jar cdata.jdbc.adls.jar

      接続プロパティを入力して、接続文字列をクリップボードにコピーします。

    • Driver クラス名をcdata.jdbc.adls.ADLSDriver に指定します。 設定したデータベース接続(Salesforce の場合)。
    • 「接続テスト」をクリックします。
  6. SQL Query Text をAzure Data Lake Storage のデータをリクエストするためのSQL クエリに設定します。例えば、SELECT FullPath, Permission FROM Resources WHERE Type = 'FILE'Select オブジェクトを設定(Salesforce の場合)
  7. Transform Message コンポーネントをフローに追加します。
  8. Output スクリプトを次のように設定して、ペイロードをJSON に変換します。
    %dw 2.0
    output application/json
    ---
    payload
            
    Transform Message コンポーネントをフローに追加
  9. Azure Data Lake Storage のデータを閲覧するには、HTTP コネクタ用に設定したアドレスに移動します(デフォルトでは、localhost:8081):http://localhost:8081。Web ブラウザおよびJSON エンドポイントを使用可能な他のツール内で、Azure Data Lake Storage のデータをJSON として利用できます。

これで、カスタムアプリケーションおよび他のさまざまなBI、帳票、ETL ツールからAzure Data Lake Storage のデータを(JSON データとして)扱うための簡易なWeb インターフェースを作成できました。Mule アプリケーションからお好みのデータソースにアクセスできる、JDBC Driver for ADLS の30日の無償評価版のダウンロードはこちらから。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。