LINQPad でAzure Data Lake Storage のデータを操作する方法

LINQPad でAzure Data Lake Storage にLINQ クエリを実行する方法を解説します。

加藤龍彦
デジタルマーケティング

最終更新日:2023-09-15

この記事で実現できるAzure Data Lake Storage 連携のシナリオ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

CData ADO.NET Provider for ADLS は、LINQ やEntity Framework などの標準のADO.NET インターフェースを使ってAzure Data Lake Storage の操作を実現します。この記事では、LINQPad から接続してLINQ クエリを実行する方法を説明します。

必要なもの

本記事の手順を実行してLINQPad からAzure Data Lake Storage に接続するには、以下の3つの製品が必要になります。

  • Azure Data Lake Storage の環境
  • LINQPad
  • CData ADO.NET Provider for ADLS。右側のサイドバーから30日間無償トライアルがダウンロードできます

データモデルの作成

CData ADO.NET Provider for ADLS およびLINQPad をダウンロード・インストールしたら、Visual Studio で新しいクラスライブラリプロジェクトを作成します。

ADO.NET Provider の利用に必要となるEF 6を設定する方法については、ヘルプドキュメントを参照してください。

  1. プロジェクトを右クリックし、[追加]→[新しい項目]→[ADO.NET Entity Data Model]をクリックします。ダイアログが表示されたら、データベースから[Code First]を選択します。 [New Connection]をクリックして、表示されたウィザードで接続文字列オプションを指定します。

    New Connectionを選択して新しい接続設定を作成
  2. Azure Data Lake Storage 接続プロパティの取得・設定方法

    Azure Data Lake Storage Gen 2 への接続

    Gen 2 Data Lake Storage アカウントに接続するには、以下のプロパティを設定します。

    • Account:ストレージアカウントの名前。
    • FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前。
    • Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます。

    Azure Data Lake Storage Gen 2 への認証

    本製品は、次の4つの認証方法をサポートします:アクセスキーの使用、共有アクセス署名の使用、Azure Active Directory OAuth(AzureAD)、Managed Service Identity(AzureMSI)。

    アクセスキー

    アクセスキーを使用して接続するには、はじめにADLS Gen2 ストレージアカウントで利用可能なアクセスキーを取得する必要があります。

    Azure ポータルで:

    1. ADLS Gen2 ストレージアカウントにアクセスします。
    2. 設定でアクセスキーを選択します。
    3. 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします。
    4. 接続の準備ができたら、次のプロパティを設定します。

      • AuthSchemeAccessKey
      • AccessKey:先にAzure ポータルで取得したアクセスキーの値。

    共有アクセス署名(SAS)

    共有アクセス署名を使用して接続するには、はじめにAzure Storage Explorer ツールを使用して署名を生成する必要があります。

    接続の準備ができたら、次のプロパティを設定します。

    • AuthSchemeSAS
    • SharedAccessSignature:先に生成した共有アクセス署名の値。

    AzureAD、AzureMSI での認証方法については、ヘルプドキュメントの「Azure Data Lake Storage Gen 2 への認証」セクションを参照してください。

    一般的な接続文字列は次のとおりです。

    Schema=ADLSGen2;Account=myAccount;FileSystem=myFileSystem;AccessKey=myAccessKey;
  3. 希望するテーブルおよびビューを選択して[Finish]をクリックし、データモデルを作成します。

    下部のFinishをクリックしてデータモデルを作成
  4. プロジェクトをビルドします。生成されたファイルを使ってLINQPad でAzure Data Lake Storage 接続を作成できます。

LINQPad でAzure Data Lake Storage のデータに接続

必要な接続プロパティを取得してデータモデルアセンブリを作成したら、以下の手順に従ってLINQPad でデータモデルを使いはじめましょう。

  1. LINQPad を開き[接続の追加]をクリックします。

    接続の追加をクリック
  2. [Use a typed data context from your own assembly]オプションを選択します。

  3. [Entity Framework DbContext]を選択します。

    下部のフィールドから[Entity Framework DbContext]を選択
  4. [Path to Custom Assembly]ボックスの横にある[参照]をクリックして、プロジェクトフォルダを参照します。bin フォルダの下の.dll または.exe を参照します。

  5. DbContext の名前を選択します。
  6. 接続文字列をApp.Config に保存した場合は、App.Config へのパスを指定します。
DbContextの名前とApp.Configへのパスを指定

これでLINQPad 経由でAzure Data Lake Storage にクエリできます。サポートされたLINQ クエリの例は、ヘルプドキュメントの「LINQ およびEntity Framework」を参照してください。

LINQPad からAzure Data Lake Storageに接続

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。