各製品の資料を入手。
詳細はこちら →PowerPivot でAzure Data Lake Storage のデータを連携して取得し分析
この記事では、PowerPivot からCData ODBC Driver を使う方法を説明します。「Table Import Wizard」を使ってAzure Data Lake Storage のデータをロードします。インポートに使うクエリをビジュアルに作成、あるいはドライバーがサポートするSQL を使って作成できます。
最終更新日:2022-02-13
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
ODBC プロトコルは多くのBI および帳票ツールで多様なデータベースのデータにアクセスするために使われています。CData ODBC Drive を使って、簡単にAzure Data Lake Storage をデータ連携できます。この記事では、CData Driver for ADLS を使ってPowerPivot にデータをインポートします。
CData ODBC ドライバとは?
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
- Azure Data Lake Storage をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
- 多様なアプリケーション、ツールにAzure Data Lake Storage のデータを連携
- ノーコードでの手軽な接続設定
- 標準 SQL での柔軟なデータ読み込み・書き込み
CData ODBC ドライバでは、1.データソースとしてAzure Data Lake Storage の接続を設定、2.PowerPivot 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
CData ODBC ドライバのインストールとAzure Data Lake Storage への接続設定
まずは、本記事右側のサイドバーからADLS ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
-
接続プロパティが未設定の場合には、DSN(データソース名)の設定を行います。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。
未指定の場合は、初めにODBC DSN (data source name) で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。
Azure Data Lake Storage 接続プロパティの取得・設定方法
Azure Data Lake Storage Gen 2 への接続
Gen 2 Data Lake Storage アカウントに接続するには、以下のプロパティを設定します。
- Account:ストレージアカウントの名前。
- FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前。
- Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます。
Azure Data Lake Storage Gen 2 への認証
本製品は、次の4つの認証方法をサポートします:アクセスキーの使用、共有アクセス署名の使用、Azure Active Directory OAuth(AzureAD)、Managed Service Identity(AzureMSI)。
アクセスキー
アクセスキーを使用して接続するには、はじめにADLS Gen2 ストレージアカウントで利用可能なアクセスキーを取得する必要があります。Azure ポータルで:
- ADLS Gen2 ストレージアカウントにアクセスします。
- 設定でアクセスキーを選択します。
- 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします。
- AuthScheme:AccessKey。
- AccessKey:先にAzure ポータルで取得したアクセスキーの値。
接続の準備ができたら、次のプロパティを設定します。
共有アクセス署名(SAS)
共有アクセス署名を使用して接続するには、はじめにAzure Storage Explorer ツールを使用して署名を生成する必要があります。
接続の準備ができたら、次のプロパティを設定します。
- AuthScheme:SAS。
- SharedAccessSignature:先に生成した共有アクセス署名の値。
AzureAD、AzureMSI での認証方法については、ヘルプドキュメントの「Azure Data Lake Storage Gen 2 への認証」セクションを参照してください。
Microsoft ODBC データソースアドミニストレーターで必要なプロパティを設定する方法は、ヘルプドキュメントの「はじめに」を参照してください。
- Excel で[PowerPivot]タブの[管理]アイコンをクリックしてPowerPivot を開きます。
[外部データソースの取り込み]から[その他のソース]ボタンをクリックします。
- OLEDB/ODBC ソースオプションを選択して、[次へ]をクリックします。
- [ビルド]をクリックして[データリンクプロパティ]ダイアログを開きます。このダイアログでは、DSN に基づいて自動的に接続文字列がビルドされます。
- [プロバイダー]タブで[Microsoft OLEDB Provider for ODBC Drivers]オプションを選択します。
- [接続]タブで[データソース名を使用する]オプションを選択して、メニューからAzure Data Lake Storage DSN を選択します。CData Azure Data Lake Storage Source DSN はインストール時に作成されます。
Azure Data Lake Storage のデータをインポート
下記の手順に従って、ウィザードを使ってAzure Data Lake Storage のテーブルからデータをロードします。Azure Data Lake Storage のカラムをウィザードを使って選択、フィルタ、およびソートすると、PowerPivot は実行されるクエリを生成します。
- [テーブルのインポートウィザード]でDSN を選択してから、[テーブルとビューの一覧から選択し、インポートするデータを選択する]オプションを選択すると、Azure Data Lake Storage で利用できるテーブルとビューのリストを見ることができます。
- [プレビューとフィルター]をクリックして特定のカラムを選択、データをソート、およびフィルタをカラム値に基づいて視覚的にビルドします。
カスタムクエリインポート
インポートするテーブルを選ぶ以外に、特定のカラムをインポートするクエリの指定やフィルタの定義もできます。ドライバーは元になるAzure Data Lake Storage API に相当する、シンプルで直観的なSQL ダイアレクトをサポートします。
- [テーブルのインポートウィザード]でDSN を選択してから、[インポートするデータを指定するクエリを記述する]オプションを選択してクエリを書きます。
[SQL ステートメント]ボックスにクエリを入れます。[検証]をクリックしてクエリステートメントが有効かどうかを確認します。[デザイン]をクリックして結果をプレビューし、インポートする前にクエリを直します。
WHERE 句を使ってフィルタライテリアクを指定できます。利用可能なSQL 機能の例については、ヘルプドキュメントの「サポートされるSQL」を参照してください。
- ウィザードを終了して選んだクエリでデータをインポートします。
Azure Data Lake Storage からPowerPivot へのデータ連携には、ぜひCData ODBC ドライバをご利用ください
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。