Azure Data Lake Storage のデータをリアルタイムでPowerBI.com にパブリッシュ(発行)

CData Power BI Connectors をPowerBI.com に接続するオンプレミスゲートウェイでリアルタイムデータを組織内で使用可能に。

古川えりか
コンテンツスペシャリスト

最終更新日:2025-01-30

この記事で実現できるAzure Data Lake Storage 連携のシナリオ

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

CData Power BI Connector for ADLS は、Power BI のツールおよびウイザードにシームレスに統合します。PowerBI.com へのリアルタイムデータのパブリッシュも可能です。次のステップで、Power BI Gateway を使って、自動リフレッシュ設定で、データをPower BI サービスに公開します。

Azure Data Lake Storage をPower BI のデータソースに設定

CData Power BI Connector をインストールすると完了後にDSN 設定画面が開きます。ここでAzure Data Lake Storage への接続を設定します。

接続作業はWindows のODBC データソースアドミニストレータでも設定可能です。システムDSN のCData PBI Azure Data Lake Storage Sys を選択します。

Power BI のbit 数(32 bit or 64 bit)に合わせたアドミニストレータを使うように気を付けてください。DSN 設定画面で必要な項目を入力してAzure Data Lake Storage のデータに接続します。入力後に接続のテストを行い、OK を押して接続を確立します。

Azure Data Lake Storage 接続プロパティの取得・設定方法

Azure Data Lake Storage Gen 2 への接続

Gen 2 Data Lake Storage アカウントに接続するには、以下のプロパティを設定します。

  • Account:ストレージアカウントの名前。
  • FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前。
  • Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます。

Azure Data Lake Storage Gen 2 への認証

本製品は、次の4つの認証方法をサポートします:アクセスキーの使用、共有アクセス署名の使用、Azure Active Directory OAuth(AzureAD)、Managed Service Identity(AzureMSI)。

アクセスキー

アクセスキーを使用して接続するには、はじめにADLS Gen2 ストレージアカウントで利用可能なアクセスキーを取得する必要があります。

Azure ポータルで:

  1. ADLS Gen2 ストレージアカウントにアクセスします。
  2. 設定でアクセスキーを選択します。
  3. 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします。
  4. 接続の準備ができたら、次のプロパティを設定します。

    • AuthSchemeAccessKey
    • AccessKey:先にAzure ポータルで取得したアクセスキーの値。

共有アクセス署名(SAS)

共有アクセス署名を使用して接続するには、はじめにAzure Storage Explorer ツールを使用して署名を生成する必要があります。

接続の準備ができたら、次のプロパティを設定します。

  • AuthSchemeSAS
  • SharedAccessSignature:先に生成した共有アクセス署名の値。

AzureAD、AzureMSI での認証方法については、ヘルプドキュメントの「Azure Data Lake Storage Gen 2 への認証」セクションを参照してください。

Azure Data Lake Storage テーブルをPower BI からクエリ

次の手順でAzure Data Lake Storage からデータをPower BI からクエリできるようにします:

  1. Power BI Desktop を開き、[ホーム]->[データを取得]->[詳細…]->[その他]-> CData ADLS(カスタム)を選択して接続を押します。次にサードパーティドライバーのプロンプトが出る場合には、そのまま続行します。
  2. CData PBI Azure Data Lake Storage Sys を[Data Source Name]欄に入力します。データ接続モードを選択します:
    インポート データをプロジェクトにインポートする。オンデマンドで更新が可能。
    DirectQuery リモートデータに直接アクセスする場合。
  3. ナビゲーターダイアログで使用するテーブルを選択します。 The available tables. (Salesforce is shown.)
  4. [データの変換]では、データをカスタマイズすることができます。クエリエディタを開いて、フィルタ、ソート、集計を設定できます。

    • カラムのデータ型の変更
    • カラムの削除
    • カラムのグルーピング

    Power BI は、コネクタが取得・検出したAzure Data Lake Storage のカラム毎のデータ型をそのまま使えます。

    Power BI は、データ変換を取得して、指定した条件でクエリを発行し、Azure Data Lake Storage からデータを取得します。

    [読み込み]をクリックすると、そのままのデータがコネクタ経由でPower BI にロードされます。

データビジュアライゼーションを作成

データをPower BI から取得したら、レポートビューで取得したAzure Data Lake Storage フィールドをドラッグ&ドロップしてビジュアライゼーションを作成します。チャートの種類を可視化ペインから選択し、フィールドのカラムをドラッグして設定します。

A pie chart showing Account Names and Annual Revenue from Salesforce.

チャートの右上をクリックしてソートオプションを変更することもできます。

チャートの部分のハイライトも可能です。

A highlighted account in a pie chart. (Salesforce is shown.)

取得したデータのビジュアライズ上でのフィルタリングをフィルタリングペインで行うことができます。

Accounts and Annual Revenue filtered by Industry. (Salesforce is shown.)

[更新]をクリックするとその時点でのリアルタイムデータをAzure Data Lake Storage から取得してレポートに反映させることができます。

オンプレミスデータゲートウェイでのPowerBI.com へのデータリフレッシュの設定

次の手順でPower BI オンプレミスゲートウェイ を使って、ローカルに設定したDSN で取得するAzure Data Lake Storage のデータをPower BI のクラウド上から定期的にリフレッシュすることが可能です。

ゲートウェイモードの選択

まずはゲートウェイのモードを選択します。

  • ゲートウェイ (個人用モード): Power BI サービスにのみパブリッシュしてリフレッシュする場合はこちらを選択。ゲートウェイはWindows ユーザーアカウントで起動します。
  • ゲートウェイ (標準モード): ほかのAzure サービスでゲートウェイが必要な場合には、こちらを選択します。また、複数のユーザーがゲートウェイにアクセスする場合にも標準モードゲートウェイが必要です。
    標準モードゲートウェイでアクセスする場合にはシステムDSN で接続する必要があります。ユーザーDSN だと特定のアカウントしかアクセスできなく、システムDSN のようにシステム全体からアクセスすることができないためです。システムDSN のCData PBI ADLS Sys は、ODBC データソースアドミニストレータで設定します。

個人用モードゲートウェイの設定

個人用モードでのゲートウェイでのパブリッシュは、カスタムコネクタにアクセスできるゲートウェイをインストールする必要があります。

  1. インストーラーをこちらから ダウンロードして実行します。
  2. on-premises data gateway (personal mode) を起動します。
  3. ゲートウェイにサインインします。
  4. コネクタセクションで、カスタムデータコネクタオプションを有効化します。.pqx ファイルが置かれたパスを指定し、フォルダーからカスタムデータコネクタを読み込みます。
    Note: CData Power BI Connectors は、デフォルトフォルダ(Your User Home\Documents\Power BI Desktop\Custom Connectors)に.pqx ファイルをインストールします。

標準モードゲートウェイの設定

ゲートウェイ経由のパブリッシュには、コネクタへのアクセスが可能なゲートウェイのインストールとPowerBI.com からのAzure Data Lake Storage DSN への接続が必要です。

1. ゲートウェイのセットアップ

次の手順でマシン上にゲートウェイを設定します:

  1. Power BI Gateway インストーラーをダウンロード してインストールする必要です。
  2. on-premises data gateway を起動します。
  3. ゲートウェイにサインインします。
  4. ゲートウェイ名を設定し、回復キーを設定します。
  5. ゲートウェイがCData Power BI Connectors を見に行くフォルダを指定します。この記事では C:\Windows\ServiceProfiles\PBIEgwService\Documents\Power BI Desktop\Custom Connectors\ を使います。CData Power BI Connectors の.pqx ファイル(デフォルトフォルダはC:\Users\USERNAME\Documents\Power BI Desktop\Custom Connectors\) を指定したフォルダにコピーします。

    NOTE: ゲートウェイのサービスアカウント(NT SERVICE\PBIEgwService) がアクセスできるフォルダに指定される必要があります。必要な場合には、ゲートウェイのサービスアカウントをサービス設定で変更できます。

  6. コネクタセクションで、CDataADLS が表示されていることを確認します。 CData Power BI Connectors in the On-Premises Data Gateway.

2. PowerBI.com からAzure Data Lake Storage のデータに接続

  1. PowerBI.com にログインして、設定メニューから[接続とゲートウェイの管理]画面を開きます。
  2. [オンプレミスデータゲートウェイ]タブからゲートウェイクラスターを選択し、設定をクリックします。
  3. [ユーザーのクラウドデータソースが、このゲートウェイクラスターを介して更新することを許可します]オプションを有効にします。
  4. 設定を保存します。
  5. 続いて[接続]タブでゲートウェイにCData Power BI Connectors のデータソースを[新規]接続として追加します。
  6. [新しい接続]パネルでオンプレミスの[ゲートウェイクラスター名]を選択し、[接続名]を指定します。
  7. [接続の種類]にはCData Power BI Connector for ADLS をドロップダウンから選択します。
  8. [Data Source Name] には、システムDSN 名を入力します:CData PBI ADLS Sys。
  9. [認証方法]には、DSN 構成で認証済みの場合は[匿名]を選択します。
  10. 設定後[作成]ボタンをクリックし、接続が[作成済み]と表示されれば、設定完了です。
  11. 接続リストの[状態]欄にある更新アイコンをクリックし、[オンライン]状態を確認します。

PowerBI.com へのパブリッシュ

これでAzure Data Lake Storage のデータソースに連携してデータを更新できるレポートが発行できます。次の手順でセマンティックモデルを含むレポートをパブリッシュします。

  1. Power BI Desktop で、[発行]ボタンを押して、レポートを指定されたPower BI のワークスペースにパブリッシュします。
  2. PowerBI.com で、発行したワークスペースを選択します。
  3. 設定したAzure Data Lake Storage のセマンティックモデルのオプションメニューをクリックして、[設定]をクリックします。
  4. [ゲートウェイとクラウド接続]セクションで、[データゲートウェイ接続]をオンにします。状態がグリーンであることを確認し、適用を押して保存します。
  5. 個人用モードゲートウェイを利用する場合は、[データソースの資格情報]をクリックして、サインインします。[認証方法]には、DSN 構成で認証済みの場合は[匿名]を選択します。

データの更新(リフレッシュ)

これでPower BI サイドからレポートのデータをAzure Data Lake Storage の最新のデータに更新できるようになりました。

  • データの手動更新には、[ワークスペース]からレポートのセマンティックモデルを開き、[更新]->[今直ぐ更新]をクリックします。
  • スケジュール更新には、[ワークスペース]からレポートのセマンティックモデルを開き、[更新]->[更新のスケジュール設定]をクリックします。データの更新オプションを有効にして、更新頻度を設定します。
  • レポートビューでは、更新を押してレポートを最新のデータに同期できます。

The uploaded Power BI report. (Salesforce is shown.)

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。