Pentaho Report Designer にKafka のデータに連携して分析

Pentaho BI ツールでKafka のレポートを作成。

加藤龍彦
デジタルマーケティング

最終更新日:2022-03-16

この記事で実現できるKafka 連携のシナリオ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。



CData JDBC Driver for ApacheKafka はダッシュボードや帳票ツールからリアルタイムKafka のデータへの連携を可能にします。この記事では、Kafka をJDBC データソースとして接続する方法と、Pentaho でKafka を元に帳票を作成する方法を説明します。

接続と帳票の作成

  1. インストールディレクトリの[lib]サブフォルダ内のJAR ファイルをコピーし、Pentaho のディレクトリ内の\Report-Designer\lib\jdbc\ フォルダに配置します。
  2. \Report-Designer\ フォルダのreport-designer.bat ファイルを起動し、Report-Designer UI を開きます。
  3. 以下の手順でドライバーを新しいデータソースに設定します。[Data]>[Add Data Source]>[Advanced]>[JDBC (Custom)]とクリックし、新しいKafka 接続を作成します。ダイアログが表示されたら、次のように接続プロパティを設定します。

    • Custom Connection URL property:JDBC URL を入力。初めに以下を入力し jdbc:apachekafka: 次にセミコロン区切りで接続プロパティを入力します。

      Apache Kafka 接続プロパティの取得・設定方法

      .NET ベースのエディションは、Confluent.Kafka およびlibrdkafka ライブラリに依存して機能します。 これらのアセンブリはインストーラーにバンドルされ、自動的に本製品と一緒にインストールされます。 別のインストール方法を利用する場合は、NuGet から依存関係のあるConfluent.Kafka 2.6.0 をインストールしてください。

      Apache Kafka サーバーのアドレスを指定するには、BootstrapServers パラメータを使用します。

      デフォルトでは、本製品はデータソースとPLAINTEXT で通信し、これはすべてのデータが暗号化なしで送信されることを意味します。 通信を暗号化するには:

      1. UseSSLtrue に設定し、本製品がSSL 暗号化を使用するように構成します。
      2. SSLServerCert およびSSLServerCertType を設定して、サーバー証明書をロードします。

      Apache Kafka への認証

      Apache Kafka データソースは、次の認証メソッドをサポートしています:

      • Anonymous
      • Plain
      • SCRAM ログインモジュール
      • SSL クライアント証明書
      • Kerberos

      Anonymous

      Apache Kafka の特定のオンプレミスデプロイメントでは、認証接続プロパティを設定することなくApache Kafka に接続できます。 こうした接続はanonymous(匿名)と呼ばれます。

      匿名認証を行うには、このプロパティを設定します。

      • AuthSchemeNone

      その他の認証方法については、ヘルプドキュメントを参照してください。

      以下は一般的なJDBC URL です:

      jdbc:apachekafka:User=admin;Password=pass;BootStrapServers=https://localhost:9091;Topic=MyTopic;
    • Custom Driver Class Name:cdata.jdbc.apachekafka.ApacheKafkaDriver と入力。
    • User Name:認証するユーザーネーム。
    • Password:認証するパスワード。
    Required connection properties defined in the JDBC URL. (Salesforce is shown.)

レポートに Kafka のデータを追加

これで、Kafka の帳票を作成する準備が整いました。

  1. 帳票にKafka のデータソースを追加します:[Data]>[Add Data Source]>[JDBC]をクリックし、データソースを選択します。

  2. クエリを設定します。この記事では次を使います:

    SELECT Id, Column1 FROM SampleTable_1 WHERE Column2 = '100' The query to retrieve data, specified in the JDBC data source configuration wizard. (Salesforce is shown.)
  3. 帳票にチャートをドラッグし、ダブルクリックしてチャートを編集します。帳票を実行して、チャートを表示します。このクエリ結果を使って、SampleTable_1 テーブルのシンプルなチャートを作成することができます。
  4. 帳票を実行して、チャートを見てみましょう。
A chart generated from up-to-date data. (Salesforce is shown.)

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。